Microsoft Office XP中文简繁转换中非对称性繁简字的使用

来源 《汉字书同文研究》第5辑(2004年) 发布时间 2014-12-14

一 繁简汉字的对应关系

“Microsoft Office XP中文简繁转换”为大陆与港澳台之间的汉语信息交流带来了极大的方便,但在进行简体中文文本与繁体中文文本的转换时应注意非对称性的繁简汉字,否则在简繁转换时就会出错。所谓非对称性的繁简汉字指的是简繁转换中不具有一一对应关系的汉字,即那些一个简体对应多个繁体,或是一个繁体对应几个不同的简体,或是一个简体除对应简化前与其相同的形体字外,还对应一个或多个繁体的汉字。

傅永和在《简繁正异辨析字典》[1]P1-97中收入了107组具有一对多关系的繁简字,冯寿忠在《“非对称繁简字”对照表》[2]P222-241中列出了117组非对称的繁简字,傅、冯二人所收列的非对称繁简字有102组是相同的,综合傅、冯两家的非对称繁简字,并参考李行健的《现代汉语规范字典》[3],我们列出了116组非对称性的繁简字。

为了便于行文,根据简化后的某一形体对应简化前的某一个或某几个形体,我们把116组汉字分为五类:

1.简化后的一个形体对应简化前一个形体,我们将其形式化为A→B[①] 。具有这一类形式的只有1个:么→麽(“麽”还能作为一个独立的字使用,读mo2[②],意思是细小,主要出现在“麽虫、麽眇幺麽、幺麽小丑”等词语中)

2.简化后的一个形体对应简化前两个形体,并且其中一个与简化后形体相同,另一个则为繁体,这一类我们将其形式化为A→A

↘B

具有这一类形式的共有90个:

(1)板→板 (2)表→表 (3)别→别 (4)卜→卜 (5)才→才

↘闆 ↘錶 ↘彆 ↘蔔 ↘纔

(6)厂→厂 (7)冲→冲 (8)仇→仇 (9)丑→丑 (10)出→出

↘廠 ↘衝 ↘讎 ↘醜 ↘齣

(11)担→担 (12)党→党 (13)淀→淀 (14)冬→冬 (15)斗→斗

↘擔 ↘黨 ↘澱 ↘鼕 ↘鬥

(16)范→范 (17)丰→丰 (18)谷→谷 (19)刮→刮 (20)广→广

↘範 ↘豐 ↘穀 ↘颳 ↘廣

(21)柜→柜 (22)合→合 (23)后→后 (24)胡→胡 (25)划→划

↘櫃 ↘閤 ↘後 ↘鬍 ↘劃

(26)回→回 (27)伙→伙 (28)几→几 (29)家→家 (30)价→价

↘迴 ↘夥 ↘幾 ↘傢 ↘價

(31)荐→荐 (32)姜→姜 (33)借→借 (34)据→据 (35)卷→卷

↘薦 ↘薑 ↘藉 ↘據 ↘捲

(36)克→克 (37)夸→夸 (38)困→困 (39)腊→腊 (40)蜡→蜡

↘剋 ↘誇 ↘睏 ↘臘 ↘蠟

(41)累→累 (42)漓→漓 (43)里→里 (44)帘→帘 (45)了→了

↘纍 ↘灕 ↘裏 ↘簾 ↘瞭

(46)霉→霉 (47)面→面 (48)蔑→蔑 (49)辟→辟 (50)苹→苹

↘黴 ↘麵 ↘衊 ↘闢 ↘蘋

(51)凭→凭 (52)扑→扑 (53)仆→仆 (54)朴→朴 (55)千→千

↘憑 ↘撲 ↘僕 ↘樸 ↘韆

(56)秋→秋 (57)曲→曲 (58)确→确 (59)舍→舍 (60)沈→沈

↘鞦 ↘麯 ↘確 ↘捨 ↘瀋

(61)胜→胜 (62)适→适 (63)术→术 (64)松→松 (65)涂→涂

↘勝 ↘適 ↘術 ↘鬆 ↘塗

(66)万→万 (67)洼→洼 (68)咸→咸 (69)向→向 (70)旋→旋

↘萬 ↘窪 ↘鹹 ↘嚮 ↘鏇

(71)叶→叶 (72)佣→佣 (73)余→余 (74)郁→郁 (75)御→御

↘葉 ↘傭 ↘餘 ↘鬱 ↘禦

(76)吁→吁 (77)愿→愿 (78)云→云 (79)芸→芸 (80)沄→沄

↘籲 ↘願 ↘雲 ↘蕓 ↘澐

(81)折→折 (82)征→征 (83)症→症 (84)只→只 (85)致→致

↘摺 ↘徵 ↘癥 ↘隻 ↘緻

(86)制→制 (87)种→种 (88)朱→朱 (89)筑→筑 (90)准→准

↘製 ↘種 ↘硃 ↘築 ↘凖

3.简化后的一个形体对应简化前两个形体,且这两个形体是与简化后的形体都不相同的繁体,这一类我们将其形式化为A→B

↘C

具有这一类形式的共有20个:

(1)摆→擺 (2)当→當 (3)恶→惡 (4)发→發 (5)汇→彙

↘襬 ↘噹 ↘噁 ↘髪 ↘匯

(6)获→獲 (7)饥→饑 (8)尽→盡 (9)历→曆 (10)卤→鹵

↘穫 ↘飢 ↘儘 ↘歷 ↘滷

(11)弥→彌 (12)签→簽 (13)纤→纖 (14)苏→蘇 (15)坛→壇

↘瀰 ↘籤 ↘縴 ↘囌 ↘罎

(16)团→團 (17)须→須 (18)药→藥 (19)脏→髒 (20)钟→鍾

↘糰 ↘鬚 ↘葯 ↘臓 ↘鐘

4.简化后的一个形体对应简化前三个形体,并且其中一个与简化后形体相同,另两个形体是与简化后的形体都不相同的繁体,这一类我们将其形式化为

↗A

A →B

↘C

具有这一类形式的共有3个:

↗复 ↗干 ↗系

(1)复→複 (2)干→幹 (3)系→係

↘復 ↘乾 ↘繫

5.简化后的一个形体对应简化前四个形体,并且其中一个与简化后的形体相同,另三个形体是与简化后的形体都不相同的繁体,这一类我们将其形式化为 ↗A

A →B

→C

↘D

具有这一类形式的共有2个:

↗蒙 ↗台

(1)蒙→矇 (2)台→颱

→濛 →檯

↘懞 ↘臺

二 简转繁的情况分析

1.(A→B)

对这类一简对一繁的字转换较为简单,在Microsoft Office XP中通过简繁转换按纽,可直接将简体转换成繁体:么→麽。

2.A→A

↘B

在这一类中,每一个简体字都对应简化前两个形体,其中一个与简化后形体相同,另一个形体为与简体不同的繁体;简化前后形体相同的字在简体中文文本转化成繁体中文文本时,是不必转换的;A→B中的繁体在简体中文文本转化成繁体中文文本时,是必须转换的,其中一部分繁体是可以通过“Microsoft Office XP中文简繁转换”中的“繁”按钮转换成的,而另一部分繁体则不能通过“繁”按钮转换成,分别如下:

(1)板、表、别、才、冲、仇、出、冬、刮、胡、回、家、借、卷、克、困、累、漓、了、面、蔑、辟、仆、千、秋、曲、舍、沈、松、向、旋、芸、沄、折、征、症、只、致、制、朱、准,这些字所对应的繁体在Microsoft Office XP中用“繁”按纽只能变成A类的形体的字,但不会转换成B类的繁体。

(2)卜、厂、丑、党、淀、斗、范、丰、谷、广、柜、后、划、伙、几、价、荐、姜、据、夸、腊、蜡、里、帘、霉、苹、凭、扑、朴、确、胜、适、术、涂、万、洼、咸、叶、佣、余、郁、御、吁、愿、云、种、筑,这些字在Microsoft Office XP中用“繁”按纽可以转换成所对应的B类繁体。

3.A→B

↘C

在这一类中,每一个简体字都对应两个繁体,其中一个繁体是可以通过Microsoft Office XP中的“繁”按钮转换成的,而另一个繁体则不能通过“繁”按钮转换成,分别如下:

(1)擺、當、惡、發、彙、獲、饑、盡、曆、鹵、彌、簽、纖、蘇、壇、團、須、藥、髒、鍾,这些繁体可以通过“繁”按钮从其对应的简体转换而成的。

(2)襬、噹、噁、髪、匯、穫、飢、儘、歷、滷、瀰、籤、縴、囌、罎、糰、鬚、葯、臓、鐘,这些繁体在Microsoft Office XP中是不能通过“繁”按钮从其对应的简体转换而成的。

4. ↗A

A→B

↘C

在这一类中,每一简体都对应简化前的三个形体,其中一个与简化后形体相同,简化前后形体相同的字在简体中文文本转化成繁体中文文本时,是不必转换的。而A→B和A→C中的繁体,在简体中文文本转化成繁体中文文本时,是必须转换的。在由简转繁时,这一类中,“复”和“干”各自所对应的两个繁体,都只有一个可以通过“繁”按钮转换而成。而这一类中的“系”所对应的两个繁体都不能通过“繁”按钮转换成。

↗A

5. A→B

→C

↘D

在这一类中,对于简化前的形体与简化后的形体相同的字在简体中文文本转化成繁体中文文本时,是不必转换的。而对于A→B、A→C、A→D类中的繁体字在简体中文文本转化成繁体中文文本时,是必须转换的。在由简转繁中,这一类中的“蒙”、“台”各自所对应的三个繁体都不能通过“繁”按纽转换成。

三 繁转简的情况分析

1.A→B式

这一类属于简单的一一对应,通过Microsoft Office XP 中的“简”按纽可以将繁体转化成简体。但应注意以下特殊情况:*[③] 麽→么(当“麽”独立使用,意思是细小。)

2.A→A

↘B

这一类由繁转简也相对简单,绝大数的繁体字通过“简”按纽可以转化成简体;但须注意几个特殊情况,一是少数繁体单用时不简化或是某一繁体对应两个不同的简体,二是少数繁体在使用“简”转化按纽时并不会变成所对应的简体,下面分别说明:

少数繁体单用时不简化或是某一繁体对应两个不同的简体的情况:

(1)*夥→伙(当夥有众多的意思)

(2)*藉→借(当藉单独使用时)

(3)*瞭→了(当“瞭”表示瞭望时)

(4)*蘋→苹(当“蘋”独立使用时,意思是蕨类植物名时)

(5)*憑→凭(当“憑” 独立使用,意思是满、愤懑)

(6)*僕→仆(当“僕”作姓氏时)

(7)*餘→余(当“餘”表示“餘年无多”时,简化为馀,而不能简化成“余”)

(8)*徵→征(当“徵”表示古代音阶名)

少数繁体字在使用“简”转化按纽时并不会变成所对应的简体的情况:

(1)*纔→才

(2)*讎→仇(使用“简”按纽时会出现“讎→雠”)

(3)*藉→借

(4)*瞭→了

(5)*瀋→沈(使用“简”按纽时会出现“瀋→渖”。)

(6)*凖→准

这六个繁体字全部都是其对应的简体在Microsoft Office XP中用“繁”按纽不会转换成B类繁体的字

3.A→B

↘C

在这种一简对二繁的情况下,通过“简”按纽,每组的B、C类的繁体绝大多能变成相对应的简体,但“摆”、“发”、“脏”这三个字要注意,这三个字都只有其中一个繁体能变成对应的简体,且这些能变成简体的繁体全部都能通过“繁”按纽从其对应的简体变成。

(1)擺→摆(“摆”通过“繁”按纽可以转换成繁体“擺”)

*襬→摆(在Microsoft Office XP中用“繁”按纽不会转换成繁体)

(2)發→发(“发”通过“繁”按纽可以转换成繁体“發”)

*髪→发(在Microsoft Office XP中用“繁”按纽不会转换成繁体)

(3)髒→脏(“脏”通过“繁”按纽可以转换成繁体“髒”)

*臓→脏(在Microsoft Office XP中用“繁”按纽不会转换成繁体)

↗A

4. A →B

↘C

在这种形式中,每组的B、C类繁体,在简化转换中都能变成对应的简体,但有一个字“乾”要注意,当其表示“乾坤”、“乾隆”时不能简化成“干”。

↗A

5.A→B

→C

↘D

在此种形式下,每一个简体对应的多个繁体通过“简”按纽都能变成对应的简体。

四 应对策略

由上可知这116组非对称性的繁简字在Microsoft Office XP中文繁简互换中,情况非常复杂,为了避免在“Microsoft Office XP中文简繁转换”中的错误,可以从以下方面来考虑:

一是从汉字本身出发,通过对非对称繁简字进行调整,从根本上消除简繁转换的障碍[4]P65-77。此种方法虽说从源头上根本解决了中文简繁转换的混乱,但要真正推行这种调整方案,恐怕有一定的困难,因为正如提倡此观点的作者所说“要推行这种调整方案的话,需要让大陆同胞重新接受33组新的繁简关系和29个新简化字,恢复使用久违了的38个繁体字和4个异体字;需要让港澳台同胞接受48个简化字和4个写法简易的异体字,放弃使用55个写法较繁的异体字。”[4]P77

二是进行简体中文文本与繁体中文文本的转换后,利用Microsoft Word 中的“查找和替换”将这107个非对称性的繁简字逐个检查,看是否转换成了合适形体的字,如果没有就将其改成合适形体的字。这种方法的可操作性强,但比较笨。

三是对“Microsoft Office XP中文简繁转换”的功能进行改进,使其在简繁转换中碰到这107个非对称繁简字时,判断该非对称繁简字是否能与其前或后的字组成词,由组成的该词来决定该转换成某个形体。如“干”在由简转繁时,如果其前有“树”,或其后有“活/涉/戈/支/脆/娘/燥”,而“干”与上述字可分别组成词:树干、干活、干涉、干戈、干支、干脆、干娘、干燥,其中的某个词就决定了该“干”字在转换成繁体时的形体:(树)幹、幹(活)、干(涉)、干(戈)、干(支)、乾(脆)、乾(娘)、乾(燥)。这种方法比较先进,但它依赖自动分词技术的发展,而现有的自动分词正确率有待进一步提高。

我们期待着语言文字方面的专家和计算机软件设计方面的专家通力合作,既从文字方面又从软件设计方面把“Microsoft Office XP中文简繁转换”中的障碍清除,使大陆与港澳台之间,甚至与全球其他地区的华人社区之间的汉语信息交流畅通无阻。

[①] 箭头左边汉字为简化后的形体,简头右边为简化前的形体,以下同。

[②] “mo2”中的数字2表示其音为第二声。以下拼音后的数字类同。

[③] “*”表示这一组不可转换。以下同。

参考文献:

[1] 傅永和.繁简正异辨析字典[M].沈阳:辽宁教育出版社,1995.1-97.

[2] 冯寿忠.“非对称繁简字”对照表[A].沈克成.汉字“书同文”研究(第一辑)[C]. 北京:气象出版社,2001.222-241.

[3] 李行健.现代汉语规范字典[M].北京:语文出版社,1998.

[4] 冯寿忠.简繁转换的障碍应当消除——谈对非对称繁简字的调整[A].沈克成.汉字“书同文”研究(第一辑)[C]. 北京:气象出版社,2001.65-78.

(浙江财经学院人文艺术学院 孙德平)

QQXIUZI.CN 千千秀字