由简化造成的形似字统计分析

作者 李禄兴 来源 《汉字书同文研究》第9辑(2011年) 发布时间 2014-12-20

提要:一般认为,汉字简化使得汉字字形发生了重要改变,而改变之一就是字形不如原来美观了,汉字的形似字增加了。那么到底汉字简化增加了多少形近字?给没给汉字系统带来实质性变化?本文试图通过统计分析的方法来解决这一问题。文章讨论了形似字的标準,然後根据简化前後的字形对3500个常用字逐一进行了对比,得出结论,简化前也就是繁体字中形似字占常用字的26%,简化後的形似字占常用字的34%,也就是说简化後形似字在常用字中增加了大约8%的比例。

关键字:形似字 简化字 繁体字 统计

0 引 言

本文所说的常用汉字是指1988年由国家语委和国家教委联合公布的《现代汉语常用字表》中所收录的2500个常用字和1000个次常用字。本文对常用汉字中由简化造成的形似字的数量做一些分析,希望能对今後的汉字简化或者整理工作提供参考。

1 形似字的标準及分类

形似字,也叫形近字、近形字,是指字形相似且意义不同的字。形似字总是成组出现,如“冶-治”、“人-入-八”、“田-由-甲-申”等。《康熙字典》在《辨似》栏裏说:“笔画相似,音义显别,毫厘之间,最易混淆。”并且分列二字相似、三字相似、四字相似和五字相似,在每字之下,还分别注明音义和笔画结构。可见古人早已深知形似字容易混淆、不易辨认。但是直到现在,关于形似字“字形相似”的标準仍然说法不一。《康熙字典•辨似》中收录形似字以“笔画相似”为标準,显然含糊而不準确。今人研究形似字时,有的以“轮廓相似、大同小异”为判定标準;有的以同形旁或同声旁、音同或音近为判定标準,同样宽泛而不準确,如按後者,“幅-福-蝠-辐”就都算形近字,这样收字显然标準过宽。

那么,“字形相似”的标準究竟是什么呢?笔者认为应考虑以下四种因素,即笔形、笔画数、结构和部件。笔形和笔画数是对独体字而言,结构和部件是对合体字而言。

1.1独体字形似判定标準:

(1)笔画数相同,笔形一致,只是笔画的组合关係不同,即笔画相结、相离、相交的位置和方式不同。如“元-无、石-右、开-井”。

(2)笔画数相同,笔形基本一致,只有笔形存在差异。如“开-升、贝-见、用-甩”。 关係标準

(3)笔形基本重合,但笔画数略有不同。如“丙-两、厂-广、大-太、丹-舟 ”。

1.2合体字形似判定标準:

结构基本相同;存在相同部件且位置相同;存在相似部件,但数目不能超过两个(指基础部件);相似部件形差度不能太大。如 “败-贩、毕-华、颁-颂”。但以下幾组就不能算作形似字。

吴-吞 古-叶 部-陪 宴-晏 旮-旯 呆-杏 碎-粹

陶-淘 邻-怜 从-以 添-漆 厄-危 祭-癸 福-蝠

根据以上标準可以比较準确地判定形似字,但是仍然存在一些例外情况。如“白-臼”并不符合上述独体形似字判定标準;“北-兆、冰-泳、朵-杂、即-郎、拣-栋、旧-归、冒-胃”不存在相同部件,只是构形部件分别相似且形差度极小;“乖-乘、买-卖、免-兔、直-真-具”则不存在相似部件,但它们在字形上的确极为“形似”。此外还有个别独体字与合体字十分形似的情况,如“井-并、出-击、我-找”。这些汉字虽然不符合上述形似字判定标準,但从它们的形似度考虑,笔者认为,应该将它们算作形似字。

综合以上情况,我们可以把形似字分为三类:独体形似字、合体形似字、独体与合体形似字。其中合体形似字根据部件相同、相似的不同情况又可以分为三级:

(1)一级形似字(存在相同部件、有一个相似部件)。如“哀-衷-衰、茬-荐”。

(2)二级形似字(存在相同部件、有两个相似部件)。如“抑-柳、毕-华”。

(3)三级形似字(不存在相同部件、只有相似部件)。如“拣-栋、旧-归”。

至于“乖-乘、买-卖”这类特殊的形似字,我们可以把多出的部件看成是和某个“零部件”相似而归入一级形似字。

2 常用汉字中的形似字

根据以上判定形似字的标準,笔者从3500个常用汉字中,择取出了837个形似字,约占常用汉字总数的23.91%。统计情况如下

2.1独体形似字126个

(1)元–无 石–右 午–牛 七–匕 失–矢 天–夫

目–且 力–刀 人–入–八 田–由–甲–申 开–井

(2)开–升 凸–凹 风–凤 贝–见 干–千 于–干

勺–匀 未–末 儿–几 土–士 天–夭 犬–尤 寸–才

刁–刀 东–乐 用–甩 五–丑 叉–义

(3)半–羊 丙–两 厂–广 大–太 丹–舟 刃–刀

斗–头 几–凡 小–少 冈–网 个–介 巾–币 今–令

斤–斥 皿–血 木–本 内–肉 乃–及 去–丢 全–金

上–止 尸–户 水–永 术–米 乌–鸟 夕–歹 予–矛

爪–瓜 尤–龙 丈–文 之–乏 心–必 又–叉 白–臼

丘–乒–乓–兵 大–犬

2.2合体形似字

(1)一级形似字 653个。

般–船 奥–粤 芭–笆 拔–拨 败–贩 扳–板 班–斑

般–股 颁–颂 邦–那 报–投 杯–怀 比–此 闭–闲

庇–屁 边–迈 辨–辩–辫 扁–扇 博–搏 薄–簿

参–叁 侧–测 茬–荐 差–羞 常–赏 贬–眨 抄–秒

扯–址 撤–撒 尘–尖 忱–沈 沉–沈 噔–瞪 骋–聘

持–特 宠–庞 抽–押 处–外 催–摧 村–材 达–这

担–坦 诞–涎 导–异 掉–绰 档–挡 淀–绽 绽–锭

措–错 赌–睹 钓–钧–钩 盯–叮 叼–叨 锤–捶

吨–盹 顶–顷–项 缎–锻 奋–奄 肤–肢 伏–优

芙–英 俘–浮 赴–赵 斧–爷 服–股 溉–慨 慨–概

纲–钢 勾–句 肛–肚–肝 各–谷–吝 攻–玫 玫–玖

估–佑 沽–沾 故–敌 挂–桂 古–占–舌 光–先

哈–啥 含–舍 夯–夺 孤–狐 壶–壹 虎–虏 话–活

坏–坯–环 幻–幼 涣–焕 慌–谎 诲–悔 计–汁

记–纪 技–枝 健–键 渐–惭 缰–僵 奖–桨–浆

娇–骄 届–屈 津–律 仅–仪 竞–竟 拒–柜 俱–惧

捐–损 卷–券 倔–掘 刊–刑 看–着 扛–杠 抗–杭

烤–拷 挠–饶 绕–饶 科–料 客–容 垦–恳 抠–枢

苦–若 挎–垮 矿–旷 傀–槐–愧 梨–犁 李–季

历–厉 凉–谅 梁–粱 猎–猪 搂–楼 录–隶 旅–族

虑–虚 仑–仓 拉–垃 癞–癫 拦–栏 婪–梦 蓝–篮

揽–榄 廊–廓 老–考 肋–助 泪–沮 类–粪 沦–沧

抡–抢–枪–伦 沦–论 萝–箩 骂–驾 埋–理 枚–牧

美–姜 眯–咪 密–蜜 峰–蜂 苗–笛 描–猫–锚

明–朋 鸣–呜 摸–模 幕–募–慕–墓–暮 呢–昵

拧–柠 偶–隅 拍–柏 排–徘 叛–贩 畔–衅 篷–蓬

捧–棒 披–坡 朴–扑 柒–染 器–嚣 洽–恰 嫌–赚

悄–梢 晴–睛 擎–警 请–清–情 庆–庄 厌–压

囚–四 躯–驱 市–布 区–匹 却–劫 仍–扔 闰–闺

寨–赛 沙–纱 瑞–端 洒–酒 杉–衫 擅–檀 莹–萤

权–杈 壤–攘 稍–捎–梢–悄 舌–吞 社–杜 审–宙

肾–贤 渗–掺–惨 设–没 施–旋 湿–温 使–便

哀–衷–衰 室–窒 受–爱 授–援 述–迷 嗽–嫩

耍–要 帅–师 拴–栓 暑–署 思–恩 送–逆 俗–浴

粟–栗 素–索 它–宅 贪–贫 奏–秦–泰 总–怠

帖–贴 恬–括 挑–桃 秃–秀 徒–徙–陡 团–因–困

捅–桶 防–妨 谈–淡 搪–塘 膛–瞠 提–堤 推–椎

驮–驳 驼–鸵 唾–睡 微–徽 味–昧 纹–绞 捂–梧

昔–者 狭–侠 衔–街 陷–馅 响–晌 萧–箫 销–锁

邢–邪 杏–否 休–体 渲–演 旬–甸 讯–汛 延–廷

沿–沼 杨–扬 冶–治 页–负 遗–遣 亿–忆 迂–迁

忧–扰–拢 宇–字 益–盖 阴–阳 茵–菌 誉–誊

远–运 允–兄 仗–杖 瞻–赡 贼–赋 折–拆 质–盾

仲–伸 逐–遂 拄–柱 住–往 壮–状 准–淮 浊–烛

姊–妹 谆–淳 栽–裁–栽–载 怨–怒–恕 赃–脏

早–旱 隐–稳 谒–竭 详–祥 碑–啤 冒–昌 璧–壁

重–童 亦–赤 页–负 官–宫 友–反 问–向 间–闻

乖–乘 晋–普 买–卖 免–兔 直–真–具

(2)二级形似字38个

毕–华 城–域 崔–崖 冠–寇 或–咸 惑–感 冀–翼

鉴–签 坎–坑 欧–殴 窃–窍 善–喜 肆–肄 祟–崇

添–漆 抑–柳 园–圆 拘–构 监–盐

(3)三级形似字14个

北–兆 冰–泳 朵–杂 即–郎 拣–栋 旧–归 冒–胃

2.3独体合体形似字8个

井–并 出–击 我–找 久–欠

统计情况如下表:

分类

数目

总计

所占比例

独体

126

126

15.05%

合体

一级

651

705

92.34%

84.23%

二级

38

5.39%

三级

14

1.67%

独体合体

8

8

0.96%

形似字总数

占常用字比例

837

23.91%

3 汉字简化造成的形似字

我们将这837个常用字中的形似字,根据汉字简化前後发生的变化,分为三大类:

3.1.没有被简化的形似字408个。这些字多是从隶变以後,直到今天都是形似字,有的字甚至在甲骨文时代就是形似字。这些字约占常用字中形似字的49%。

石–右 午–牛 七–匕 失–矢 天–夫 目–且 大–犬

力–刀 人–入-八 田–由–甲–申 凸–凹 勺–勻

土–士 天–夭 犬–尤 寸–才 用–甩 未–末 半–羊

丙–兩 大–太 丹–舟 刃–刀–刁 小–少 今–令

斤–斥 白–臼 水–永 夕–歹 予–矛 爪–瓜 丈–文

之–乏 心–必 又–叉 丘–乒–乓–兵 皿–血 木–本

內–肉 乃–及 去–丟 全–金 上–止 芭–笆 扳–板

班–斑 比–此 庇–屁 博–搏 薄–簿 側–測 扯–址

忱–沈 沉–沈 噔–瞪 持–特 抽–押 村–材 盯–叮

叼–叨 芙–英 俘–浮 服–股 勾–句 肛–肚–肝

攻–玫 玫–玖 估–佑 沽–沾 古–占–舌 光–先

幻–幼 技–枝 津–律 倔–掘 刊–刑 扛–杠 抗–杭

烤–拷 旅–族 客–容 苦–若 挎–垮 李–季 科–料

拉–垃 肋–助 老–考 枚–牧 埋–理 苗–笛 明–朋

摸–模 呢–昵 暮–幕–募–慕–墓 眯–咪 密–蜜

峰–蜂 市–布 晴–睛 拍–柏 捧–棒 柒–染 洽–恰

囚–四 捎–梢–悄 舌–吞 瑞–端 杉–衫 稍–仍–扔

它–宅 恬–括 挑–桃 禿–秀 帖–貼 奏–秦–泰

徒–徙–陡 搪–塘 膛–瞠 提–堤 推–椎 唾–睡

味–昧 捂–梧 邢–邪 旬–甸 冶–治 杏–否 宇–字

允–兄 折–拆 仲–伸 免–兔 准–淮 姊–妹 早–旱

怨–怒–恕 栽–裁–栽–載 碑–啤 冒–昌 璧–壁

重–童 亦–赤 友–反 乖–乘 拄–柱 住–往 添–漆

抑–柳 北–兆 冰–泳 即–郎 冒–胃 城–域 崔–崖

冠–寇 坎–坑 惑–感 祟–崇 善–喜 肆–肄 我–找

久–欠 抄–秒 差–羞 哈–啥 含–舍 梨–犁 施–旋

篷–蓬 排–徘 婪–夢 捐–損 卷–券 防–妨 俗–浴

粟–栗 素–索 捅–桶 嗽–嫩 耍–要 官–宮 冀–翼

思–恩 仗–杖 拴–栓 渲–演 撤–撒 孤–狐 披–坡

傀–槐–愧 梁–粱 使–便 茵–菌 哀–衷–衰 廊–廓

擅–檀 催–摧

3.2简化前後都是形似字142个。这些字作繁体字前就是形似字,简化成简体字後仍是形似字。它们约占16.8%。

貝–見 烏–鳥 般–船 奧–粵 敗–販 般–股 頒–頌

邦–那 閉–閑 辨–辯–辮 扁–扇 貶–眨 寵–龐

檔–擋 綻–錠 賭–睹 釣–鈞–鉤 頂–頃–項 緞–鍛

綱–鋼 慨–概 溉–慨 渙–煥 漸–慚 獎–槳–漿

墾–懇 摳–樞 礦–曠 摟–樓 癩–癲 攔–欄 藍–籃

偶–隅 攬–欖 蘿–籮 鳴–嗚 擰–檸 閏–閨 瑩–螢

腎–賢 滲–摻–慘 沿–沼 延–廷 銷–鎖 蕭–簫

楊–揚 頁–負 遺–遣 億–憶 賊–賦 隱–穩 買–賣

間–聞 微–徽 紋–絞 暑–署 送–逆 馱–駁 濁–燭

壯–狀 逐–遂 帥–師 揀–棟 悄–梢 狹–俠 畢–華

社–杜 參–三 歐–毆

3.3汉字简化造成的形似字287个。这类字在简化之前,字形区别度较大,一般不易混淆。简化後,区别度降低,成为形似字。这类字占了常用字中形似字的34.3%左右。

拔–撥 報–投 杯–懷 邊–邁 茬–薦 常–賞 兒–幾

塵–尖 騁–聘 處–外 達–這 擔–坦 誕–涎 導–異

掉–綽 澱–綻 措–錯 錘–捶 噸–盹 奮–奄 膚–肢

伏–優 赴–趙 斧–爺 各–穀–吝 故–敵 掛–桂

夯–奪 壺–壹 虎–虜 話–活 壞–坯–環 慌–謊

誨–悔 計–汁 記–紀 健–鍵 韁–僵 嬌–驕 屆–屈

僅–儀 競–竟 拒–櫃 俱–懼 看–著 撓–饒 繞–饒

曆–厲 涼–諒 獵–豬 錄–隸 慮–虛 侖–倉 淚–沮

類–糞 淪–滄 掄–搶 槍–倫 淪–論 罵–駕 美–薑

描–貓–錨 叛–販 畔–釁 樸–撲 器–囂 嫌–賺

擎–警 請–清–情 慶–莊 厭–壓 軀–驅 區–匹

卻–劫 寨–賽 沙–紗 灑–酒 權–杈 壤–攘 審–宙

設–沒 濕–溫 室–窒 受–愛 授–援 述–迷 貪–貧

總–怠 團–因–困 談–淡 駝–鴕 昔–者 銜–街

陷–餡 響–晌 休–體 訊–汛 憂–擾–攏 迂–遷

益–蓋 陰–陽 譽–謄 遠–運 瞻–贍 質–盾 諄–淳

贓–髒 謁–竭 詳–祥 晉–普 直–真–具 問–向

井–並 出–擊 或–鹹 鑒–簽 竊–竅 園–圓 拘–構

監–鹽 朵–雜 舊–歸 元–無 開–井 開–升 東-樂

五–醜 鬥-頭 幹–千 於–幹 廠–廣 幾–凡 屍–戶

尤–龍 巾–幣 岡–網 叉–義 岡–網 個–介 術–米

風–鳳 凡–幾

不难看出,这些汉字中,绝大部分区别度都很大,如“塵–尖”、“拔–撥”、“夯–奪”、“伏–優”、“競–竟”、“出–擊”、“朵–雜”、“ 舊–歸”、“ 團–困 ”、“或–鹹”几组字,如果不是经过简化,单从字形上几乎不会混淆。

值得注意的还有简化後形成的形近部件,因其类推作用而造成了成批的形似字。比如繁体字“侖-倉”形差度大,不宜混淆。简化後,“仑-仓”形差度极小,无论是手写体还是机器识别,都极易混淆,连带造成了“沦-沧”、“抡-抢-枪-伦”、“沦-论”成为形似字。再如简化前“訁”字旁与“氵”形差度很大,不宜混淆。简化後“讠”和“氵”变成相似部件,同样类推造成了许多形似字。特别是二者的手写体极易混淆,如果没有上下文,下列幾组字实在难辨:没有-设有、请谈-清淡、内江-内讧。据笔者统计,由 “讠”和“氵”与某一共同声旁组成的形近字就有9组18个字。类似的部件还有“纟-糹”、“饣-飠”、“钅-釒”等。

因此,一些人批评汉字简化导致大量形似字增加,为人们识读和使用汉字带来诸多不便。例如申小龙在《我观汉字简化》批评到简化字“造成汉字分辨率大大降低,‘风’‘凤’不分,‘戈’‘戋’相淆,‘厂’‘广’易混,‘阴’‘阳’难辨,‘设有’‘没有’幾乎肯定与否定颠倒。汉字靠笔画的不同组合区别字义,笔画一简,失之毫厘则谬以千里”。谢世涯(1992)在《新中日简体字研究》中也指出:“简体字虽然得了省时间书写的好处,却增加了容易混淆和写错的弊病,有得也有失,而那所得的一面,很快就被失的一面抵消了,真是得不偿失。”

4 如何看待形似字增加

4.1 如何看待形似字增加这一问题呢?真的是得不偿失吗?我们先来看两组数据。

4.1.1在3500个常用汉字中,简化後形似字839个,约占常用字总字数的24%。简化前形似字550个,约占常用字总字数的16%。简化造成的形似字287个,也就是增加了约8%。

4.1.2 在837个简化字中,非简化造成的形似字550个,约占简化字的66%。简化造成的形似字287个,约占简化字的34.29%,约34%(这裏没有考虑因简化而减少的形似字数目,所以实际比例应低于34%)。

4.2通过以上数据加以分析,我们可以得出一些结论:

4.2.1形近字的存在是由汉字性质决定的,是汉字固有的问题。汉字作为一种语素文字,必然是字数繁多、结构複杂。要让五六万个汉字侭量做到一个字一个面孔,必然会产形似字。所以在汉字简化以前,形似字就大量存在,幾乎占到常用汉字的四分之一。而这其中,笔画少的会有形似字,如“天-夭”、“犬-尤”;笔画繁多的同样存在形似字,如“冀-翼”、“璧-壁”。

4.2.2形近字增加是汉字简化的必然结果。汉字的简化,主要是减少笔画数目和简化形体,而汉字又只有横、竖、撇、点、折五种基本笔画的变化,笔画数目和形体减省越多,形差度就越小,字形也就越容易相近和易混。因此,汉字简化必然造成形近字增加的结果。

4.2.3汉字简化後增加的形似字数目与所占比例只是静态数据。我们得出的有关形似字增加的数据是从静态的角度来看的,如果从动态角度分析的话,不同的构词环境和语言环境会大大分化形似字,减少其误用混淆的幾率。数理统计也证明,经过第一次汉字简化以後,大多数10-16画的汉字具有相当的清晰度和区别性”。所以汉字简化并没有“造成汉字分辨率大大降低。

5 结束语

汉字简化不可避免地造成了形似字增加,但不能因此而断定简化运动是“得不偿失”,要知道,形似字的存在是汉字固有的问题,只要汉字的根本性质不发生改变,就不可能从根本上解决形近字问题,因此形近字增加的问题不能都算到汉字简化的头上。应该看到汉字简化是利大于弊的,要给予充分的肯定。但同时也要注意,汉字简化不是越简越好。仅静态数据来看,约占常用字8%的形似字不是一个小数目。有人曾建议把所有複杂的汉字都简化到十画以下,但这势必会大幅降低汉字之间的形差度,使形似字进一步增加,到时恐怕就真的是“得不偿失”了。所以,今後的简化工作应注意求简易和求区别的协调,侭量避免和遏制形近字的增加。

【参考文献】

[1]傅永和《形近字分析》,见:中国社会科学院语言文字应用研究所《汉字问题学術讨论会论文集》北京:语文出版社.1988年

[2]高更生《现行汉字规範问题》:北京:商务印书馆.2002.

[3]邵磊《关于形似字教学》[J],现代语文(语言研究).2008(10) .

[4]苏培成《现代汉字学纲要》,北京:北京大学出版社.1994.

[5]苏培成《汉字简化字与繁体字对照字典》,北京:中信出版社.1992.

[6]王火《略谈形近字》,辽宁大学学报.1994(6)

[7]谢世涯《新中日简体字研究》,北京:语文出版社.1992.

[8]郑继娥《20年来现代汉字形近字研究的考察》[J],西南民族学院学报(哲学社会科学版).2000(3).

[9]周文德.现行汉字形近字分析.西南师範大学学报(人文社会科学版).2006(3).

[10]朱盛科《常用形似字辨析》,广东:广东人民出版社.1982.

【注】本文和谐体所用繁体字及词例:

这裏、複杂、关係、学術、师範、幾率(幾乎)、前後(今後)、标準(準确)侭量;计9字。

李禄兴先生:北京中国人民大学文学院

QQXIUZI.CN 千千秀字