(本文完成于2005年11月9日,参加光明日报主办的“首届中国信息化论文大赛”,获优秀论文奖。光明日报于2007年4月1日发表,编辑将标题改为《汉字编码和输入法的应用统筹思考》。)
在中国信息化的道路上,汉字编码及输入法可能是最具中国特色的事物之一。从 1978 年支秉彝公布中国大陆第一个小键盘汉字编码方案“见字识码”起,编码方案曾如雨后春笋般涌现,并一度形成“万码奔腾”局面。近三十年过去了,汉字编码的统一之路依然山重水复。这个问题已经、并将继续对中文信息化进程产生负面影响,应该引起我们的高度重视。
汉字编码至今难以统一,根本的原因是我们缺少宏观战略思想的指导。我国著名科学家钱学森早在上世纪九十年代中就明确指出,电子计算机即将带来一场伟大的深远的变革,对我国来说,汉字的编码是个必须抓紧解决的问题,是百年大计,中文信息处理技术是关系“社会主义文化的大问题,必须有马克思主义的预见性,运用系统工程的方法,站在国家的高度统一考虑,否则就要走弯路,就要吃大亏。”他还指出,具体技术细节的攻关等工作“如果不在宏观战略思想指导下进行,就可能徒劳无功。例如:方案之争、语言混乱等问题,在低层次争论是难以统一的,只能在一个更高的层次上加以综合平衡,决定取舍。还要考虑与世界科技文化发展相协调等问题。”但时至今日,我们甚至还没有统一的、明确的战略目标,导致众多研究者各自为政,或出于个人偏爱,或囿于一己之见,做出各种以己之长比人之短的方案:有的号称三分钟就可学会,有的要设擂台比试输入速度,还有的宣传很方便输入“难打字”,等等,总之是扬其一点,不及其余,于是就有了“万码奔腾”。由于没有明确的战略目标,所以我们不知道什么样的输入法是理想的输入法,竟然将判断汉字编码及输入法优劣这样一个理论性、学术性、文化性极强,隐含社会成本极高的复杂课题简化成一个“市场”问题,交由“市场”去裁决。
回顾我国汉字编码及输入法技术发展进程,软件界做出了最为卓越的贡献。与软件界的贡献相比,语文界少有作为。
汉字编码主要用于汉字的键盘输入,同时也可用于汉字的排序检索以及辅助汉字教学。汉字键盘输入法包括编码和软件两个层次。由于电脑硬件持续、快速的升级换代,在软件层次已经可以为输入法提供比“足够”还要多的支持,只要是符合“逻辑”的功能要求,软件似乎都能实现。输入法要有根本性的突破,关键在编码层次。编码层次解决战略问题,软件只提供战术手段,战术是为实现战略目标服务的。汉字编码与汉字的关系最为密切,是直接为汉字服务的,因此,语文界应关注汉字编码及输入法研究,主动干预其发展方向,主导统一进程。
语文界至少应该在三个方面有所作为:第一,要基于汉字教学和汉字应用的需要,确立汉字编码及输入法的战略目标和要求;第二,要加强语言文字规范化建设,提高汉字规范化水平;第三,要根据既定战略目标和要求,开展对汉字编码及输入法方案的评价工作。三个方面归结到一点,就是要将汉字编码及输入法纳入到汉字教学和汉字应用的大系统之中统筹考虑,从宏观上引导汉字编码及输入法研究向更高层次发展。
汉字编码及输入法的战略目标要基于汉字教学和汉字应用的“需要”,而不是基于技术“可能性”来确定。“需要”是发明之母,而囿于成见的对“可能性”的推测则往往湮灭智慧之火。
我们“需要”什么呢?
先从汉字教学的角度考察:小学生先学汉语拼音辅助识字,“需要”同步地用拼音输入汉字;接着学习按照规范的笔顺书写汉字,“需要”用笔画输入汉字;学生开始学习汉字部首,同时随着识字量、词汇量以及拼音、笔画、部首等汉字基础知识水平的逐步提高,对汉字输入速度的要求也“水涨船高”地相应提高,这时就“需要”同时用拼音、笔画和部首高效率地输入汉字。这是一个连续的、动态的变化过程:只懂拼音时就用拼音输入汉字,学了拼音又学写字就可同时用拼音和笔画输入汉字,学习部首后又可同时用拼音、笔画和部首输入汉字;认识的字可用拼音、笔画和部首输入,不认识的字可用笔画和部首输入,难以确定部首的字可用拼音和笔画输入。由于拼音、笔画和部首知识水平以及识字量因人而异、因学习阶段而异,“需要”不切换地混合使用各种方式输入汉字,实现“无级变速”。
再从汉字应用的角度考察:首先,中国拥有五千年文明史,汉字本身也有三千多年的历史(从甲骨文算起),一脉相承的汉字文化给我们留下了宝贵而丰富的历史遗产,我们“需要”在信息时代很好地继承这些遗产,因此,汉字编码及输入法“需要 " 以全汉字集为处理对象(古文字拟另行处理);其次,除了电脑输入外,汉字还“需要”统一的、高效的排序检索方法,用于汉语字典查字以及图书档案馆的图书资料检索等;此外,学生们毕业后将成为各行各业的从业人员,“需要”凭他们在学校就已熟悉的输入法来满足不同职业对汉字输入的要求,而不必重起炉灶另学一种输入法,也就是说,“需要”全社会通用的输入法。
综上所述,同时从汉字教学和汉字应用的角度考察,我们似可导出汉字编码及输入法的战略目标:我们“需要”统一适用于键盘输入和汉字排检的汉字编码;“需要”建立在汉字基础知识之上、应用拼音、笔画和部首、能够“无级变速”的汉字输入法;“需要”以全汉字集为处理对象、通用于全社会的汉字输入法。
显然,要同时满足上述“需要”,任何单一方式,无论是音码、形码、还是音形结合码等都无能为力,但如果将它们科学地组合在一起,例如用音码或音形码输入常用字、用形码输入全部汉字等方式,就有可能满足“需要”。因此,实现上述战略目标和要求的可能途径是集音码、笔画码、形码和音形结合码等不同方式于一体,不切换混合使用,使它们优势互补,各尽所能。不同方式的组合不是“拉郎配”,每一种形式的编码都应该放在整个编码系统中统筹考虑,利用码元、键元和编码方式的巧妙组合,使各种方式既共存一体,又互不干扰。
为了实现汉字编码及输入法的战略目标,语文界还要加速、加强语言文字规范化建设,提高汉字的标准化、规范化水平。例如,要尽快出台汉字部首规范,使每个汉字都有确定的、唯一的部首,还要建立规范、权威、分级的通用词库和学生词库,等等。
有了明确的战略目标,还要从规范性、易学性、高效性、通用性等方面对汉字编码及输入法提出性能要求,并在此基础上开展对汉字编码及输入法方案的评价工作。
运用系统工程的方法,将汉字编码及输入法纳入汉字教学和汉字应用的大系统之中,尽快确立其战略目标和要求,大力提高汉字的规范化水平,积极开展对汉字编码及输入法方案的评价,必将大大加速汉字编码及输入法的统一进程。