本项目是以中国《现代汉语常用字表》为基础、辅以汉语水平考试HSK 字表,对照日韩和港台地区常用汉字或教育用字,采用ISO 习用的汉字认同规则,进行大陆-台湾、内地-香港、中-日、中-韩的汉字对比,提供一套比较完整、准确的基础资料,作为CJK 汉字统一编码的应用和补充,为汉字对外教学,特别是面向汉字文化圈的汉字教学提供有益的参考。
汉字因在时空(中日韩,港澳台,教科书、报刊媒介、古籍)的不同而可能有各种不同的呈现(Presentation)。具体的汉字造型,具有很强的民族性、地域性和时代特征。而各种汉字造型往往以某一电脑字库(Font)为代表,不同字库在风格上、笔形上会有很大的差异,但都遵从各个国家/地区相应的规范。
为了高效地教好各类学生识读书写中国规范汉字,必须遵循“因材施教”的原则,按不同的学生类别对字形结构、规范笔画、规范笔顺进行教授,而不能千篇一律地照搬小学语文教材。实际上,教学对象无非是这两大类:没有汉字基础的对象(儿童,欧美学生)和有汉字基础的培训对象(日本、韩国、港澳台学生和受过港台汉字培训的外国人)。他们的基础和需求是有很大差别的,所以相应的教案也应细分。
对于有汉字基础的学生,显然没有必要一字一字地从头教起。教师的责任,首先要给他们以信心,告诉学生:他们已掌握的汉字在字形上有近一半与规范汉字是相同的,另有八分之一到四分之一仅有微小的差异,只有另外三分之一(强)是需要简化、正形或选用另一个异体字来代换。而所有的差异都有一定的规律性,不难掌握。
对初学和普通的书写,没必要苛求细微的差别;但绝不能因此而忽视汉字字形、笔形的差异。特别地,本资料所列举的大都是常用字(高频字),对于跨语言环境的学生而言,这一点尤为重要。比如,一笔之差可以改变一个字的属性,可能使他们在电脑上不能输入自己的常用字(如説-說,吴-吳),或者引起误解(如壳-売),或者在查字典时绕道其他的部首(如决-決)。当今,即使电脑的输入技术已经能相当容忍一定的书写偏差,但OCR 或手写输入对笔形的变异和笔画的多寡还是相当敏感的。
本项目的目标,就是要方便师生们浏览和查阅这些汉字的异同,希望起到辅助的作用。初步的用户反馈是,这些资料不仅对学习中国大陆的规范汉字有益;反过来,对中国大陆的人士学习其他国家/地区的汉字文化也有帮助。
本项目也是中文信息技术开发的基础项目
事实上,本项目对于字库开发、多语境汉字键盘输入、手写识别、OCR 引擎开发、简繁精密转换、跨语境简繁异关联检索、辞书编纂等项目,也都有重要的参考价值。
本项目是由长期从事中日韩汉字统一编码工作的国际标准化组织汉字组(IRG)前召集人张轴材提出并主持编著,在教育部语言文字信息管理司的支持与指导下,依托北京书同文数字化技术有限公司,开展中日韩大范围多边合作完成的。