CJK Ideographs Comparison

中日韩常用汉字对比分析报告_技术注释注释

[注1] 汉字认同的XYZ 模型

。X 轴代表字义,Y 轴代表字形(Generic Glyph,或Abstract Glyph),Z 轴代表具体的造型。CJK 汉字认同,是在Y 轴上进行的。如下图中,日文略字“”(藝之简体)与中文简体字“”、繁体字“”、异体字“”虽然具有相同的意义(X 投影为X1),但它们不能认同为一个编码汉字,而是在Y 轴上的四个投影(Y1,Y2,Y3 和Y4);同样的,虽然“芸”至少还有一个意义(芸香,芸芸众生,X 投影为X2),它也不能再有另一个代码。

>

[注2] 本报告中,汉字字形(Glyph)在这里指汉字形体结构的图像。它独立于汉字字库(Font),独立于汉字字号、粗细、姿态,也独立于汉字的造型方法(Design,BMP/TTF/OTT)。汉字字形是形式(或“能指”),不是内容(或“所指”);相对于字型它是抽象形态,不是具体的造型。在上图中,“”和“”,“”和“”虽然在草字头上有差异 、从而在Z 轴上有不同的投影(Z1,Z2),但被视为Z 轴上的微小差异,不影响其在Y 轴的投影,因此代码不变。

[注3] 为了照顾若干异体字在某些国家和地区已经编码的事实,ISO 标准制定了“源字集分离原则”,使得一些异体字,甚至在中国大陆看来只是新旧字形的汉字也分别编码了。


... ...

>

[注4] ISO/IEC 10646 中的CJK Unified Ideographs 字表,基于Annex T所总结的规则,全面地以宋体或明朝体为代表清晰地罗列了中日韩汉字在不同国家和地区的汉字认同-甄别的结果。被认同的汉字平列在一行,我们可以称之为“水平认同”(Horizontal Unification),或形式上的认同;被水平认同的汉字被赋予了相同的国际代码。

在ISO CJK 字表中,简繁异兼收并蓄,但简体字和繁体字是不认同的、绝大多数异体字也是未认同的。

>

指明这些简繁异体汉字的关系,进行ISO CJK 字表按字义的“垂直认同”(Vertical Identification )始终是一项呼声很高的任务。但由于该项目对字的义项、语境习性、转换方向、语文政策有相当的依赖,所以至今尚未在大范围、多边地进行。

[注5] 关于微小形差 各国家/地区间汉字字形的微小差别,有时是很模糊的。即使在同一类字库中、甚至同一个字库中,笔形可能都有所不同。所以,在微小形差与“同形同码”之间很难准确拿捏,本项目中也有不尽一致的地方。

但是在字形对比中,我们仍然遵循一定的规则,兹总结如下:

(1) 下列情形,视为“同形同码”:

(2) 下列情形,标记为“微差同码”:

中国大陆一般取左侧汉字的笔形。(注意在本资料的对照表中,中国大陆的规范字形一般在右边,仅和日本比较时放在中间。)

[注6] 关于汉字正形 1965 年,中华人民共和国文化部和中国文字改革委员会联合发布了《印刷通用汉字字形表》,收6196 字,为统一铅字的字形提供了一个范本。在文字学界和印刷界,常常把这项整理工作称作“汉字正形”。“汉字正形”的标准是:同一个宋体字有不同笔画或不同结构的,选择一个便于辨认、便于书写的形体;同一个字宋体和手写楷书笔画结构不同的,宋体尽可能接近手写楷书,不完全根据文字学的传统。按此标准,对有些字形作如下处理,得到新字形。(以下每对字中,左为新字形,右为旧字形)。

许多国内出版的汉语字典、词典的前几页,都能找到“新旧字形对照表”。但是由于印刷字体太小,且缺少规律性说明,致使读者不甚了了。本项目在网站上专门列举了新旧字形的放大图片和动态笔顺图,可帮助读者搞清新旧字形的细微差别。

需要补充说明的是,

(1) 当年的“汉字正形”,基本上是在宋体骨架上进行的,虽然仿宋体和黑体都可参照,但对楷体和其他字体则未作出规定。这样在雨字头、走之的写法上,以及“木”的末笔的笔形(捺或侧点),也就有相当的灵活性。

(2) 上述例子中,凡是有下划线的,新旧字形已经造成了两个或多个Unicode编码汉字并存。