跳转到内容

未收录汉字

维基百科,自由的百科全书

未收录汉字是指一些现时Unicode中日韩统一表意文字未有收录的汉字。这些汉字可能是中国一些人名用的罕用字,亦有可能是中国境内少数民族或是方言书写者自创的新字。

现时Unicode所收录的汉字,按其收录次序,大致可以分为以下数个阶段:

所有在这范围以外的汉字,均可被归类为未收录汉字。

Unicode 汉字的收录标准

Unicode的汉字收录标准,是以各成员国家及地区的编码为基准。所以,现时已收录的汉字,均至少已有一个国家或地区的官方团体作具体描述,例如:出自何典、有何意思等。不过,一来汉字的特性是透过形与声的组合,很容易就可以造出一个新字出来;二来不管如何努力,也总可能会有漏网之鱼,特别是来自古时文献的文字。因此,一旦有这些未被收录的汉字出现了,就要先行整理出这一个字的出处,并对比现有汉字,以确认当中并无重复编码,然后再透过Unicode的相关程序,才可以排程等候编码。

外部链接