未收录汉字
未收录汉字是指一些现时Unicode的中日韩统一表意文字未有收录的汉字。这些汉字可能是中国一些人名用的罕用字,亦有可能是中国境内少数民族或是方言书写者自创的新字。
现时Unicode所收录的汉字,按其收录次序,大致可以分为以下数个阶段:
所有在这范围以外的汉字,均可被归类为未收录汉字。
Unicode 汉字的收录标准
Unicode的汉字收录标准,是以各成员国家及地区的编码为基准。所以,现时已收录的汉字,均至少已有一个国家或地区的官方团体作具体描述,例如:出自何典、有何意思等。不过,一来汉字的特性是透过形与声的组合,很容易就可以造出一个新字出来;二来不管如何努力,也总可能会有漏网之鱼,特别是来自古时文献的文字。因此,一旦有这些未被收录的汉字出现了,就要先行整理出这一个字的出处,并对比现有汉字,以确认当中并无重复编码,然后再透过Unicode的相关程序,才可以排程等候编码。
外部链接
这是一篇语言小作品。您可以通过编辑或修订扩充其内容。 |