汉字检索
拼音文字由字母组成,而字母有固定的排序,因此拼音文字的排序和检索相当方便。但是汉字是语素文字,数量庞大,没有固定的排序,因此在字典、辞典,或书籍中的索引,就必须另外开发方法,以便读者找字找词。
部首
部首是将汉字里常见的共同偏旁,如金、木、水、火、土、人、鬼等,拿来作为分类汉字的基准,所有汉字都被归类在某个部首中。部首是现代繁体汉字字典、辞典最主要的检索方式。台湾、香港的学校也会教授学生关于部首及字典查询的知识。
部首的概念始于东汉文字学家许慎于公元100年(永元12年)所著之《说文解字》,有540个。经过《字汇》、《康熙字典》沿用、修改后,成为现代的214个部首。
由于部首只能作大略分类,无法作到细部检索,因此多会搭配笔划检索。通常的排序方式是先依部首的笔划数排,部首相同的字再依去掉部首后的“剩余笔划”排序。如果部首笔划相同或剩余笔划相同,再依形、义的形似性排列。
同笔划的部首或同剩余笔划的字,没有统一的排序标准,大多数的字典会沿用《康熙字典》的排序,但也有些字典会依照自己的理念加以调整。部分汉字归属的部首也是如此。
部首检字法
利用汉字的部首来查字,多在知道字形而不知道读音与释义的时候使用。
步骤:
- 找出所查字的偏旁部首,数清此部首的笔画。
- 在“部首检字表”的“部首目录”中找到这个部首,记住部首旁边标明的页码。
- 到“检字表”找到页码并且找到要查的部首。
- 除去部首,数清余下部分的笔画数,然后按照所查部首下列的笔画顺序找到需要查的字。
部首查字法的运用
部首的位置一般是:上、下、左、右、外;如果所查字没有部首,可以尝试查文字的中间部分,也可尝试左上角。
若一个字同时具备多个部首,则可按如下规则查询:
若上下都有部首,查上不查下;
若左右都有部首,查左不查右;
若内外都有部首,查外不查内。
如果所查字是独体字,则有如下方法:
若这个独体字是一个部首的整体,则可以将其当做部首来查,剩余部分笔画数为零;
若这个独体字不是一个部首的整体,则需要查此字的起始笔画。
笔划法
这是根据汉字的笔画属性来排序和检索的方法。包括:
笔划数法
笔划数检索是根据汉字的总笔划数排序。同笔划的汉字没有统一的排序标准,通常会再用部首、读音、字形、字义等方式做次级排序。笔划相同的汉字数量很多,检索效率不高,目前多用于书籍后的术语索引;字典由于资料量太大,使用者较少使用笔划检索,但字典多会附上笔划检索表,作为替代的检索方式。
笔划数-笔顺法
先按笔画数从少到多排序,同笔画数的字按笔顺“横竖撇点折(中国大陆)”或“点横竖撇折(台湾)”顺序排列。中国内地的国家标准 《GB13000.1字符集汉字字序(笔划序)规范》 [1] 就是一个增强型的笔划数-笔顺法。新版的 新华字典 [2] 和 现代汉语词典 [3] 中的部首检字表都采用了这一标准。
四角号码
四角号码检字法由王云五在1925年发明,用数字0到9表示一个汉字四角的十种笔形,依序取汉字的左上、右上、左下、右下角的笔划,得一个四位数字,有时在最后增加一位补数,故最多为五码。
四角号码检字法曾经在早期许多字典使用,但现今多被部首检字取代,仅有少数大型字典附有此种检字方式。
读音
除笔划以外,许多书籍使用读音检索(或二者皆有),字典多会附上读音检索表。日语、韩语等语言由于拼音特性较显著,因此比较常用读音检索。读音检索可分成以下几种:
- 注音符号:主要用于中华民国,但通常只作为次要的检索方式。字典通常会附上,作为替代的检索方式,而书籍则往往没有。
- 汉语拼音:主要用于中国大陆,和笔划都相当常用。
- 粤音:主要在香港使用。
- 五十音:主要在日本,用于日语汉字。以最常用音读为首、训读为次。
- 韩语字母(谚文):主要在韩国及北朝鲜使用。
电脑内码
在电脑等数位环境中,必须先将文字转换为线性的编码才能处理。电脑中的文字通常会按照内码排序,但在特殊情形下,也可指定使用笔划、读音排序。目前的汉字字集编码方式不一,排序也大异其趣。常见的如下:
- Big5:依先笔划后部首的方式排序,主要用于繁体字集。
- GB2312:“一级汉字”依汉语拼音排序,“二级汉字”(罕用字)依先部首后笔划的方式排序。主要用于简体字集。
- Unicode:依先部首后笔划的方式排序,包括繁、简、日、韩等多国汉字。
仓颉检字法
仓颉输入法由朱邦复发明,原名为“形意检字法”,目的是为了解决一切汉字检索的困难(包括字典、辞典、电脑内码、电脑汉字排序等等)。目前这套方法除用作输入法外,未被广泛使用,只有朱邦复等人使用在他们自行开发的仓颉系统上。在香港仓颉输入法很流行,但其检字功能则否。
参见
外部链接
- ^ PRC, 国家语言文字工作委员会. GB13000.1字符集汉字字序(笔画序)规范 (PDF). 上海教育出版社. October 1, 1999 [2023-06-02]. (原始内容存档 (PDF)于2023-05-23) (中文).
- ^ 语言研究所, 中国社会科学院. 新华字典 12nd. 北京: 商务印书馆. 2020. ISBN 978-7-100-17093-2 (中文).
- ^ 语言研究所, 中国社会科学院. 现代汉语词典 7th. 北京: 商务印书馆. 2016. ISBN 978-7-100-12450-8 (中文).