字母顺序
字母顺序 (alphabetical order),全称字母表顺序 ,简称字母序, 简单易用,是拉丁文字的传统排检法。 英文的词典、索引和词表等都普遍采用字母顺序,中文的新华字典和现代汉语词典等许多辞书正文所采用的汉语拼音排检法也属于字母顺序。[1]
字母顺序排检法具有悠久的历史,其基本原则是根据单词中的字母在字母表中的前后顺序来决定单词之间的顺序。下文作较为全面的介绍,并根据中文的具体需要,增加《汉语拼音排序法》的内容。[2]
历史
据历史记载,人类大概在距今三千多年前的埃及西部发明字母顺序。但这种文字排序法在之后的几个世纪内一直没有受到重视。
学者们第一次有效地使用字母顺序作为编目工具可能是在古代亚历山大图书馆(建于公元前 300年左右)时期。其中的书卷按作者姓名首个字母的字母顺序进行放置。
12世纪下半叶,字母顺序作为谘询的辅助工具开始进入西欧知识分子生活的主流,当时开发了字母工具来帮助传教士分析圣经词汇。字母顺序的采用是从记忆至上到书面作品至上的一种过渡。
1604年,第一本单语英语词典Table Alphabeticall[5][6]采用字母顺序编排,现今的许多参考书和列表的条目排列都是基于这种顺序。
基本规则
每一个拉丁文字系统(例如英文)都拥有自己的字母表(alphabet),即一个用来书写该语言的有序字母集合[7]。现行国际标准ISO基本拉丁字母表 (ISO basic Latin alphabet)[8] 是:
大寫字母集: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 小寫字母集: a b c d e f g h i j k l m n o p q r s t u v w x y z
判定两个单词(字符串)先后顺序的基本规则 [9] [a]是:
- 先比较两边的第一个字母,如果不同,则根据它们在字母表中的先后关系来定序,位置靠前的字母所在的字符串排在前面 (例如,英文单词cat先于dog, 因为字母c在字母表中位于字母d的前面)。
- 如果两个首字母相同,则比较双方的第二个字母,以此类推,直至找到第一对不相同的字母并据此定序 (例如,英文单词what先于why,因为第三个字母a先于y)。
- 如果比较到其中一个字符串的最后一个字母,双边的字母还是相同,那么较短的字符串排在前面 (例如,alphabet先于alphabetical)。
上述几个例子的综合字母序是:
alphabet, alphabetical, cat, dog, what, why.
辅助规则
在实际排序中有时会出现基本规则未能涵盖的问题,包括大小写字母、字母表之外的字符,或者需要根据语言习惯作相应调整的情形。这时就需要辅助规则[10][11]。
大小写字母
大小写字母在排序时一般被看成是一样的。但如果有需要,可以对只在大小写字母方面有区别的字符串做合乎语言习俗的处理。通常是将大写的排前,例如,汉语拼音方案的字母表:Aa Bb ... Zz。 又如,《牛津高阶英汉双解词典》 中有这样的词条排列: MS, Ms, Msc. [12]
多词字符串
如果待排序的字符串含有多个词(中间常用空格或连词符号隔开),这时有两种处理方法:
- 第一种方法是先按第一个词排序,第一个词相同的再按第二个词排,以此类推。例如英文:Oak; Oak Hill; Oak Ridge; Oakley Park; Oakley River。
- 第二种方法是忽略空格等分词字符,看成一个连续的字母串来排。这样,以上词语的序列变为:Oak; Oak Hill; Oakley Park; Oakley River; Oak Ridge.其中的 Oak Ridge 移到了最后。
the, a, an
如果一个短语以一个非常常见的冠词如“the”、“a”或“an”开头,则该词有时会被忽略或移至短语的末尾。 例如,书名“The Shining”可能会被视为“Shining”或“Shining, The”,因此会出现在书名“Summer of Sam”之前。 然而,它也可以被简单地视为 "The Shining" 而排在 "Summer of Sam"之后。 《牛津高阶英汉双解词典》 有这样的条目顺序:“ official secret, the Official Secrets Act, officiate”。用的是前面的方法。
连字
指两个或多个字母合并为一个符号,例如英语中的 Æ 和 Œ。这种连字符号通常被视作字母是分开的,即Æ 和 Œ分别当作AE 和 CE,而 æther 就按照 aether 来参加排序。
改形字母
对于修改了形状的字母,不同的语言可能有不同的处理方法。例如,法语中把带附加符号的字符都当作基本字符来排序,例如 rôle 当作role,排在 rock 和 rose中间。德语的“电话簿序”中,Ä, Ö, Ü当作 "ae", "oe", "ue" 来排序。西班牙语的Ñ作为一个单独字母排在N之后.
非字母字符
数字和标点符号等非字母字符也有不同处理方法,一种是把它们排在所有字母之前 (例如, 《牛津高阶英汉双解词典》 有这样的条目顺序: “MP, MP3, MP3 player, MP4, MPEG”,把数字排在字母之前)。 另一种方法是按其读音的对应词语来处理,例如,1999 按英语 nineteen nighty-nine 的拼写来排列。
汉语拼音排序法
这是根据汉语拼音方案所采用的基本拉丁字母表的顺序来排列汉字。[2] 中文的新华字典和现代汉语词典等许多辞书的正文都用汉语拼音排检法。
单个汉字的排序
汉字的拼音排序步骤如下:[1]
- 根据每个字的拼音字母串,按照字母表的顺序排列。其方法是先按第一个字母在字母表的顺序排列,如第一个字母相同,再按第二个字母的顺序排列,以此类推。例如,"男女员工齐努力" 排序为“工(gōng) 力(lì) 男(nán) [女(nǚ) 努(nǔ)] 齐(qí) 员(yuán)”。圆括号内为拼音。[女(nǚ) 努(nǔ)]基本拉丁字母都是nu,暂时不能定序。
- 拼音字母相同的字,如果同时存在e和ê音节,或者nu和nü,或者lu和lü, 则根据新华字典《汉语拼音音节索引》规定的顺序,将发ê音的字排在紧跟e音的字的后面,nü音的字紧跟nu音的字的后面,lü音的字紧跟lu音的字后面。[2] 例如“额 (è) 欸(ê̄)”,“路(lù) 驴(lǘ)”,“努(nǔ) 女(nǚ)”。
- 如果声韵母都相同,按声调顺序“1声、2声、3声、4声、5声(轻声)”排列,如“妈(mā) 麻(má) 马(mǎ) 骂(mà) 吗(ma)”。
将上面的例字综合起来的拼音字母顺序是
“工(gōng)力(lì) 媽(mā) 麻(má) 馬(mǎ) 罵(mà) 嗎(ma) 男(nán) 努(nǔ) 女(nǚ) 齊(qí) 員(yuán)”。
用汉语拼音字母排列汉语单字的详细顺序可参见新版新华字典 [13] 的“汉语拼音音节索引”(这是一个不带声调的音节顺序列表) 或 现代汉语词典 [14] 的“音节表”(带声调的音节顺序列表)。
拼音表达式完全相同的字,即声韵调相同的完全同音字,通常是借助笔划排检法来排序。
多字词的排序
含有多个字的单词有两种不同的排序方式可供选用 [15]。
- 一种是按字排序,如果第一个字相同,则按第二个字排序,依此类推。 例如,
“底层(dǐcéng),地标(dìbiāo),地表( dìbiǎo),地租(dìzū ),电灯(diàndēng)”。
现代汉语词典用这种方法。 - 另一种方法是按整个单词的拼音字母排序,当字母相同时再按声调排序。 例如,
“电灯(diàndēng),地标(dìbiāo),地表( dìbiǎo),底层(dǐcéng),地租(dìzū )”。
《ABC 汉英词典》[16]用这种方法。
注释
- ^ 这是BBC的初小教学内容,也可参考维基英文版文章Alphabetical order, 章节:Basic order and examples.
参见
参考资料
- ^ 1.0 1.1 詹, 德优 (詹德优等编著). 中文工具書使用法. 北京: 商务印书馆. 2008: 24–25. ISBN 7-100-01510-3 (中文).
- ^ 2.0 2.1 2.2 王, 宁 (王宁,邹晓丽). 工具書. 香港: 和平图书有限公司. 2003: 27–28. ISBN 962-238-363-7 (中文).
- ^ Street, Julie (10 June 2020). "From A to Z - the surprising history of alphabetical order" (text and audio). ABC News (ABC Radio National). Australian Broadcasting Corporation. (https://www.abc.net.au/news/2020-06-11/history-of-alphabetical-order-a-to-z/12320808 (页面存档备份,存于互联网档案馆))
- ^ 存档副本. [2023-06-09]. (原始内容存档于2023-07-28).
- ^ Cawdrey, Robert. Table Alphabeticall. London. 1604.
- ^ 存档副本. [2023-06-05]. (原始内容存档于2023-03-06).
- ^ Hornby, A S. Oxford Advanced Learner's English-Chinese Dictionary (牛津高階英漢雙解詞典) 10th. Oxford: Oxford University Press. 2023. ISBN 978-7-100-10527-9.
- ^ 存档副本. [2023-06-05]. (原始内容存档于2023-12-13).
- ^ 存档副本. [2023-06-09]. (原始内容存档于2023-06-09).
- ^ 存档副本. [2023-06-09]. (原始内容存档于2023-06-09).
- ^ 存档副本. [2023-06-04]. (原始内容存档于2023-07-28).
- ^ Hornby, A S. Oxford Advanced Learner's English-Chinese Dictionary (牛津高階英漢雙解詞典) 10th. Oxford: Oxford University Press. 2023. ISBN 978-7-100-10527-9.
- ^ 语言研究所, 中国社会科学院. 新华字典 12nd. 北京: 商务印书馆. 2020. ISBN 978-7-100-17093-2 (中文).
- ^ 语言研究所, 中国社会科学院. 现代汉语词典 7th. 北京: 商务印书馆. 2016. ISBN 978-7-100-12450-8 (中文).
- ^ 苏, 培成. 现代汉字学纲要 3rd. 北京: 商务印书馆. 2014: 201–202. ISBN 978-7-100-10440-1 (中文).
- ^ 存档副本. [2023-06-06]. (原始内容存档于2023-04-06).
外部链接
- Collation, sorting, and string comparison (页面存档备份,存于互联网档案馆)
- Chinese character orders (https://en.wikipedia.org/wiki/Chinese_character_orders (页面存档备份,存于互联网档案馆))
- Pinyin (页面存档备份,存于互联网档案馆)
- Alphabetical order (https://en.wikipedia.org/wiki/Alphabetical_order (页面存档备份,存于互联网档案馆))
- Collation (https://en.wikipedia.org/wiki/Collation (页面存档备份,存于互联网档案馆) )