维基百科:地区词处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
地区词处理和繁简处理是中文维基百科字词转换系统的两大部分,地区词转换旨在为中国大陆、香港、澳门、台湾、新加坡、马来西亚的中文用户提供贴近其语言习惯的转换模式。中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地区词使用简体中文;台湾(zh-tw)、香港(zh-hk)及澳门(zh-mo)的地区词使用繁体中文。
修改历程
- 港澳繁体:原以zh-hk参数涵盖zh-mo,社群于2013年讨论后,正式激活zh-mo参数,拆分“香港繁体”和“澳门繁体”。
- 马新简体:原以zh-sg参数涵盖zh-my,而在2018年经过社群讨论后,正式激活zh-my参数,拆分“新加坡简体”和“大马简体”。
转换涵盖顺序
- 中文:zh兼容zh-hans、zh-hant
- 简体:zh-hans ⊃ zh-cn ⊃ zh-sg ⊃ zh-my
- 繁体:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo
因此若顺位较低的地区词与上一顺位者相同,择该上位者涵盖即可。zh虽兼容zh-hans、zh-hant直接取代,但下位区域转换不影响。
全局转换
地区词的全局转换通过MediaWiki内建转换表、数页本地全局转换表实现。
全局转换是最方便快速的转换处理方式,但也较易过度转换。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区词转换。
用户可按需在Wikipedia:字词转换/地区词候选页提请希望全局转换表新增的地区词,所提的新词应当符合以下新增全局转换的先决条件:
- 符合地区转换词基本资格;
- 提请需被全局转换的原词绝不能只有1个汉字,以免过度转换(如“宏→巨集”即不可);
- 提请全局转换的词至少在100篇条目中出现(可用搜索引擎判断)。
此外,对于字数较少(不多于三字)的需被转换(原)词,还应考虑其中汉字的字频,以免过度转换。(例如“内”字甚为常用,“内存→記憶體”会引致“体内存在”转换为“體記憶體在”,故不应提请加入全局转换)关于汉字字频方面的研究,关于汉字字频方面的研究,可参考汉字单字字频总表、现代汉语常用字表与其他相关统计。
采纳或拒绝全局转换地区词的新增请求取决于社群共识。若符合以上全部先决条件而无合理、属实的异议(包括合理疑点均已消解),并且——
- 不少于5人对此发言,请求提出已满7天;或
- 不少于3人对此发言,请求提出已满30天;
则由管理员采纳请求并纳入相应转换表。但若在请求提出满90天后发言人数仍不足3人,管理员可综合已有合理、属实的意见及己见,作出决定及处置;本句赋权的“决定”若为“拒绝”,须附上明确理由或指明所依据的意见。注,发言人数计入请求提出者、只作投票而不附理由的自动确认用户;不计傀儡,不计只作投票而不附理由且非自动确认用户者。
如有地区词过度转换错误,甚或需要删除全局转换地区词,请在Wikipedia:字词转换/修复请求提报。不过,如果此错误属于罕有个案而只存在于您有权编辑的极个别零星页面,您若通晓转换语法,可自行予以适当修补。
全文转换
全文转换适用于特定的单篇条目,针对性极强。
“-{A|转换内容}-”是全文转换的原始码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目原始码的顶端插入“{{NoteTA}}
”的模版,并依照该模版页面的说明输入转换内容即可。
由于全文转换的针对性极强,所以较难出现过度转换。但有些情况也需要利用单独转换来实现。
公共组转换
对于一些主题、领域相同和相似的条目,其中要转换的内容大同小异,可以把这些多个条目中要用到的共同转换字词单独创建一个公共转换组。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
创建一组公共转换组时,要依据这一组大多数词汇在多篇条目中转换的可能性,而不应依据转换词的类别。比如,各国现任领导人的姓名转换,存在复用的可能性非常低,就不应当创建这类别的公共组。创建公共转换组的方法可参见Wikipedia:字词转换处理/公共转换组。
公共组转换中的转换内容可由普通用户控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换,典型的例子是“數位→数码”的转换:对于全局转换来说,与电脑和资讯科技无关的条目中,“數位”后面可能会搭配“人士”组成“數位人士”一词,这样就会过度转换成“数码人士”。然而,在电脑和资讯科技的公共组转换中,所涉及到的条目大多是技术类条目,其中有许多本来就应该转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。
然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也有其局限。过度的地区转换可以通过繁简处理的全局转换来修复(详见该页面),也可以通过后文中提供的其他方式实现。
单独转换
“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的原始码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。
举例而言,条目艾奥瓦州的单独转换:
又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
可以用于别名的展示。其展示的结果便是“又译作爱荷华州、爱我华州或衣阿华州”。或者用“{{各地中文名}}”等模板,说明之间差异。
又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位→数码”转换的同时可通过“數-{}-位人士”来避免过度转换。
注意事项
手动转换书写格式
- 概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写
虽然,地区词处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。
然而,上述的操作实际上并不完全符合于繁简转换与地区词转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填写繁简体对应词,不要填写对应地区词。对A转换采用哪一地区词先到先得(即先编辑转换的),对于T转换,要求除繁简之别外与标题一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。
参考文献应避免情况
此外,参考文献中的标题、章节等部分文字不应转换繁简(其他部分除外,尤其是外文作者姓名中译等内容应参与转换),因此,如果不在参考文献的部分文字处停用繁简转换,则无论是在全局转换、主题转换还是全文转换中,都有可能会影响当中文字。为避免此类现象发生,建议在引用参考文献时使用可停用标题、章节等参数繁简转换的{{cite}}系列模板。
官方中文名称处理
当一个机构、组织、公司或人物已有官方的汉字或中文名时,社群对应否转换地区词出现分歧。临时解决方案为:条目标题遵从包括“名从主人”惯例在内的命名常规命名;各地中文变体版本对此以“地区词转换”方式显示当地可靠来源的最常用用法。此方案不反对在文中个别地方标明条目所述机构、组织、公司或人物在其他地区的名称。