維基百科:繁簡處理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文維基百科裡,繁簡處理和地區詞處理是字詞轉換系統的兩大組成部分。繁簡轉換旨在為用戶提供只針對單字的轉換(並包括繁簡/簡繁一對多的轉換,例如簡體「打斗」會正確轉成繁體「打鬥」),是進一步實現地區詞轉換的基礎。本頁面提出一些繁簡轉換編輯維護的指引。
維基百科簡體字與繁體字的轉換,是指中華人民共和國所制定規範漢字與華語圈傳統漢字間的轉換,轉換範圍基本以《通用規範漢字表》為準,但亦會根據民間習慣和實際需要作彈性調整。
全域轉換
維基百科的繁簡轉換總共通過三個轉換表來實現:其一是MediaWiki內置的轉換表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定義的簡體中文轉換表、其三是在MediaWiki:Conversiontable/zh-hant中定義的繁體中文轉換表。
如果您遇到了以下三種情況,請提交Wikipedia:字詞全局轉換修復請求,管理員會儘快處理,而無需人手轉換修復:
- 繁簡/簡繁一對多的轉換出錯。例:「乾隆」過度轉成「干隆」(由於「繁體:乾=>簡體:乾、干」的一對多轉換);
- 全局轉換地區詞出錯。例:「東加拿大」過度轉成「汤加拿大」(由於「臺灣正體:東加=>大陸簡體:汤加」的地區詞全局轉換),「撒贝宁」過度轉成「撒貝南」(由於「大陸簡體:贝宁=>臺灣正體:貝南」的地區詞全局轉換);
- 某一單字沒有轉換。例:「東」未轉成「东」,但此種情況較為罕見。
注意事項
條目標題
用繁體或簡體建立頁面,相應標題必須全部為繁體或簡體字。如果標題繁簡混雜,例如「中國历史」,系統就無法自動轉換。如果您發現這些頁面,請將它移動到簡體標題或繁體標題,然後將重定向頁面掛上{{d|R3}}
標籤;但系統會視作簡體字的傳承字、俗字(如「杰」、「灯」)除外(是否為簡體字應視具體情況而定)。
如果文章有繁簡兩版本就必須合併,具體參見Help:中文維基百科的繁簡、地區詞處理#編輯一般文章時的注意事項。通常這些情況很少見,維基程式會自動在你建立條目時判斷有無對應繁簡的條目並做出處理,但通過移動等方式也會產生同一事物的繁簡兩個版本條目。
若頁面已有繁中標題版,則不得建立相同內容的簡中標題頁面,反之亦然。例如,條目哈萨克已存在,則不得建立名為哈薩克的條目,但可以建立繁簡重定向至哈萨克條目。
勿與地區詞轉換相混淆
雖然繁簡轉換與地區詞轉換都用相同的轉換技術,但它們發揮的功能並不一樣,因此,請勿將地區詞的全局轉換請求提交到Wikipedia:繁簡體轉換請求。如需了解更多相關內容,請參見Wikipedia:地區詞處理。
勿人手轉換條目繁簡語句
編輯維基百科條目時,如果缺乏正當理由,請勿人手將條目源碼的繁體語句轉為簡體,反之亦然(廣義也包括將一個地區用詞轉換成另一地區用詞,如港澳繁體轉換成臺灣正體),以免影響他人編輯和閱讀。人手轉換可能會視為「繁簡破壞」,見Wikipedia:破壞#破壞類型中的「繁簡、異體及地區用詞破壞」一條。
對於讀者來說,想只看繁體或簡體,可以在界面上方選擇「大陆简体」、「香港繁體」、「澳門繁體」、「大马简体」、「新加坡简体」或「臺灣正體」;對編者來說,若想修正自動轉換出錯的詞彙,可以使用人手轉換語法,形如-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-
,或者{{NoteTA}}模板。總之人手轉換條目繁簡語句沒有必要。
請注意:若您的瀏覽器安裝了中文繁簡轉換軟件,或可以轉換繁簡中文的行動應用程式,請在編輯時將其關閉或移除。
簡便地修復錯誤的繁簡轉換
一種例外是當繁簡並非一對一轉換,且該字不與上下文形成詞彙而不適宜使用全文轉換時,為了簡便地修復錯誤的繁簡轉換,可改為不會轉換出錯的字眼。修復錯誤轉換時,應優先使用沒有歧義且不會轉換錯誤的字形。例如在簡體和港澳繁體有「着」、「著」兩種字形,在臺灣正體只有「著」字形,在原始碼輸入「着」時可由系統自動轉換成臺灣正體「著」,但反之則不會轉換,因此以台灣正體輸入「吸著」一詞時無法正確轉換為簡體和港澳繁體,此時容許直接將原始碼修正為「吸着」以修正轉換錯誤,如果在內文直接使用轉換規則(例如「吸-{zh-hans:着; zh-hk:着;zh-tw:著;}-」)時,也允許將原始碼簡化為「吸着」。更詳細的範例可參考Wikipedia:非一對一字詞轉換錯誤修正指南。
勿手動轉換異體字
儘管異體字間的功能相近,且所代表的意義相同,但手動轉換異體字,很可能引發編輯爭議,甚至引起編輯戰。因此在人手轉換異體字之前,請先考慮以下兩種情況:
一是在現代漢語中或者電腦輸入中已經不再使用或者極少使用的異體字,如「靑/青」、「敎/教」、「囯/国國」,這種情況下,將異體字轉換為正體字是值得提倡的,反之則視為破壞。因為此類異體字在電腦輸入或者現代漢語中極少用到,使用此類異體字不便於閱讀。
二是目前現代漢語中仍然有用的異體字,此類異體字由於較常用,或者是不同地區,對正體是哪個字的定義不同,例如「床/牀」,中國大陸和台灣把「床」視為正體,把「牀」視為異體,而香港則是相反,視「牀」為正體,人手轉換此類異體字違反了避免地域中心方針。此外,「台/臺」這一對字由於政治原因常常成為修改對象,由於「台」字雖為俗寫,但是在台灣已經廣泛使用,因此不應人手轉換,而是應該遵循先到先得的原則,因為人手轉換這些字對條目沒有實際改善作用。
概括來講:
- 如果所有地區皆常用甲,罕用乙→可將源碼乙直接改為甲,不宜使用轉換。
- 如果某些地區常用甲而罕用乙,某些地區常用乙而罕用甲→源碼文字先到先得,不得修改,同時全局轉換。
- 如果所有地區混用甲/乙→源碼文字先到先得,不得修改,不得使用轉換。
- 如果某些地區混用甲/乙,其他地區常用甲而罕用乙→源碼文字先到先得,不得修改,其他地區可使用轉換。
日本漢字及其他不應轉換繁簡的情形
因為日本漢字不屬於中文,所以日本漢字不應參與中文的繁簡轉換。但是,部分日本漢字與中文漢字存在重疊,系統可能誤將其認作中文而轉換。這種情況下,您應當使用{{lang|ja|日本語漢字}}
來防止誤轉。
如果是因為其他原因需要避免簡繁轉換(如在一些網站,簡體和繁體的使用者名稱屬於不同賬號),可以用-{汉字漢字}-
或<nowiki>汉字漢字</nowiki>
來達到禁止轉換的效果。在使用cite系列模板標記參考來源時,遇日文漢字可使用|script-title=ja:XXX
展示來源標題。(韓文漢字情況同理,使用|script-title=ko:XXX
展示來源標題。)
大陸簡體模式下的中國古代專有名詞
在大陸簡體模式下,對中國古代人名、地名等專有名詞,若其中某一簡化字屬於兩個或多個漢字的合併字,則該字可以保留原繁體字或異體字,如「凌濛初」可不簡化作「凌蒙初」、「南壄」可不簡化作「南野」、「昇平」可不簡化作「升平」。若某一繁/異體字本身已在簡體中文環境較常出現(如「濛」字),則該字本身便不應加入全局繁簡轉換(或應從已在的全局轉換中移除);否則,對其中繁/異體字會被轉換的專名而言,若通用度高可在全局轉換進行相關處理以防被轉換為簡化字[註 1],其他情況則一般只在頁面內手工轉換或加入相關公共轉換組。在條目內(尤其是以該專名為主題的條目)首次出現時,這些保留繁/異體字的專名須標註簡化字寫法。
注釋
- ^ 這裡說的「通用度」有兩層含義,既包括了「簡體中文環境下該專名繁/異體字寫法出現的普遍程度」,也包括了「在中文維基百科出現的頻率」,均高者稱「通用度」高。
外部連結
- 《通用規範漢字表》(2013年08月19日發布,中國大陸用字規範)