Apertium
Apertium是一個機器翻譯平台,由西班牙政府和加泰羅尼亞自治政府撥款支持阿利坎特大學開發,為一個以GNU通用公共許可證條件發行的自由軟件。
Apertium原是OpenTrad (頁面存檔備份,存於網際網路檔案館)計劃中其中一個機器翻譯引擎,原意為關係密切的語言之間互相翻譯。不過現在Apertium已經發展到可以為分野較大的語言之間翻譯。要創立一套新的語言翻譯系統,只需將有關語言的相關資料,即字典與文法規則,放入既定的XML格式便可。
阿利坎特大學與維戈大學、加泰羅尼亞理工大學、 Pompeu Fabra大學合作,Apertium現已有下列語言的相關資料:西班牙中的羅曼語族語言如西班牙語、加泰羅尼亞語和加里西亞語、英語、葡萄牙語、法語、奧克西唐語以及羅馬尼亞語。
Apertium是一種轉化原則法的機器翻譯系統。字詞翻譯時會用有限狀態置換器,詞性辨別時會用隱馬爾可夫模型。
Apertium目前(2020年12月)的穩定版本支持51組語言之間的互相翻譯。[1]
歷史
Apertium起源於項目OpenTrad中的其中一個機器翻譯引擎,該項目由西班牙政府資助,由阿拉貢大學的Transducens研究小組開發。它最初設計用於在密切相關的語言之間翻譯,但最近已經擴展到處理更多的語言對。若要創建新的機器翻譯系統,你只需要以良好規定的XML格式開發語言數據(字典,規則)。
為此開發的語言數據目前支持(穩定版本)阿拉伯語,阿拉貢語,阿斯圖里亞斯語,巴斯克語,布列塔尼語,保加利亞語,加泰羅尼亞語,丹麥語,英語,加泰羅尼亞語,世界語,法語,加利西亞語,印地語,冰島語,印尼語,意大利語,哈薩克語,馬其頓語,馬來西亞語,馬耳他語,北薩米語,挪威語,奧克西唐語,葡萄牙語,羅馬尼亞語,塞爾維亞克羅地亞語,斯洛文尼亞語,烏爾都語和威爾士語。
項目參與了2009,[2] 2010,[3] 2011,[4] 2012,[5] 2013[6]和2014[7]年版的Google Summer of Code及 2010,[8] 2011,[9] 2012,[10] 2013,[11] 2014,[12]2015[13]及2016[14]年版的Google Code-In。
相關條目
- 機器翻譯應用軟件的比較
- 機器翻譯
- Matxin
參考資料
- ^ Apertium. wiki.apertium.org. [2020-12-21]. (原始內容存檔於2021-01-13).
- ^ Accepted organizations for Google Summer of Code 2009. (原始內容存檔於2016-04-25).
- ^ Accepted organizations for Google Summer of Code 2010. (原始內容存檔於2016-04-04).
- ^ Accepted organizations for Google Summer of Code 2011. (原始內容存檔於2016-04-01).
- ^ Accepted organizations for Google Summer of Code 2012. (原始內容存檔於2016-04-03).
- ^ Accepted organizations for Google Summer of Code 2013. (原始內容存檔於2016-04-03).
- ^ Accepted organizations for Google Summer of Code 2014. (原始內容存檔於2016-04-27).
- ^ Accepted organizations for Google Code-in 2010. (原始內容存檔於2016-03-03).
- ^ Accepted organizations for Google Code-in 2011. (原始內容存檔於2016-04-01).
- ^ Accepted organizations for Google Code In 2012. (原始內容存檔於2016-04-03).
- ^ Accepted organizations for Google Code-in 2013. (原始內容存檔於2016-04-03).
- ^ Accepted organizations for Google Code-in 2014. (原始內容存檔於2016-04-27).
- ^ Accepted organizations for Google Code-in 2015. (原始內容存檔於2016-04-12).
- ^ Accepted organizations for Google Code-in 2016. (原始內容存檔於2016-04-12).
- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79-86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.