平行文本
此條目需要補充更多來源。 (2013年12月) |
平行文本(英語:parallel text,又作平行語料)是與譯文並行放置的文本。平行文本對齊 是指確定平行文本中原文和譯文的對應句子。洛布古典叢書和克萊梵語叢書就是雙語文本的兩個例子。聖經參考書中可能會同時包含原文和譯文或者多種譯文,以便於比較和研究;俄利根的《聖經六國譯文合璧》為舊約並排提供了六個版本。另外還要注意的一個最著名例子是羅塞塔石碑。[1]
平行文本的大集合被稱為平行語料庫 (見語料庫)。在句子層面對齊平行語料庫是很多語言學研究領域的前提條件。 在翻譯過程中,翻譯人員可以對句子進行拆分、合併、刪除、插入或重新排列。這使得對齊任務變得異常重要。
雙語文本
在翻譯研究領域,雙語文本 是指由給定文本的源語言和目標語言版本組成的合併文檔。
雙語文本由一種稱為對齊工具 或雙語文本工具 的軟體生成,這種軟體可以自動對齊同一文本的原始版本和翻譯版本。這種軟體通常按句子對齊兩個文本。雙語文本的集合被稱為雙語文本資料庫 或雙語語料庫 ,可以用搜索工具執行查詢操作。
雙語文本和翻譯記憶庫
雙語文本 的概念與翻譯記憶庫的概念有一定的相似性。一般而言,兩者的最大區別在於,翻譯記憶庫是一種資料庫,裡面存儲的片段(匹配的句子)與原始上下文沒有任何聯繫;原始的句子順序是缺失的。而雙語文本則保留了原始的句子順序。但是,在一些翻譯記憶庫的實現方法中,是允許保留原始的句子順序的,比如翻譯記憶庫交換格式 (TMX)(一種用於在不同計算機輔助翻譯 (CAT) 程序之間交換翻譯記憶庫的標準 XML 格式)。
雙語文本在設計上用於譯員查詢,而不是機器查詢。因此,那些會導致翻譯記憶庫運行錯誤的輕微對齊錯誤或小差異並不是很重要。
哈里斯在其 1988 的一篇文章中也認為,雙語文本代表了譯員在大腦記憶庫中存儲源文本和目標文本的方式,但是這種假設並沒有後續研究。
相關條目
註釋
- ^ Ralf Steinberger Ralf, Bruno Pouliquen, Anna Widiger, Camelia Ignat, Tomaž Erjavec, Dan Tufiş, Dániel Varga. The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages. Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'2006). Genoa, Italy, 24-26 May 2006http://www.lrec-conf.org/lrec2006/
|conferenceurl=
缺少標題 (幫助). 2006. (原始內容存檔於2013-11-26) 使用|archiveurl=
需要含有|url=
(幫助).
參考文獻
- Harris, B. 'Bi-text, a new concept in translation theory', Language Monthly (UK) 54.8-10, March 1988.
外部連結
平行語料庫
- The JRC-Acquis Multilingual Parallel Corpus of the total body of European Union (EU) law: Acquis Communautaire with 231 language pairs.
- European Parliament Proceedings Parallel Corpus 1996-2011 (頁面存檔備份,存於網際網路檔案館)
- The Opus project aims at collecting freely available parallel corpora (頁面存檔備份,存於網際網路檔案館)