Contents ...
udn網路城邦
機器翻譯的發展
2025/04/08 10:59
瀏覽196
迴響0
推薦7
引用0

機器翻譯從上世紀中葉發展以來,經歷了規則式機器翻譯(Rule-Based Machine Translation)、統計式機器翻譯(Statistical Machine Translation),乃至於現今蓬勃發展的神經式機器翻譯(Neural Machine Translation),一路走來雖曾遭遇瓶頸,但隨著技術日益成熟,機器翻譯現已於各界廣泛使用。以下概述這三種機器翻譯技術的演變和特點 

1.      規則式機器翻譯:始於1950年代,其原理是先由專家定義不同語言間的語法結構和語意對應規則,並將這些規則轉換為電腦可處理的編碼形式,自動生成目標語的譯文。然而語言現象極為複雜且例外眾多,譯文品質必須依賴能否匹配既定規則。因此產出的譯文往往不夠自然,且容易出現錯誤。 

2.      統計式機器翻譯:1990年代隨著電腦運算能力和網路資料的成長,統計式機器翻譯應運而生。此技術不需預先定義語法和語意規則,而是基於大量平行語料庫和統計模型,計算出機率最高、最有可能與原文對應的詞彙或句子,再自動生成譯文。2007Google Translate便是以其龐大的語料優勢採用此模式。雖然比規則式機器翻譯進步許多,但統計式機器譯文品質依然有限,常出現語句不夠通順、語境不夠貼切的問題。

3.      神經式機器翻譯:自2015年後神經式機器翻譯崛起,並以深度學習(Deep Learning)技術為基礎,透過大規模平行語料進行訓練,使機器能夠自動學習並找出翻譯規律。2016Google Translate採用神經網路技術,2017 DeepL也加入行列。與前兩代技術相比,神經式機器的譯文較為自然流暢,整體品質大幅提升。而隨著深度學習模型的持續進化,機器翻譯的準確性也不斷提高。

在規則式和統計式機器翻譯時期,譯文多顯得生硬呆板,經常是一對一的文字對譯,缺乏語境調整能力,導致誤譯頻出,甚至引發笑話。當時譯者都覺得要將機器譯文修訂至可用的成品所需調整幅度過大,還不如自己重新翻譯。然而隨著神經式機器翻譯的進步,譯文的自然度和準確性提高,修訂所需的調整幅度越來越小。對譯者而言不僅省時省力,且有助提升翻譯效率。因此機器翻譯現已成為實用且具參考價值的工具。
有誰推薦more