Contents ...
udn網路城邦
Google翻譯與人工智慧再進化步步...
2018/10/13 08:17
瀏覽61
迴響0
推薦0
引用0
巴斯克文翻譯翻譯社

Google翻譯的下一步

Google翻譯的一猛進展:即時鏡頭翻譯

提早截斷(Early cutoff): 合時地截斷或捨棄起原句子裡的單詞,增強數字與日期翻譯與簡短、罕見字串。最後是名詞與品牌翻譯。

由於全球有跨越50%的網頁為英文網頁翻譯社而全球只有約20%的生齒利用英語,是以Google 翻譯辦事有多達 95%的流量來自於美國以外的區域翻譯此刻更整合Gmail等多種應用程式,且利用者僅需在 Google 搜尋列鍵入或用語音聲控輸入想要翻譯的內容,例如「OK Google,將「狗」翻譯成法文」即可執行翻譯。所以翻譯內容的再進化是有需要的。

Google翻譯的改變契機

十年前Google推出翻譯服務,並以片語式機械翻譯Phrase-Based Machine Translation、PBMT作為主要運算體式格局,運作體例是將句子切割成單獨的字和詞組做自力翻譯。從曩昔僅支援幾種說話,到而今可支援103種語言且天天翻譯超過1400億個單詞。別的,Google 翻譯產品司理 Julie Cattiau表示,台灣是成長最快的市場,Android 版年成長2倍,iOS版年成長60%。

記者葉立斌/台北報導

另一種神經收集應用的重點是各人常用的「即時鏡頭翻譯」(Word Lens)。Google 翻譯運用程式必需從鏡頭拍攝的圖片中找出目標文字,透過深度進修技術來辨識出每一個文字,系統將在我們的字典中尋覓並轉換出翻譯結果。

而從數年前,Google 採用遞歸神經網絡(Recurrent Neural Networks、NMT)將句子視為一個單元進行翻譯,取代曩昔的PBMT翻譯NMT僅需要較少的系統架構設計,也就是較簡單翻譯

不外和人類一樣是需要練習的,若練習時僅以「乾淨」的字母作為範本,生怕不適用。因為在實際世界中的字母可能會反射、有污垢、髒污以及因為各類身分受為了提供足夠的例子作為練習素材,Google 翻譯用「假」字母來模擬各式反光、點來模擬現實生涯中圖片出現的情境,以訓練機械的演算法,並達到有用且密集的神經收集訓練。

Google翻譯的曩昔

為改善 NMT的翻譯品質,研究人員提出很多技術來解決翻譯這傍邊包孕透過模擬調校模子(external alignment model)處理罕有字詞、利用「注意」(attention)來對準輸入詞和輸出詞和將詞拆解成更小的單元以應對罕見字詞等翻譯從此以後,翻譯系統不再是片斷式的翻譯,而是一次翻譯全部句子,所以語意更加流利,且接近母語使用者說法。藉由具有多層「神經元」(neurons)的「深度神經收集」(deep neural network),讓系統進修辨認句子中的模式和佈局,最後翻譯出語法更趨近平常談話、更順暢且易於浏覽的了局。

Google有一項許多人利用的服務「Google翻譯」在十年前推出,假如翻譯公司和我一樣,從Google翻譯剛推出時便已利用,也許記得初期的英翻中語意相當生硬、破裂,是以常有網友惡搞Google翻譯翻譯但現在你必然察覺紛歧樣了,不管是翻譯內容或功能都更像人翻的,這全仰賴人工聰明的提高。

▲你是不是用過即時鏡頭翻譯呢?(圖/Google 提供)

今朝此系統已導入共 41 組語言組合,包孕英/中、英/泰、英/日,英/韓,英/俄羅斯等對譯。



以下文章來自: https://www.setn.com/News.aspx?NewsID=249966有關各國語文翻譯公證的問題歡迎諮詢華碩翻譯公司02-23690932

限會員,要發表迴響,請先登入