機器翻譯的道路還任重道遠。機器翻譯為什么會出錯呢?原因是因為人與人之間溝通中處在一個語境里,說話過程中,根據(jù)不同的情況大部分會省略主語、謂語、賓語等。人與人之間直接溝通過程中,因為處在一個語境里,即便省略也能夠去連接上下意思,能夠去理解,而機器翻譯他翻譯的就是所說的、所寫的部分,省略的部分就會不翻譯。這僅僅是機器翻譯錯誤的一個案例,對于稍微長一些的一句話,機器翻譯會因為句子成分排列、兩個語種詞性差異等多種原因出現(xiàn)錯誤。
目前的機器翻譯純粹是走算法和統(tǒng)計的路線。即跨語言人工智能核心要素在于兩點:一是NMT(神經網絡機器翻譯技術),二是海量的高質量語料。這跟真正的語言學并沒有什么關系。
GNMT沒有利用語言學的原因就是:語言本身就是規(guī)律性極低?;蛘哒f人類對語言學及人腦處理語言技術還沒有掌握其規(guī)律。人工智能的可行性就是掌握大數(shù)據(jù)并且發(fā)現(xiàn)其中之規(guī)律,而對于難尋規(guī)律的語言來說谷歌僅僅是掌握了目前僅有的數(shù)據(jù)。它不是真的掌握了這門語言,而是每當有人給出新句子,它就從翻譯好的數(shù)據(jù)庫里“學習”,根據(jù)已有的翻譯 “猜”這一句的意思,意思就是“識別”出最有可能的已有翻譯。正確地將英文翻譯成中文,但它仍然不懂英文,也不懂中文。實際上每天都有大量的新的數(shù)據(jù)更新,涌現(xiàn)出來,關于之前沒有“接觸”過的新數(shù)據(jù),GNMT就無法翻譯。
機器翻譯在重大場合犯錯其實不是一次兩次,比如科大訊飛、搜狗等都因為機器翻譯出過事故。在2016年的烏鎮(zhèn)互聯(lián)網大會上,王小川首秀搜狗實時機器翻譯,就在演示過程中不斷出現(xiàn)“中式英語”的尷尬,甚至將“飛機落地”翻譯成了有“墜機”之意的“fell down”。
因此,如果要說機器翻譯的作用,它的真正作用就是解決極其簡短的翻譯,或者只是為了了解句子的大意,但是這也不能保證句子出現(xiàn)翻譯錯誤的情況。機器翻譯更多的是針對專業(yè)翻譯人員的使用,在機器翻譯的基礎上,再對機器翻譯錯誤的部分進行修改,縮短翻譯時間,提高翻譯效率。
可以看出,目前人類對語言的研究及人腦如何進行語言的模糊識別和判斷沒有最終明了的情況下,即便機器有數(shù)據(jù)庫支撐,但對于規(guī)律性極低的語言機器翻譯達到100% 的準確率是完全不可能的。語言是載體,傳遞的真實信息才是內核。翻譯工作根本上不是純粹依靠具體的語言工作在做翻譯,而是翻譯人員從多年來所掌握的與人有關的知識庫中提取所需要的知識,根據(jù)被翻譯人員話中的隱喻及其微表情來做具體處理的。
另外,現(xiàn)有的翻譯軟件只能是在周圍環(huán)境安靜、說話者音量語速適中才能正常使用。在大型會議中,機器翻譯同步翻譯在屏幕上,人們對著屏幕讀文字,對于信息接受者而言視覺效果遠不如聽覺效果,吸收率低。
機器翻譯的原理與局限
作者:江蘇翻譯小編(南京翻譯公司)
發(fā)布時間:2019-08-12 00:02????
瀏覽量: