国产毛多水多高潮高清_日韩精品在线一区二区三区_午夜福利在线观看波多野结衣_亚洲不卡女人视频_亚洲日韩欧美高清αv_成人AV片在线观看_全国最大的色欲综合网_浪潮A v色综合久久天堂_不卡无码一级偷拍_国产午夜91福利一区二区

機(jī)器翻譯遠(yuǎn)未達(dá)到替代人工的程度

作者:江蘇翻譯小編(南京翻譯公司) 發(fā)布時(shí)間:2018-08-28 23:12???? 瀏覽量:
我仍舊認(rèn)為,以Google Translate目前的水平,依然尚未達(dá)到中文媒體所吹捧的那種“可以替代人工翻譯”的程度。不管是針對(duì)文學(xué)作品,還是學(xué)術(shù)論文,甚至日常的辦公(比如網(wǎng)站的英文對(duì)照)來(lái)說(shuō)。取得突破性進(jìn)步并不是我們忽略瑕疵和不完美的理由。關(guān)于這一點(diǎn),Google同樣在其博客中給出了對(duì)比說(shuō)明(見(jiàn)下圖):


 
注:頂上虛線(xiàn)為完美的翻譯;紅線(xiàn)為人工翻譯水平;綠線(xiàn)為谷歌神經(jīng)機(jī)器翻譯(GNMT)水平,藍(lán)線(xiàn)為基于短語(yǔ)的機(jī)器翻譯(PBMT)。
 
在給出的五個(gè)語(yǔ)言對(duì)中,我們可以明顯地看到,同屬于印歐語(yǔ)系的英語(yǔ)、法語(yǔ)和西班牙語(yǔ)在互譯時(shí),GNMT水平則更加接近于人工翻譯水平。而漢語(yǔ)屬于漢藏語(yǔ)系,所以不管是漢譯英還是英譯漢,GNMT和人工翻譯之間尚有一定的差距。
 
具體來(lái)講,我認(rèn)為GNMT的困難之處仍有以下幾個(gè)方面,這也可能是Google正在試圖解決可以繼續(xù)提升的方向(以下以中英翻譯為例):
 
1. 成語(yǔ)、諺語(yǔ)、歇后語(yǔ)的翻譯。Google需要將中英詞典中現(xiàn)成的詞條集成到自己的翻譯數(shù)據(jù)庫(kù)。這個(gè)對(duì)于Google來(lái)說(shuō)難度不大。(知乎網(wǎng)友拿《百年孤獨(dú)》的開(kāi)頭調(diào)教GNMT,簡(jiǎn)直太傻,他大概沒(méi)想到Google Translate的爬蟲(chóng)可能早已爬過(guò)這句的各種譯法并利用算法做了最佳優(yōu)化。)
 
2. 流行語(yǔ)的翻譯。這也是這次社交網(wǎng)絡(luò)上網(wǎng)友們各種奇葩例子所詬病的。不過(guò)據(jù)說(shuō)GNMT用的是和AlphaGo同樣的一套智能系統(tǒng),所以這個(gè)對(duì)于Google來(lái)說(shuō)難度也不大。畢竟那條Alpha狗具有超強(qiáng)的自我學(xué)習(xí)能力,輔之以Google龐大的信息庫(kù),超越人類(lèi),指日可待。(有網(wǎng)友發(fā)現(xiàn),“圖樣圖森破”的翻譯已經(jīng)更新了。LOL)
 
3. 詩(shī)詞的翻譯。在目前翻譯版本參差不齊和數(shù)據(jù)不全的情況下,這可能是一個(gè)難點(diǎn)。不過(guò)新版的GNMT提供了在線(xiàn)更正/更新功能供用戶(hù)使用。有一點(diǎn)類(lèi)似于維基百科的貢獻(xiàn)與共享模式。眾人拾柴火焰高,大家一起建立翻譯記憶庫(kù)(Translation Memory)。
 
4. 翻譯時(shí)同義詞、近義詞的選擇(尤其是形容詞)困難。可能漢語(yǔ)作為一種表意語(yǔ)言,所以英譯中時(shí)這個(gè)問(wèn)題會(huì)更加突出和困難。尤其在文學(xué)作品的翻譯中,這一點(diǎn)將會(huì)被更加明顯地放大。這屬于GNMT需要分析翻譯對(duì)象所處的上下文語(yǔ)境(Context)的情況之一。
 
5. 中文語(yǔ)言中介詞的模糊使用導(dǎo)致的翻譯困難。不同于詞性和語(yǔ)法清晰的英文,中文在太多的情景下,介詞是模糊使用甚至省略的。亦可以說(shuō)是中文狀語(yǔ)要遠(yuǎn)遠(yuǎn)比英文狀語(yǔ)表現(xiàn)地曖昧(包括時(shí)間、地點(diǎn)、方式等等)。所以這也是另一種需要分析上下文語(yǔ)境的情況。
 
6. 中英文時(shí)態(tài)和語(yǔ)態(tài)的差異給翻譯帶來(lái)的困難。眾所周知,中文的動(dòng)詞本身不會(huì)因?yàn)闀r(shí)態(tài)的不同而產(chǎn)生變形,表達(dá)過(guò)去、現(xiàn)在和將來(lái)更多的是靠不同的助詞或者嘆詞或者時(shí)間名詞來(lái)完成(比如強(qiáng)調(diào)過(guò)去式或者完成式可能需要用“了”,而口頭強(qiáng)調(diào)將來(lái)式通常并不會(huì)生硬地去講“我將要如何”而是直接用“明天”一詞輔助。)語(yǔ)態(tài)就更不用說(shuō),講“挨罵”一定比“被罵”地道的多,使用頻率也高。
 
7. 中英文句子結(jié)構(gòu)和語(yǔ)法的差異帶給GNMT的翻譯困難。中文是有語(yǔ)法的,但是講中文的時(shí)候我們又很少顧及語(yǔ)法。而英文不管是句子結(jié)構(gòu),還是語(yǔ)法,遠(yuǎn)比中文要來(lái)得嚴(yán)格縝密。這樣大結(jié)構(gòu)的差異則會(huì)帶給Google Translate巨大的困難。所以如果你用新的GNMT分別測(cè)試簡(jiǎn)短的句子和復(fù)雜的長(zhǎng)句,翻譯表現(xiàn)則有云泥之別。
 
因此,Google Translate雖然在取得里程碑式的突破技術(shù)的同時(shí),但要想達(dá)到人工翻譯的水平,甚而向“完美的翻譯”(Perfect Translation)看齊,仍有很長(zhǎng)的路要走,很多的困難亟待解決。但是,以當(dāng)前的科技(比如人工智能)發(fā)展速度推測(cè),機(jī)器的進(jìn)步和提升一定會(huì)越來(lái)越快,進(jìn)而對(duì)相關(guān)行業(yè)產(chǎn)生顛覆性影響,比如可以遇見(jiàn)的便是,語(yǔ)言學(xué)習(xí)的必要性會(huì)越來(lái)越低,語(yǔ)言教師和翻譯人員的需求同樣會(huì)降低,再或者翻譯公司和語(yǔ)言培訓(xùn)機(jī)構(gòu)的倒閉,再近一點(diǎn),計(jì)算機(jī)輔助翻譯工具(CAT:Computer Aided Translation,比如當(dāng)前流行的Trados、MemoQ、雪人等)的消失和各大高校MTI專(zhuān)業(yè)的不再吃香。
 
這也是歷史發(fā)展的必然趨勢(shì),和18世紀(jì)蒸汽機(jī)的發(fā)明引起的第一次工業(yè)革命最終解放手工勞動(dòng)有著相同的原理。