Google翻譯的發展進程快速,10年前,Google推出翻譯服務,並以片語式機器翻譯(Phrase-BasedMachine Translation)作為主要運算方式。從過去僅支援幾種語言,到現在可支援103種語言,且每天翻譯超過1400億個單詞,Google翻譯的品質有了很大的進展。
為改善NMT翻譯品質,研究人員提出許多技術來解決,這當中包括透過模擬調校模型(externalalignment model) 處置懲罰罕有字詞、使用「注意」(attention)來對準輸入詞和輸出詞,以及將詞拆解成更小的單元以應對罕見字詞等。
(中心社記者潘智義台北3日電)Google台灣董事總司理簡立峰說,Google翻譯比之前好用太多了!就算有人惡作劇,銳意在「提出修改建議」欄位寫下錯的翻譯,也不會影響系統的運作。現在也有人提出讓AlphaGo打AlphaGo,進修能力可以更快的說法,就像是金庸小說「華山論劍」裡全真派的周伯通,用本身的左手和右手對打,使出的「閣下互搏」翻譯
" data-reactid="15">他指出,機器學習是很主要的議題,人人在計議Google翻譯的進修功能之際,也會聯想到人工電腦AlphaGo打敗真人世界棋王。過去,為翻譯任意兩種語言,Google需要建構多個不同的翻譯系統,運算成本相當可觀。相較於過去的片語機器學習(PBMT),神經機器翻譯(NMT)僅需要較少的系統架構設計翻譯剛開始推出神經機器翻譯時,這兩種翻譯方式的精準度不相上下。相較於過去的片語機械進修(PBMT),神經機械翻譯(NMT)僅需要較少的系統架構設計。
注意 (Attention)功能是為了每步都產出准確的詞,解碼器將針對編碼中文向量裡最相幹的英文單詞權重分布(weighted distribution)進行解碼。" data-reactid="12">簡立峰诠釋,Google翻譯有進修及資料庫的功能,不斷積累經驗,錯誤也是一種經驗,除非幾近所的人都在「點竄建議」欄寫下一模一樣的毛病,才會積非成是,但事實上這類環境其實不可能發生。
數年前,Google採用遞歸神經網絡(RecurrentNeural Networks)將句子視為一個單位進行翻譯,之後的片語式機器翻譯方式(PBMT),則是將句子切割成單獨的字和詞組做獨立翻譯。
在讀取完整句子後,解碼器(Decoder)就會開始運作,一次產生一個英語句子中的一個詞。
Google神經機械翻譯(GNMT)將中詞句子翻譯成英詞句子的進程,透過編碼器 (Encoder),起首,GNMT將中詞句子的每一個單詞進行向量(vector)編碼,而每個向量將顯示出目前為止單詞被讀取到的所有意義翻譯
其實不只簡體中文、繁體中文的語法相同,他透露,日文、韓文在機械翻譯上也可算是語法溝通,用統一套系統。
本文出自: https://tw.news.yahoo.com/google%E7%BF%BB%E8%AD%AF%E4%B8%8D%E6%80%95%E6%83%A1%E4%BD%9C%E5%8A%87-%E5%有關翻譯的問題歡迎諮詢華頓翻譯社
留言列表