Google消除語言障礙 機器翻譯獲重大進展
3 S1 c& `2 }0 L- f; ~4 a
( Z( \: \7 k! f- W" I5 g--------------------------------------------------------------------------------
3 ^/ O5 F. I' S+ L7 L 3 W( r! ] u) L4 M5 f4 d5 b
http://www.sina.com.cn 2005年06月13 11:38 eNet硅谷動力
* |7 H! D" [/ G- [4 Y: G
+ j8 ^+ O7 K E& c! S6 X. G) k 作者: 時之砂 8 a" u$ j$ e! }! `* l1 {7 o
0 n C: [+ a& T* M 【eNet硅谷動力消息】本月晚些時候,美國政府下屬的國家標準與技術研究所將宣佈多個機器翻譯系統的測試結果。受到褒揚的可能不是大學的語言學項目,而是擁有全球最大搜索引擎的Google公司。該公司的顯著成功表明,在這個由於人類語言的細微差別和模糊含義而充滿艱難險阻的領域,新的翻譯手段(以數學方法取代語言學技巧)可能會引領我們取
3 g' ]* b+ q+ F- U5 \+ b( c# Z6 Z) O $ R9 @" r+ O) x6 g8 `" S8 d
+ Q4 x8 T) Y& R# X% V& Y7 @
, W! U- h% |; [. p
* S5 }3 t& i9 e8 c- ^) u ) k; \2 O3 O( m& c( @# i
得進展。
) B w- S4 V/ P7 | h! s
2 W" m' M/ X8 Q# h8 \; o. w: c6 l; k 負責Google公司機器翻譯研究的弗朗茨.奧赫說:「我手下的人都不懂漢字。」但是他們的英漢和漢英翻譯越來越準確。其他幾種語言的翻譯也是如此。 g1 y. U7 ^) x. b0 T4 O
; q0 F% u* g" }( @1 {
奧赫說:「幾年前還達不到這樣的翻譯水平。」不過,越來越快捷的數據處理和不斷增多的網上文件改變了局面。他說,Google向電腦中輸入了100萬本書籍的內容,還利用了諸如聯合國文件譯本等資源,從而改進了機器翻譯項目的規則系統。 Y% H6 l% J' C: O6 U2 T! z, ^
9 `' P9 i- ]; V* ~* Y1 L Google的機器翻譯系統目前仍處於研發階段。不過既然在記者和行業分析人士雲集的場合談到該系統,也許意味著至少有一種試用版本將在數月後問世。從2003年5月開始在網絡博客中介紹Google的菲利普.倫森說:「該成果給人以深刻印象,不同於你在因特網上看到的那種愚蠢的機器翻譯。」 4 E/ t7 A q" w, I0 V0 r
' a5 f; M2 z, {: y/ [: A1 M 倫森說,它可以作為Google網絡瀏覽器的一部分,使用者可以用母語進行網上搜索,他所看到的搜索結果則已經翻譯成了他的母語。 * y: ?0 S6 d( P# D
, c2 ?4 j0 U# B7 @" a: p 如今,網絡提供的幾乎所有翻譯服務都在使用Systran公司開發的翻譯技術。這家公司設在聖迭戈和巴黎,參與機器翻譯研究已有30多年,每天翻譯的網頁多達2500萬個。
' V2 n* b! P- e0 }( X: `5 r9 C& X% | o7 S- n- y3 v6 f
公司首席執行官季米特裡斯.薩巴塔卡基斯說,機器翻譯需要多年的艱苦努力來確立不同語言之間的翻譯規則。比較常見的就是利用統計學的方法。Google公司也是這樣做的。他說:「並沒有技術突破,所有人都在採取同一種方法。」 8 _8 a. U6 l6 m$ o8 o7 e' u! e0 a M6 T7 r
) o: g- F: N L
他說,如果在撰寫原文時比較細心,避開有歧義或含糊的語句,使之易於翻譯,則機器翻譯效果最好。儘管機器翻譯往往不太完美,但如果想快速瞭解網站內容,機器翻譯還是相當有用的。
% L1 X) F. L/ K- ]1 e% c: E3 S: W5 P9 B9 ]( ^+ Y7 k/ u
目前尚不清楚統計系統是否能完成難度較大的翻譯。不過它的效果如何並不只是向記者展示幾篇比較完美的翻譯範例那麼簡單。
$ m/ V* U; U+ {/ N6 y6 b/ T, ]+ J& _9 B! U. @7 c
評估翻譯質量也很困難。自2002年以來,國家標準與技術研究所一直利用一台名叫「藍色」的電腦開展評估工作。據說電腦的運轉情況「相當不錯」。 |
|