第14部分(第2/4 頁)
呂振羽深深吸了一口氣,腦子裡迴響著在家裡的電腦上模擬各種翻譯的成果。掌握了大量知識的小羽才能真正揮語義和語用為平臺的語音和新的全部功能。其實,翻譯軟體,嚴格地說只是語音平臺的一個相當高階的外掛而已,只不過,這個外掛的功能之強大,會掩蓋住語音平臺的光芒。
語音平臺是一個內外兩層的大型程式,外部是語音的輸入和輸出,但真正關鍵的則是以智慧核心為基礎的語義和語用判斷機制。而這個機制,同樣是一個兩層的結構,一層是語義和語用的甄別,另一層則是按照具體語用和語境,進行組織,從而生成具有相當強的可讀性的句子,而作為這一層功能的底子,仍然是非常主流的結構語法學。結構語法學是有缺陷的,比如,在中文裡,很多具體例子都無法用結構語法學去套用。比如“春風又綠江南岸”的這個綠字,語文老師們都會說這個綠字用得好,有色彩也有動態,但是從語法學上來說呢?綠是形容詞,怎麼就能做謂語呢?如果翻譯成英語,大概會是make江南岸green的片語來表示,但中文裡怎麼解釋?現代漢語的語法是從歐洲對結構語法學的方法裡脫胎而出的,而古文似乎從來不講究什麼語法。於是,老師們或許會說,中文就可以這麼用,而到了後來,有一種解釋很有趣,老師不說是主語謂語賓語,而是說佔據主語位置佔據謂語位置佔據賓語位置。……這個解釋算是通順了,但對於程式設計師來說,如果沒有一個出色的判斷機制,是沒有辦法好好處理中文的翻譯問題的,而其他語種之間,尤其是拉丁語系的語種之間,這個問題簡單得多。結構語法學的慣例是主流,而例外相當少,至少,在日常使用的方面,例外相當少。文學……尤其是詩歌,那就沒辦法了。
呂振羽的翻譯軟體的機制很簡單,同樣呼叫語義和語用的判斷機制,將輸入的語音或者文字變成一個意義串,然後套用另一個語種的結構語法和詞庫,以這樣的方法來完成翻譯。這種翻譯,已經能比較良好地進行整句/全文翻譯,而最恐怖的功能,則是這個軟體能進行同聲口譯。設想一下,高階口譯證書是一個怎麼樣恐怖的東西,而那還只是中文與英文之間的口譯,而呂振羽開的這個基於語義和語用判斷的翻譯軟體,只要需要,幾乎可以進行任何語種之間的同聲口譯。
在開這個軟體的最初產品的時候,呂振羽將所有適用結構語法學的程式設計全部交給了小羽,而自己專心研究特例的處理,這項工程開始了沒幾天,已經取得了相當讓人驚異的成果。小羽已經完成了數十種語言的結構語法學程式設計,對於小羽來說,這些工作只用了不到一個工作日。而呂振羽還在拼命研讀各個語種的教材和字典,目前,英語的特例補充包基本完成了,法語完成了一部分,而中文……由於特例實在太多,只好一邊分析一邊建立這個庫了。
呂振羽仍然是不緊不慢地將自己已經取得的成果說給大家聽,當然,隱去了小羽在其中的極為重要的作用。看到大家看著他的目光漸漸變得狂熱和崇拜,呂振羽的臉在燒。
“你的這個軟體什麼時候能完成?”路德坤熱切地問。他知道,這個軟體只要一問世,肯定會掀起一陣狂潮,困擾中國人,尤其是中國學生多年的外語問題一下子就會變得不重要了。世界上的任何一個人,與素昧平生的任何一個外國人交流,也將變得輕鬆簡單。當然,這都要這個軟體足夠完美,完美到不因為語種差異而產生誤解。
“工作量太大了,所以我今天提出來,準備交給實驗室繼續完成阿。”呂振羽苦笑道,這種重複性的工作,小羽也已經出手幫忙了,但一方面,語言方面的資料處理量極大,而另一方面,呂振羽作為一個個人,能獲得的語言資料也有限,根據他在市場上東奔西跑買來的各種資料構建的這個平臺,肯定存在不少問題。
“這個專案
本章未完,點選下一頁繼續。