第44部分(第1/5 頁)
無奈之中,他啟用了初音娘,呢喃地詢問:“我們目前有沒有可能弄出比已經發布的那個‘萬能輸入法’更加強大的拼音輸入法?要有劃時代的進步性的。”
初音娘磁性的聲音絲毫不帶感情,輕描淡寫地說:“當然有可能。”
顧莫傑一骨碌從床上坐起來,語氣帶著激動和責問:“怎麼個可能法?你怎麼不早說?”
初音娘略帶無辜地反問:“你又沒問過我,我怎麼知道你有這個需求?人家只是一個計算機,不是人類。你問我答,天經地義,你還指望我出謀劃策?”
顧莫傑一想確實是這麼回事,人工智慧走到初音娘這一步,能夠對人類的需求有問必答,不管答對答錯,已經是很難能可貴了。對方並沒有自我意識,也不可能主動為主人謀劃。看來,還是自己對初音娘用得太少、問得太少了,沒有充分進入一臺智慧機的主人這個角色。
想明白了這一點,顧莫傑也不去糾結,單刀直入就問:“那你就說說,如果我們現在重新寫一款軟體,可以比目前放到網路上的那個‘萬能輸入法’增加哪些功能?”
初音娘有條不紊地自檢了一下,然後答道:
“首先,目前放上去的那個輸入法,終究是要依靠不停更新版本來升級詞庫的。比如我們從2月份的1。0版本,到如今的1。3、1。4,每蒐集幾個月的詞頻資訊之後,就會升一次版本。這一點就很不智慧,而且在網路新詞增長速度越來越快的當下,新出現的詞彙並沒有辦法馬上進入到使用者詞庫中去。
如果現在重寫一個版本,我們可以把‘線上實時更新詞庫’的功能加上去,讓客戶的詞庫在不知不覺中自動保持最新。
其次,原來的輸入法只有單向蒐集使用者輸入習慣和使用者主動構詞資訊的能力,並沒有實時讓使用者共享這些輸入習慣的設定。哪怕是對單個使用者本身,我們也沒有開放學習並記憶其輸入習慣的功能。這一點,目前如果重寫一個輸入法的話,也可以解決掉。
最後一點,則是我們原本缺乏對不同型別使用者提供定製化細胞詞庫的服務,比如有兩個使用者,他們同樣打hui-wu這樣的拼音,第一個使用者是個秘書,他可能希望打出‘會晤’這個詞;而第二個使用者是寫散文的,或許他就希望打出‘悔悟’這個詞。要知道即使是最大樣本的詞頻統計,也只是對最接近大眾的使用者最最佳化,而非對每一個使用者定製化地最最佳化。只有加入了細胞詞庫,讓輸入法在服務文秘使用者的時候給一種詞頻,給普通使用者的時候另一種詞頻,二筆使用者的時候第三種詞頻,才能精確抓住所有人。”
初音娘blabla說了一大堆,顧莫傑越聽越是驚喜。
其實如果不是他對後世的記憶已經被洗得七七八八的話,說不定此刻他就會驚訝萬分:這不就是2006~07年左右才上市的“搜狗拼音輸入法”才做到的功能麼?當然了,07年左右的搜狗,也只做到前兩點改進而已,至於定製化設計和細胞詞庫這些功能,後世的搜狗其實都是到了08~09年光景才慢慢發展出來的。
隨後,顧莫傑又冒出了一個新的問題:“那為什麼半年之前我們做不到這些功能點?當時是因為什麼障礙,導致沒法一步到位的?”
“當時咱剛剛到這個時空,人家又沒有2050年的雲端資料庫可以呼叫,當然沒法一步到位。如今好歹透過軟體商那個蒐集使用者習慣資料的後門,花了這半年,勉強蒐集夠了所需的大資料,有了素材基礎,才能解鎖這些新功能點的。”
顧莫傑一聽確實是這個道理,沒有繼續追問下去。
不過初音娘卻沒有說完,頓了一頓,似乎覺得顧莫傑已經入彀,才狡黠地補充道:“還得提醒你一點,如果你真的準備按照剛才所說的三個技術要點升級的話,你可得多弄