縮和語音搜尋匹配演算法一直是克里最佳化的倆個重點。
克里一直在不停地模擬改進提取語音語義特徵值的演算法,透過不斷壓縮冗餘值,在保持不失真的情況下持續不斷縮小語音樣本語料庫大小,另外一方面也不斷改進對語音語料庫智慧搜尋匹配演算法。
最佳化演算法杜克幫不了什麼忙,但是收集儘可能多的語音樣本杜克卻沒有問題,所以杜克的每一天都過著一種非常充實的生活,日復一日地搜尋下載不同型別的語音樣本供克里分析提煉,同時不斷去學習理解克里所創造的這些全新的處理演算法,要敲開麻省理工的大門。
杜克必須要有一篇體現自己能力的世界領先水準的語音識別基礎理論創新性論文,可是在克里的知識庫中並沒有現成的語音識別知識,這些對於克里來說太老舊了,老舊到比萊姆都沒有為克里增加這些知識。
而克里現在做的就是在地球上現有語音識別理論和演算法基礎上,利用他強悍到無邊的模擬能力,不斷地模擬各種不同的語音處理演算法。
透過模擬來找到一種更加有效的——這種方法雖然有些笨拙,但是有了克里超強的運算能力,畢竟每秒鐘成千上萬種可能演算法都可以模擬,使得這種笨拙的方法也有相當的效果,找出了好幾種可能的最佳化演算法,將識別率和反應時間提升到了一個新的高度。
可是要將這些成果用地球人能夠理解的語言和理論寫出來,還要讓人能夠看懂,不管是對克里還是杜克來說都是一個新挑戰,因為克里不是以01為核心的機械二進位制思維模式,而是生物多型思維模式。
儘管克里現在已經能夠瞬間同時模擬出地球上常見十多種不同效能PC機虛擬機器——為了讓克里能夠準確瞭解地球上電腦的運算能力,杜克買了四臺不同介面的主機和接近二十塊市面主流PC機CPU提供給克里分析和測試效能基準,然後克里根據這些配置的效能來進行虛擬對應的模擬器。
可是這些特殊的虛擬機器由於不需要讓人理解,所以克里完全可以按照自己的運算方式來創造,因此效能雖然相當,但是實現模式卻大相徑庭,比起地球上RISC和CISC倆種不同架構的CPU來說,複雜程度都不是一個數量級的。
因此在克里完成了按照他自己模式實現的演算法後,還要按照地球上01規則來重新實現,這個對於克里來說確實是一種巨大的挑戰了,更別說論文還要在此基礎上再次抽象,不光要有軟體實現演算法,還要建立起以地球數學基礎能夠證明的數學模型。
因此克里幾乎二十四小時不間斷地不斷運轉著,最終模擬演算法能夠在最低基準上面實現1秒內達到97%識別率,而在雙核2G主頻電腦上實現1秒內99%以上識別率之後,足足又用了倆個周的時間。
在杜克看完十幾本數學專著,下載研究了好幾個開源語音識別軟體的基礎上,克里才完成了語音識別新演算法的論文和協助杜克開發完成一個在地球電腦上執行的語音識別軟體。而這個語音識別軟體的第一個應用就是包裝成為一種語音輸入法。
海角論壇。完成語音識別軟體和論文寫作倆個任務,杜克現在是一身的輕鬆。
他註冊換了一個馬甲加入到一個對克里的戰爭劇情發展討論貼中,為了測試新軟體,只見他對著電腦麥,儘量模仿各種不同的腔調口音說著話,這些話很快就被電腦識別變成文字去回覆論壇中各種文青對人物和劇情的分析。
杜克對劇情瞭若指掌,分析起來當然頭頭是道,往往是一大段一大段的精闢分析,很快就引起了粉絲們的關注,當然有了語音識別輸入,杜克的雖然回覆內容實在,可是每次回覆卻還是比論壇中任何人都要快速。
感覺就算比起專業速記人員也毫不遜色。
“嘿,哥們你用的是神馬輸入法,怎麼回覆那麼快,幾乎是秒回了?”一個文青終於忍受不了杜克這種飛一般的回覆速度的好奇,忍不住發問了。
什麼輸入法?杜克一愣,隨即反應過來,自己為了測試剛剛開發出來的語音識別輸入法,一時間沒有注意控制速度,沒想到如此拉風的秒回竟然不知不覺就引發了關注。
“一種新型的語音輸入法。”杜克變幻著用一種類似老趙的鐵嶺聲音說道,立刻電腦螢幕上準確將他的語音轉換成文字,收錄到的老趙語音樣本不少,識別率自然完全沒有問題。
在剛才的討論中,杜克已經用他能夠想出來的所有發音方式進行了模擬測試,識別準確率百分之百,雖然他現在只是將電視機聲音調小作為背景噪音,離一個複雜噪音