等周磊去倒了杯水回來後,軟體裡顯示:“現在的同聲翻譯軟體一點也不好用,你問它幹什麼?”
周磊原原本本的把張傑遇到的問題,告訴了駭客大佬。
大佬回了一串省略號,十分鐘後,他透過軟體傳過來一個軟體包。
周磊接收後,解壓後安裝,執行exe檔案的時候,提示缺少語音庫。
“嘿,大佬,你的軟體不全啊,還少語音庫。”
“懂個啥啊,加上語音庫你電腦都裝不下,你以為語音庫就是現成的?自己去弄。軟體目錄下面有一個生成工具,你看裡面的文件,自己去建語音庫。這個軟體不是那種傻兮兮的,切換到什麼語言就只能識別什麼語言的。”
“就是說我可以把很多種語言的語音庫都放在一起,軟體也可以自動識別出來。”
“就是這個意思,不然那些說話帶英文單詞的人會不會很難受。”駭客大佬回了話後,就不再搭理周磊了。
周磊把生成語音庫的工具單獨的複製出來,怎麼樣才能把各種語言的語音庫都收集到,這個可是一個巨大的工程啊。
還是先做常用的中文語音庫吧,去問兩家翻譯軟體公司買,估計人家都不願搭理你。
周磊還是用python吧,找一些影片網站,讓軟體在後臺開著,前面一直在放影片吧,這樣只要有足夠多的時間,就可以生成一個識別率至少四個九的語音庫。不過大夏國數不清的方言,就只能慢慢來了。
這活可不能在自己筆記本上跑,跑起來可能需要幾個月的時間。
周磊給整合商打了個電話,叫他們送了十臺低端的pc伺服器過來,國産的就可以了。然後在機房又租了幾個標準機櫃,讓整合商安裝好。
幾天後,周磊把工具軟體和自己寫的指令碼都放了上去,讓伺服器開始跑起來。
假如那天維護人員開啟這些伺服器連線的kv,就會發現螢幕上一直在播放著各種語言的影片,有電視劇、紀錄片、新聞等等,只要薯片站上有的,它就會隨機播放。
語音庫以一個肉眼可見的速度在緩慢變大,從0kb慢慢的增長為一個超過300gb的巨大檔案,這個還不止一個,是十個300gb檔案。
周磊估計到最後進行消重合並的時候,至少也會有1個多t的大小。
語音庫檔案的增長速度變慢,一天都不能增加100b,周磊覺得差不多了。他遠端把十個語音庫複制到了一個目錄下,現在的伺服器上的硬碟都插的多,而且還大,所以沒有什麼問題。
開啟了工具軟體,把匯入的目錄指向到了那個目錄裡,軟體立刻就發現了所有的語音庫檔案包,並且顯示出合併後的檔案大小。
周磊覺得自己小看了語音包的大小,合併後還有1.5tb,這個太大了。
忽然他發現還有一個按鈕顯示著“分割”,嘗試著點了一下。發現這個功能非常的好,可以把語音包分割成基礎包和網路包,或者是按照語種劃分,但那就沒有必要了。
按照語種劃分,就沒有翻譯的用處,只有語音轉文字了,但是這個用於語音輸入法還是不錯的,但周磊暫時沒有想要進這個不賺錢的行業裡。更何況“某飛”做的還算可以,只是有時候輸入法會犯傻,自己完全沒必要進這個紅海市場。
周磊選擇了基礎包和網路包,這樣軟體可以直接讀取一些常用單詞的語音庫,如果找不到對應的資料,就會上伺服器進行查詢。
這不就又是一門生意嗎?這個生意自己就能做,這樣就不用讓辦公室裡一群人天天無聊的要死。
周磊把基礎包複制到自己電腦上,然後開啟了同聲翻譯軟體,唸了幾句差不多非常簡單的中文對話句子,軟體就迅速的翻譯成了英語,這個是預設的選項。
在經過測試幾個科技文獻後,周磊發現了一個問題,能夠正常的識別中英文的語音,但是對於翻譯的質量差的太遠了。英語翻譯成中文沒有問題,中文翻譯成英文就好像幾年前的機翻或者中式英語。估計是自己讓軟體一直在國內網站上學習的原因,但是國外很多網站是不存在的。
那可怎麼辦?
有錢就有辦法,周磊挑選了一下,找了亞馬遜的雲伺服器服務,一口氣下了二十臺的整機的單子,租了一年,現在一點也不差錢,還要了無限流量。
同樣的他把工具軟體和修改後的指令碼往上面一扔,就等著十天半個月後的收割。
一個月後……
“各位同事,今天開這個會的原因是,我又開發了一個新的産品。”