近期,東芝開發(fā)了支持中日、中英翻譯的會議支援系統(tǒng)。該系統(tǒng)使用公司最新研發(fā)的文本整理技術(shù)和關(guān)鍵詞抽取技術(shù),解決了會議中的專業(yè)術(shù)語、口語化發(fā)言等翻譯問題,使同聲翻譯的精度大幅提高。文本整理技術(shù),是將發(fā)言內(nèi)容分割成多個易翻譯的單元,再按正確語法整理成文的技術(shù);關(guān)鍵詞抽取技術(shù),是從會議資料中自動抽取關(guān)鍵詞的技術(shù)。按計劃,東芝將在內(nèi)部啟動運行,以測評該系統(tǒng)是否能達(dá)到預(yù)期效果。
隨著制造業(yè)的全球化及中國、印度等新興國家市場的日益增長,東芝與海外企業(yè)之間的會議交流使用外語的情況不斷增多,而不同語言導(dǎo)致的溝通障礙和誤解、翻譯成本增加、外語人才管理等,都已成為日漸突出的經(jīng)營課題。
當(dāng)下,語音識別和機器翻譯技術(shù)突飛猛進,尤其在旅行和購物等日常會話方面,已出現(xiàn)實用性語音翻譯工具。然而,會議中的專業(yè)術(shù)語和口語性發(fā)言等增加了翻譯難度,迄今尚未開發(fā)出適用于商務(wù)領(lǐng)域的實用化翻譯系統(tǒng)。為解決這一問題,東芝推出外語會議支援系統(tǒng)。
該系統(tǒng)采用東芝最新研發(fā)的文本整理技術(shù),即利用捕捉發(fā)言者口語化發(fā)言的共通性的規(guī)則型翻譯,與收集大量多樣化實例而逐漸改進的統(tǒng)計型翻譯,將難翻譯、難理解的語句修整為易翻譯句法和長度。而相關(guān)的文本整理網(wǎng)絡(luò)工具,可收集大量的文本整理實例和對整理結(jié)果進行高效評價,從而大幅提高文本整理的精度。
為防止未知詞匯造成的聲音識別精度和翻譯精度下降,東芝還研發(fā)了關(guān)鍵詞抽取技術(shù)。即從會議資料中自動抽取專業(yè)術(shù)語等會議所需詞匯,在會議開始前預(yù)先存儲該詞匯的正確翻譯。經(jīng)過文本整理后的原文,通過關(guān)鍵詞抽取技術(shù)和東芝獨有的統(tǒng)計型+規(guī)則型混合機器翻譯方式進行處理,對各種發(fā)言實現(xiàn)高品質(zhì)翻譯。
此外,東芝還開發(fā)了支持遠(yuǎn)程會議、面對面會議和演講的支援系統(tǒng)。使用該系統(tǒng)在公司內(nèi)部進行測評,日語能力測試二級或二級以上的測試對象對日語會議內(nèi)容的理解度從60%提高到80%,而日語能力測試二級以下或完全不懂日語的測試對象理解度則從30%提高到60%。該系統(tǒng)此前僅在開發(fā)部門內(nèi)部進行試運行,本次則將在包括5家中國當(dāng)?shù)毓驹趦?nèi)的東芝集團內(nèi)部投入試運行。東芝將在內(nèi)部應(yīng)用的基礎(chǔ)上,不斷積累內(nèi)部會議翻譯所需的語言數(shù)據(jù),在力爭將翻譯譯文的可理解度提高到80%以上的同時,不斷完善會議語音應(yīng)用系統(tǒng)的各項功能。
相關(guān)視頻請點擊:http://www.toshiba.com.cn/aboutus/dzsp/cpxc/video11.html
n東芝在中國
東芝是全球領(lǐng)先的多元化廠商,自1875年創(chuàng)立以來,推出了許多世界首創(chuàng)的商品和服務(wù)。近年來,東芝不斷加強優(yōu)勢產(chǎn)業(yè),推動能源、社會基礎(chǔ)設(shè)施、半導(dǎo)體存儲三大業(yè)務(wù)領(lǐng)域的發(fā)展,東芝自1972年進入中國市場以來,利用百余年所積累的經(jīng)驗及技術(shù),不斷地為市場推出了能夠滿足廣大客戶需求的新產(chǎn)品和服務(wù)。未來,東芝將繼續(xù)通過企業(yè)服務(wù)來間接改善人類生活,提供更加智能化、便捷化的產(chǎn)品和服務(wù),以實現(xiàn)安心、安全、舒適的社會為目標(biāo)。東芝將繼續(xù)積極企業(yè)社會責(zé)任,在中國各地開展公益活動,為社會的和諧發(fā)展貢獻(xiàn)力量。