《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 俄科學(xué)家用人工智能破譯古代典籍

俄科學(xué)家用人工智能破譯古代典籍

2022-09-21
來源:新浪網(wǎng)

【環(huán)球時報(bào)綜合報(bào)道】俄羅斯科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏有藏文和蒙文古文獻(xiàn)十余萬冊,稱得上是古代智慧寶庫,但其中只有一小部分文字被翻譯成俄文。目前,該研究所東方手寫文獻(xiàn)和刻本研究中心的科學(xué)家已開始破譯這些古代典籍,他們使用了人工智能系統(tǒng)。

本文引用地址:http://www.eepw.com.cn/article/202209/438373.htm

  教人工智能系統(tǒng)“閱讀”

  “目前,我們正教人工智能系統(tǒng)閱讀藏文”,該研究所所長巴扎羅夫(Boris Bazarov)院士介紹說,“為此掃描了500頁手稿和刻本(木刻板印刷古代書籍),然后通過使用將藏文轉(zhuǎn)換為拉丁字母的威利(Wylie)系統(tǒng)手動輸入拉丁字母?!边@500頁文獻(xiàn)成為神經(jīng)網(wǎng)絡(luò)“教材”,程序員教神經(jīng)網(wǎng)絡(luò)記住圖像并將其與隨附文本相關(guān)聯(lián)。培訓(xùn)只用了2個小時,神經(jīng)網(wǎng)絡(luò)就通過了考試,已能以94%的準(zhǔn)確率識別藏文。不過,科學(xué)家們并不滿足于此。

  “藏文文字特點(diǎn)在于音節(jié)文字,而非字母”,東方手寫文獻(xiàn)研究中心主任林奇諾夫(Oleg Rinchinov)說,“刻本與其他文獻(xiàn)的不同之處在于多相性——有的地方刻得比較清晰,有的地方刻得比較模糊。而且,這些文獻(xiàn)還受到歲月蠶食。目前,還沒有達(dá)到文本識別的最高準(zhǔn)確率?!笨茖W(xué)家認(rèn)為,可將準(zhǔn)確率提高到99%,但每提高一個百分點(diǎn)都需要大量細(xì)致的工作,例如要將準(zhǔn)確率提高到95%,需要多用上千個示例“教”神經(jīng)網(wǎng)絡(luò),準(zhǔn)確率從95%提高到96%則需要用上萬個示例。因此,該項(xiàng)目至少延長了5年。相比之下,一個藏學(xué)家翻譯一部作品需要3年到10年。

  古代智慧寶庫前景廣闊

  “這是世界上首次嘗試解譯藏文”,巴扎羅夫院士介紹說,“翻譯典章和醫(yī)學(xué)文獻(xiàn)等可以更充分地了解古代知識,而且使大量材料得以通用。盡管該項(xiàng)目延期,但我們的所有努力都是為了提高文本識別的準(zhǔn)確性。之后,我們借助神經(jīng)網(wǎng)絡(luò)就能輕松地將原始文獻(xiàn)翻譯成其他語言了。”

  俄羅斯科學(xué)院院長謝爾蓋耶夫(Alexandr Sergeev)和俄羅斯科學(xué)院西伯利亞分院院長帕爾蒙(Valentin Parmon)不僅從文化角度,還從實(shí)踐角度對古代智慧寶庫的前景予以高度評價,他們認(rèn)為,醫(yī)學(xué)書籍中的處方可用來制作生物活性添加劑,還可以制藥,這對在布里亞特共和國建立生物醫(yī)學(xué)產(chǎn)業(yè)集群尤其具有現(xiàn)實(shí)意義。

  中國藥學(xué)家的啟示

  “2015年中國藥學(xué)家屠呦呦因發(fā)現(xiàn)治療瘧疾的新藥獲得諾貝爾獎。這種藥是從青蒿中提取的,可以有效降低瘧疾患者的死亡率”,巴扎羅夫舉了一個現(xiàn)代人使用古代知識的鮮活例子,“藏族智慧還包含多少造福人類的發(fā)明?我們很快就會知道。我們發(fā)明這個算法,實(shí)現(xiàn)系統(tǒng)工作穩(wěn)定后,一定會開始破譯古蒙古文文獻(xiàn)。我相信,我們在這方面也會取得科學(xué)突破?!彼f。

  俄羅斯科學(xué)院西伯利亞分院蒙古學(xué)、佛學(xué)和藏學(xué)研究所收藏的古代藏文和蒙古文典籍、檔案文件、音頻、照片和視頻屬全球最大規(guī)模之一。這些稀有珍品收集了上百年。藏品中有十多萬冊藏文典籍和7000冊古蒙古文文獻(xiàn),包括哲學(xué)、醫(yī)學(xué)和宗教文學(xué)。最古老的文獻(xiàn)可以追溯到16世紀(jì)。這些珍品中有約170部獨(dú)立醫(yī)學(xué)著作,涉及冥想方法、針刺療法、外科手術(shù)和藥理學(xué),其中只有10%被譯成了俄語。




更多信息可以來這里獲取==>>電子技術(shù)應(yīng)用-AET<<


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。