《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 人工智能 > 業(yè)界動(dòng)態(tài) > 百度NLP十年:語(yǔ)言與知識(shí)全布局,重磅推出5款產(chǎn)品新發(fā)布、2大計(jì)劃

百度NLP十年:語(yǔ)言與知識(shí)全布局,重磅推出5款產(chǎn)品新發(fā)布、2大計(jì)劃

2020-08-25
作者: Synced
來(lái)源: 機(jī)器之心

  深度學(xué)習(xí)潮起仿佛還在昨天,百度 NLP 已走過了十年。

  人工智能是一門新興學(xué)科嗎?當(dāng)然不是。但能讓 AI 技術(shù)被上億人每天使用到的,一定是走在最前端的公司。

  在國(guó)內(nèi),百度就是這樣一家公司。在人工智能最具挑戰(zhàn)性的方向——自然語(yǔ)言處理(NLP)上,百度一直擁有著技術(shù)優(yōu)勢(shì)。8 月 25 日,在百度語(yǔ)言與知識(shí)技術(shù)峰會(huì)上,百度 CTO 王海峰向我們分享了這家公司在 NLP 領(lǐng)域的技術(shù)創(chuàng)新和產(chǎn)業(yè)實(shí)踐,同時(shí)也展望了未來(lái)的發(fā)展趨勢(shì)。

微信圖片_20200825134016.png

  在這個(gè)七夕,百度還向我們發(fā)布了不少 NLP「爆款」。

  「語(yǔ)言與知識(shí)技術(shù)是人工智能認(rèn)知能力的核心。2010 年,百度成立自然語(yǔ)言處理部,十年間不斷發(fā)展壯大,」王海峰表示,「在百度語(yǔ)言與知識(shí)技術(shù)的布局和發(fā)展中,我們始終注意把握兩個(gè)趨勢(shì),即技術(shù)發(fā)展趨勢(shì)和產(chǎn)業(yè)發(fā)展的趨勢(shì),并力爭(zhēng)引領(lǐng)趨勢(shì)?!?/p>

  隨后,王海峰全面分享了百度語(yǔ)言與知識(shí)技術(shù)的完整布局和最新成果。

  十年堅(jiān)守,一路領(lǐng)先

  經(jīng)過了十余年的發(fā)展,百度已形成了完整的 NLP 技術(shù)布局,包括知識(shí)圖譜、語(yǔ)言理解與生成技術(shù),以及應(yīng)用系統(tǒng)等。知識(shí)圖譜包含概念圖譜、實(shí)體圖譜等不同類型的圖譜,以及知識(shí)挖掘、索引、存儲(chǔ)到知識(shí)推理計(jì)算的一整套知識(shí)相關(guān)的技術(shù)和平臺(tái)。語(yǔ)言理解包括基礎(chǔ)的詞法分析和句法分析技術(shù),也包括篇章理解、對(duì)話理解、情感分析和語(yǔ)義理解等技術(shù)。而語(yǔ)言生成則覆蓋了從句子、摘要到篇章各種類型的生成技術(shù),以及語(yǔ)言風(fēng)格轉(zhuǎn)換技術(shù)。

  全球最大知識(shí)圖譜

  首先是知識(shí)圖譜。知識(shí)圖譜是以結(jié)構(gòu)化的形式描述真實(shí)世界中的實(shí)體、屬性、關(guān)系等,是機(jī)器認(rèn)知世界的重要基礎(chǔ)。百度很早看到了知識(shí)圖譜蘊(yùn)含的潛力,王海峰等人也在自然語(yǔ)言處理部成立之后不久就敲定了在知識(shí)圖譜技術(shù)上的研發(fā)投入。2013 年,百度 NLP 就已經(jīng)開發(fā)出了垂類知識(shí)圖譜。

  知識(shí)圖譜的搭建依賴大量數(shù)據(jù),而百度搜索引擎所蘊(yùn)含的多源異構(gòu)大規(guī)模數(shù)據(jù)為知識(shí)圖譜的發(fā)展提供了天然土壤。此外,百度還創(chuàng)建了一整套構(gòu)建知識(shí)圖譜的方法,包括無(wú)標(biāo)簽大數(shù)據(jù)開放知識(shí)挖掘技術(shù)、知識(shí)體系自擴(kuò)展的知識(shí)圖譜自學(xué)習(xí)技術(shù)以及融合多源異構(gòu)數(shù)據(jù)的知識(shí)補(bǔ)全和知識(shí)挖掘技術(shù)。

  基于這些技術(shù),百度創(chuàng)建了世界上最大規(guī)模的知識(shí)圖譜。這個(gè)知識(shí)圖譜擁有超過 50 億實(shí)體和 5500 億個(gè)事實(shí)。

  除了在百度搜索等各類產(chǎn)品中的使用之外,百度的知識(shí)圖譜還開放給金融、能源、媒體、政務(wù)、教育、司法等各行各業(yè)使用,每天的調(diào)用量已超過 400 億次。

  語(yǔ)言理解領(lǐng)跑全球 NLP 領(lǐng)域

  有了知識(shí)之后,下一個(gè)問題就是如何基于知識(shí)實(shí)現(xiàn)語(yǔ)言理解的增強(qiáng)。

  首先是基礎(chǔ)的語(yǔ)義表示。百度提出的知識(shí)增強(qiáng)語(yǔ)義理解框架 ERNIE 以知識(shí)增強(qiáng)和持續(xù)學(xué)習(xí)為核心創(chuàng)新點(diǎn),在深度學(xué)習(xí)的基礎(chǔ)上融入了知識(shí),通過持續(xù)學(xué)習(xí)技術(shù)不斷吸收海量數(shù)據(jù)中的詞匯、結(jié)構(gòu)、語(yǔ)義等方面的知識(shí)。在最具影響力的 NLP 評(píng)測(cè)基準(zhǔn) GLUE 上,ERNIE 在 10 個(gè)任務(wù)中的平均得分首次突破 90,刷新了榜單最高分,超越了人類水平。

  再來(lái)看持續(xù)學(xué)習(xí)的效果。在基線系統(tǒng)的基礎(chǔ)上,百度通過持續(xù)學(xué)習(xí)機(jī)制為 ERNIE 系統(tǒng)增加了百科知識(shí)、對(duì)話知識(shí)、篇章結(jié)構(gòu)知識(shí)等,使得模型性能得以持續(xù)提升。

  有了知識(shí)圖譜和語(yǔ)義表示之后,下一步就可以做語(yǔ)言理解。以下圖紅框中一句話為例,如何利用這段話推斷出「但使龍城飛將在,不教胡馬度陰山」這首詩(shī)的作者?這段話包含兩個(gè)名字(「李廣」和「王昌齡」),如果隨機(jī)選擇一個(gè)作為答案,正確率只有 50%。為了找到正確答案,百度 NLP 將知識(shí)作為背景信息融入文本語(yǔ)義表示,增強(qiáng)了模型的語(yǔ)義推理能力。這項(xiàng)閱讀理解技術(shù)在 EMNLP-MRQA 2019 評(píng)測(cè)中獲得冠軍,取得了 10 項(xiàng)任務(wù)的第一名。

  除了文本閱讀理解之外,對(duì)話可能是更為常見的一種自然語(yǔ)言理解任務(wù)。如何做好對(duì)話理解呢?百度 NLP 提出的方法是:先從大規(guī)模跨任務(wù)對(duì)話知識(shí)中學(xué)習(xí)通用的語(yǔ)義表示,再利用小樣本學(xué)習(xí)快速提高新任務(wù)的對(duì)話理解能力。小樣本學(xué)習(xí)可以解決新領(lǐng)域語(yǔ)料數(shù)據(jù)不足的難題。

  人認(rèn)知世界的時(shí)候不僅僅是用自然語(yǔ)言,往往是多模態(tài)的語(yǔ)音、視覺、語(yǔ)言,各種信號(hào)都會(huì)有輸入。因此,百度 NLP 的研究也從自然語(yǔ)言擴(kuò)展到跨模態(tài)的語(yǔ)義理解。突破跨模態(tài)語(yǔ)義理解技術(shù)面臨兩大難題:一是不同模態(tài)的信息相互獨(dú)立,彼此缺乏關(guān)聯(lián);二是不同模態(tài)的信息異構(gòu),語(yǔ)義空間難以融合。

  針對(duì)這些難題,百度 NLP 提出了知識(shí)增強(qiáng)的跨模態(tài)深度語(yǔ)義理解方法,一是從多源異構(gòu)大數(shù)據(jù)中構(gòu)建大規(guī)模知識(shí)圖譜,作為關(guān)聯(lián)跨模態(tài)信息的橋梁;二是語(yǔ)言可以描述不同模態(tài)信息的語(yǔ)義,通過知識(shí)增強(qiáng)的自然語(yǔ)言語(yǔ)義表示方法,解決不同模態(tài)語(yǔ)義空間的融合表示難題,從而突破跨模態(tài)語(yǔ)義理解的技術(shù)瓶頸。

  這些技術(shù)突破為人們接觸最多的百度搜索引擎帶來(lái)了很多變化?!?jìng)鹘y(tǒng)的搜索引擎通過關(guān)鍵詞進(jìn)行簡(jiǎn)單的需求理解,其核心是排序。而近年來(lái),百度搜索已經(jīng)完全進(jìn)化成了智能搜索引擎?!雇鹾7逭f道。

  現(xiàn)在,你的輸入不僅可以是一個(gè)詞、一句話,也可以是語(yǔ)音、圖片。這涉及到語(yǔ)言理解和跨模態(tài)理解,還需要將互聯(lián)網(wǎng)上大量的內(nèi)容與其連接起來(lái),而搜索結(jié)果的排序現(xiàn)在也是基于深度學(xué)習(xí)和語(yǔ)義表示融合的方法。

  在結(jié)果的呈現(xiàn)上,很多時(shí)候搜索引擎給出的答案圖文并茂,這背后則是知識(shí)圖譜技術(shù)的支撐。

  語(yǔ)義理解之外,最近 NLP 領(lǐng)域發(fā)展較快的方向是語(yǔ)言生成?;陬A(yù)訓(xùn)練模型等技術(shù),百度提出了基于多流機(jī)制的語(yǔ)言生成預(yù)訓(xùn)練方法,兼顧詞、短語(yǔ)等不同粒度的語(yǔ)義信息,顯著提升了生成效果。百度也探索了多文檔摘要生成,通過圖結(jié)構(gòu)語(yǔ)義表示,引入篇章知識(shí),新的模型解決了跨文檔領(lǐng)域關(guān)系建模難題。在單文檔和多文檔摘要上,都取得了很大的效果提升。

  從內(nèi)到外的 AI 技術(shù)滲透

  有了知識(shí)、語(yǔ)言理解和生成,我們就可以實(shí)現(xiàn)自然的人機(jī)對(duì)話。在基于知識(shí)的對(duì)話框架下,基于知識(shí),理解對(duì)話意圖,規(guī)劃對(duì)話路徑。同時(shí),基于用戶的反饋,機(jī)器可以學(xué)習(xí)和積累知識(shí),不斷提高對(duì)話的體驗(yàn)和效率;百度提出了知識(shí)圖譜驅(qū)動(dòng)的對(duì)話控制技術(shù),利用知識(shí)圖譜提供的語(yǔ)義內(nèi)容和關(guān)聯(lián)信息,幫助對(duì)話系統(tǒng)自動(dòng)規(guī)劃話題路徑,知識(shí)之間的關(guān)聯(lián)使得話題可以自然切換,顯著提高對(duì)話流暢度和邏輯性。

  在對(duì)話生成方面,百度研發(fā)了首個(gè)基于隱空間的大規(guī)模開放域?qū)υ捘P停柚[空間建模不同的對(duì)話回復(fù)方式,在對(duì)話合理性、內(nèi)容豐富度、吸引力等方面效果突出,中英文效果上都超越了業(yè)內(nèi)最佳的模型和系統(tǒng)。

  「在基于知識(shí)的對(duì)話框架里,我們實(shí)現(xiàn)了在線交互學(xué)習(xí),通過主動(dòng)向用戶發(fā)起交互,機(jī)器可以利用用戶的反饋學(xué)習(xí)新知識(shí),持續(xù)優(yōu)化對(duì)話效果,」王海峰說,「整合上述技術(shù),我們研制了智能對(duì)話定制與服務(wù)平臺(tái),可以幫助開發(fā)者高效構(gòu)建智能對(duì)話系統(tǒng),實(shí)現(xiàn)規(guī)?;瘧?yīng)用?!?/p>

  人工智能和 NLP 的經(jīng)典難題——翻譯問題,百度也在不斷打磨。

  百度自 2010 年開始研發(fā)大規(guī)?;ヂ?lián)網(wǎng)機(jī)器翻譯,在大規(guī)模翻譯知識(shí)獲取、翻譯模型、多語(yǔ)言翻譯、同聲傳譯等方面創(chuàng)新突破,研發(fā)了領(lǐng)先的互聯(lián)網(wǎng)翻譯系統(tǒng),率先上線互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯,實(shí)現(xiàn)了機(jī)器翻譯的大規(guī)模產(chǎn)業(yè)化應(yīng)用。在機(jī)器翻譯技術(shù)方面,百度提出了多智能體聯(lián)合學(xué)習(xí)等多項(xiàng)創(chuàng)新技術(shù),效果領(lǐng)先,并在國(guó)際評(píng)測(cè)中獲得第一。

  AI 同聲傳譯方面,百度首次提出了基于語(yǔ)義單元的同傳模型,結(jié)合全局話題及上下文信息進(jìn)行翻譯,實(shí)現(xiàn)了高質(zhì)量低延時(shí)的同聲傳譯系統(tǒng),達(dá)到了與人類翻譯相當(dāng)?shù)乃?。針?duì)很多語(yǔ)種數(shù)據(jù)稀缺的問題,百度提出了稀缺語(yǔ)種分組混合訓(xùn)練算法和多語(yǔ)言聯(lián)合編碼框架,實(shí)現(xiàn)了 200 多種語(yǔ)言之間的翻譯。截至目前,百度的翻譯系統(tǒng)已支持 200 多種語(yǔ)言,每天響應(yīng)超過千億字符的翻譯請(qǐng)求,支持超過 40 多萬(wàn)家第三方應(yīng)用。

  「復(fù)雜知識(shí)表示和快速構(gòu)建技術(shù),知識(shí)與深度學(xué)習(xí)進(jìn)一步的融合,融合感知與認(rèn)知的跨模態(tài)語(yǔ)義理解技術(shù),模型可解釋性和魯棒性等方面,仍有很多技術(shù)難題需要研究和解決,」王海峰表示?!傅覀儗?duì)未來(lái)充滿信心,百度會(huì)繼續(xù)探索讓機(jī)器掌握知識(shí)、理解語(yǔ)言、擁有智能的能力?!?/p>

  5 款產(chǎn)品新發(fā)布、2 大計(jì)劃

  除了這些技術(shù)的總結(jié)和展望之外,在這次活動(dòng)中,百度還一口氣發(fā)布了文心、TextMind、AI 同傳會(huì)議解決方案 3 款新產(chǎn)品,智能創(chuàng)作平臺(tái)面向媒體的 3 個(gè)場(chǎng)景方案,智能對(duì)話定制與服務(wù)平臺(tái) UNIT 的 3 項(xiàng)全新升級(jí)以及數(shù)據(jù)共建和算力共享計(jì)劃。

  語(yǔ)義理解技術(shù)與平臺(tái)「文心」

  首先是 NLP 的核心語(yǔ)義理解。目前使用機(jī)器做文本處理的需求廣泛存在,通用算法 API 已無(wú)法滿足一些場(chǎng)景,而傳統(tǒng)深度學(xué)習(xí)處理特定任務(wù)的方法則需要專業(yè)人員花費(fèi)大量時(shí)間打造。文心基于深度學(xué)習(xí)平臺(tái)飛槳打造,其目標(biāo)是幫助企業(yè)開發(fā)者更低成本、更方便地將最新的語(yǔ)義理解技術(shù)應(yīng)用于自己的場(chǎng)景。

  今天所說的「文心」,「是以刷新各項(xiàng) NLP 任務(wù)記錄的 ERNIE 核心技術(shù)為依托,集成優(yōu)秀的預(yù)訓(xùn)練模型、全面的 NLP 算法集、端到端開發(fā)套件和平臺(tái),提供一站式 NLP 開發(fā)與服務(wù)。」百度集團(tuán)副總裁吳甜表示。

  使用這個(gè)工具有多方便?吳甜現(xiàn)場(chǎng)以一個(gè)情感分析任務(wù)為例,將標(biāo)注好的 100 條商品評(píng)論傾向性數(shù)據(jù)導(dǎo)入到平臺(tái)(文心也提供智能標(biāo)注能力),隨后選擇預(yù)訓(xùn)練模型和算法,點(diǎn)擊任務(wù)提交,模型開始訓(xùn)練。訓(xùn)練結(jié)束后,平臺(tái)會(huì)對(duì)模型效果進(jìn)行自動(dòng)評(píng)估。最后,訓(xùn)練好的模型可一鍵發(fā)布,開發(fā)者可通過 API 服務(wù)直接進(jìn)行調(diào)用。

  文心全面降低 NLP 定制開發(fā)成本,將減少開發(fā)者 90% 數(shù)據(jù)標(biāo)注量、90% 算力投入、85% 模型開發(fā)時(shí)長(zhǎng)。

  百度表示,文心在各類真實(shí)場(chǎng)景中淬煉,已具備領(lǐng)先的工業(yè)級(jí)應(yīng)用實(shí)力。目前,文心廣泛用于百度產(chǎn)品中,累計(jì)支持業(yè)界開發(fā)者超過 2 萬(wàn)名,應(yīng)用場(chǎng)景覆蓋金融、通信、教育、電商等各行各業(yè),顯著提升企業(yè) NLP 應(yīng)用效果和效率。

  智能文檔分析平臺(tái) TextMind

  有可供開發(fā)定制模型的平臺(tái),也有普通人直接可以上手的 AI 辦公套件。百度發(fā)布的 TextMind 是一款企業(yè)文檔分析平臺(tái),目前已提供包括文檔解析、文檔比對(duì)、文檔審核在內(nèi)的一站式解決方案。

  這款工具的特點(diǎn)簡(jiǎn)單說來(lái)就是「多快好省」:它支持多達(dá) 20 類文檔、6 種格式;可以讓之前需要 3-5 個(gè)工作日的工作 1 分鐘完成;預(yù)置文檔解析能力,企業(yè)開箱即用,實(shí)現(xiàn)零門檻定制;在文檔規(guī)范化解析應(yīng)用之后,公司相應(yīng)的人力成本可以降低 80% 以上。

  除了語(yǔ)言理解,還有可以生成內(nèi)容的產(chǎn)品。2019 年初,百度智能創(chuàng)作平臺(tái)上線,目前在媒體等行業(yè)已有很多應(yīng)用。本次平臺(tái)的升級(jí)面向媒體推出 3 個(gè)場(chǎng)景方案,可以讓 AI 幫媒體人更好地進(jìn)行創(chuàng)作。

  智能創(chuàng)作平臺(tái)

  此前,百度的智能創(chuàng)作平臺(tái)已具備豐富的輔助創(chuàng)作和自動(dòng)創(chuàng)作能力,廣泛服務(wù)于內(nèi)容創(chuàng)作機(jī)構(gòu)與個(gè)人。在上線之后的 4 個(gè)多月里,圖文轉(zhuǎn)視頻功能已被 7000 多家用戶使用,自動(dòng)創(chuàng)作短視頻超過 15 萬(wàn)條,相當(dāng)于一個(gè)人 100 年的工作量。一年多以來(lái),AI 的自動(dòng)創(chuàng)作文章也已累計(jì)超過 200 萬(wàn)篇。

  具體來(lái)說,百度的創(chuàng)作工具已得到了 20 多家媒體的應(yīng)用,包括人民日?qǐng)?bào),央視網(wǎng)等。在合作的過程中,百度積累了更多經(jīng)驗(yàn),本次推出的新版本包含智能策劃、智能采編和智能審校 3 大場(chǎng)景方案。

  智能對(duì)話定制與服務(wù)平臺(tái) UNIT

  對(duì)話方面,智能對(duì)話定制與服務(wù)平臺(tái) UNIT 推出三大升級(jí),進(jìn)一步降低任務(wù)式對(duì)話、智能問答的定制成本,并融合通用對(duì)話能力,提升交互體驗(yàn)。

  UNIT 任務(wù)式對(duì)話理解,通過升級(jí)了小樣本意圖理解能力,并新增了詞槽值口語(yǔ)化同義詞的自動(dòng)推薦、詞槽修飾關(guān)系的自動(dòng)識(shí)別,數(shù)據(jù)標(biāo)注成本進(jìn)一步降低了 30% 以上。

  表格問答能力,讓開發(fā)者只需要上傳業(yè)務(wù)數(shù)據(jù)表格,「只需 1 分鐘的自動(dòng)分析,UNIT 生成的問答機(jī)器人就可以準(zhǔn)確回答大部分事實(shí)型問題。再進(jìn)行 1 小時(shí)左右的人工調(diào)優(yōu),問答機(jī)器人可以達(dá)到以往至少通過 2 周人工整理 FAQ 建設(shè)才能達(dá)到的問答系統(tǒng)水平?!箙翘鹫f道。UNIT 不僅集成了業(yè)界領(lǐng)先的通用對(duì)話技術(shù) PLATO,還推出新一代融合任務(wù)式對(duì)話和通用對(duì)話的引擎,讓對(duì)話系統(tǒng)不僅干練辦事,還能順暢交互。

  AI 同傳會(huì)議解決方案

  與其他公司需要一些專業(yè)設(shè)備的方式不同,百度的 AI 同傳可以讓你只用一臺(tái)電腦,一部手機(jī),就快速搭建起一套同傳服務(wù)。

  「無(wú)論線上遠(yuǎn)程會(huì)議室還是線下會(huì)議,主題演講還是多人討論,使用百度的解決方案,每一場(chǎng)會(huì)議都能做到讓人彼此聽懂,」吳甜介紹道?!冈谘麥y(cè)期間,這項(xiàng)技術(shù)已經(jīng)支持了上百場(chǎng)會(huì)議,覆蓋數(shù)十個(gè)領(lǐng)域,是一套經(jīng)過了實(shí)踐檢驗(yàn)、成熟可靠的解決方案?!?/p>

  在會(huì)議的每一個(gè)環(huán)節(jié),百度的服務(wù)都不缺席。在會(huì)議開始前,百度同傳可以根據(jù)會(huì)議涉及的特定領(lǐng)域進(jìn)行術(shù)語(yǔ)定制,以應(yīng)對(duì)專業(yè)議題中獨(dú)有的釋義,提高準(zhǔn)確度。在會(huì)議中,百度的工具支持雙語(yǔ)字幕投屏和手機(jī)邊聽邊看。而且在正在進(jìn)行的講話中,人們也可以隨時(shí)進(jìn)行術(shù)語(yǔ)釋義修改,結(jié)果實(shí)時(shí)生效。在會(huì)議結(jié)束后,系統(tǒng)還會(huì)自動(dòng)生成會(huì)議記錄,并保存到網(wǎng)盤中。

  百度不僅提供成型的工具,也歡迎開發(fā)者在算法等組件的基礎(chǔ)上自行開發(fā)——AI 同傳中使用的技術(shù),已經(jīng)同步面向所有人開放。

  數(shù)據(jù)共建與算力共享計(jì)劃

  除產(chǎn)品新發(fā)布之外,百度技術(shù)委員會(huì)主席吳華在峰會(huì)上公布了千言數(shù)據(jù)共建計(jì)劃和百度語(yǔ)言與知識(shí)算力共享計(jì)劃。

  百度聯(lián)合中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)發(fā)起全球最大中文自然語(yǔ)言處理數(shù)據(jù)共建計(jì)劃——千言,解決數(shù)據(jù)稀缺問題。千言一期由來(lái)自國(guó)內(nèi) 11 家高校和企業(yè)的數(shù)據(jù)資源研發(fā)者共同建設(shè),已涵蓋開放域?qū)υ?、閱讀理解等 7 大任務(wù),20 余個(gè)中文開源數(shù)據(jù)集。百度技術(shù)委員會(huì)主席吳華表示,“我們計(jì)劃在未來(lái) 3 年,面向 20 多個(gè)任務(wù),收集和建設(shè)不少于 100 個(gè)中文自然語(yǔ)言處理數(shù)據(jù)集,覆蓋語(yǔ)言與知識(shí)技術(shù)全部領(lǐng)域。”

  吳華還發(fā)布了百度語(yǔ)言與知識(shí)技術(shù)算力助力計(jì)劃,通過百度 AI STUDIO 平臺(tái)提供算力支持,讓廣大開發(fā)者破除算力桎梏,專注于技術(shù)創(chuàng)新。

  百度 NLP 強(qiáng)大的技術(shù),離不開過硬的人才支撐。在這十多年的時(shí)間里,百度 NLP 聚集了一大批兼具扎實(shí)技術(shù)實(shí)力和實(shí)踐經(jīng)驗(yàn)的 AI 人才。在這次活動(dòng)中,百度首次向業(yè)內(nèi)介紹了這家公司 NLP 十年的「代表人物」。

  百度 NLP 十年十人

  2010 年 1 月,自然語(yǔ)言處理領(lǐng)域知名專家王海峰博士加盟百度,成立了「自然語(yǔ)言處理部」?!噶⒆惆俣龋袊?guó),胸懷世界,成為有豐富產(chǎn)出及廣泛影響力的國(guó)際一流自然語(yǔ)言處理研發(fā)團(tuán)隊(duì)」是當(dāng)時(shí)立下的愿景。

  十年征程,百度語(yǔ)言與知識(shí)技術(shù)發(fā)展歷程中培養(yǎng)、吸引了大量全球頂尖人才。會(huì)上,百度推出以王海峰為代表的百度 NLP“十年十人”,他們是:

  王海峰,百度首席技術(shù)官,ACL 主席(2013),AACL 創(chuàng)始主席,ACL Fellow,中國(guó)中文信息學(xué)會(huì)副理事長(zhǎng)。

  Kenneth Church,Baidu Research Fellow,ACL 主席(2012),ACL Fellow,EMNLP 創(chuàng)始人。

  呂雅娟,百度高級(jí)科學(xué)家知識(shí)圖譜技術(shù)負(fù)責(zé)人、中國(guó)計(jì)算機(jī)學(xué)會(huì)中文信息技術(shù)專委會(huì)副主任(2015-2019)。

  吳華,百度技術(shù)委員會(huì)主席,ACL Program Chair(2014)。

  黃亮,百度杰出架構(gòu)師、IDL(美國(guó))主任,ACL Area Chair (2012, 2014, 2018, 2019)。

  吳甜,百度集團(tuán)副總裁。

  趙世奇,百度 MEG 用戶產(chǎn)品策略平臺(tái)負(fù)責(zé)人,ACL 秘書長(zhǎng)(2016-2020)。

  田浩,百度研究院首席架構(gòu)師。

  何中軍,百度人工智能技術(shù)委員會(huì)主席。

  于佃海,百度飛槳平臺(tái)總架構(gòu)師。

  十年堅(jiān)守,他們堅(jiān)持技術(shù)信仰,勇攀技術(shù)高峰,致力于讓機(jī)器掌握知識(shí)、理解語(yǔ)言、擁有智能,更好地服務(wù)于人們的生產(chǎn)、生活。以他們?yōu)榇淼陌俣日Z(yǔ)言與知識(shí)技術(shù)團(tuán)隊(duì)取得了豐碩的成果,獲得包括國(guó)家科技進(jìn)步獎(jiǎng)在內(nèi)的 20 多個(gè)獎(jiǎng)項(xiàng),30 多項(xiàng)國(guó)際競(jìng)賽冠軍,發(fā)表學(xué)術(shù)論文超過 300 篇,申請(qǐng)專利 2000 多項(xiàng)?!甘陙?lái),我們始終如一,用技術(shù)上的持續(xù)突破創(chuàng)新和應(yīng)用上的碩果累累,踐行了我們的使命,實(shí)現(xiàn)了我們的愿景。」王海峰表示。

  讓我們期待百度大腦語(yǔ)言與知識(shí)能力帶來(lái)更多驚喜,為技術(shù)和社會(huì)進(jìn)步做出更大貢獻(xiàn)。

編輯:澤南、張倩

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。