《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 業(yè)界動(dòng)態(tài) > 這么多深度學(xué)習(xí)架構(gòu),百度還有必要重做一個(gè)?

這么多深度學(xué)習(xí)架構(gòu),百度還有必要重做一個(gè)?

2019-06-20
關(guān)鍵詞: 百度 深度學(xué)習(xí)

  去年 3 月 22 號(hào),華為 HiAI 首席架構(gòu)師楊鋆源第一次聽到 PaddlePaddle 這個(gè)名字。當(dāng)時(shí),他的內(nèi)心想法是,「業(yè)界深度學(xué)習(xí)框架已經(jīng)很多了,開發(fā)者已經(jīng)是選擇困難,百度還有必要再做一個(gè)嗎?」

  如今,他的想法發(fā)生了改變:「做深度學(xué)習(xí)框架需要大量的投入,無論是做框架的提供者,還是廣大的學(xué)員或者是開發(fā)者,都要花很大的精力去學(xué)習(xí)。平臺(tái)必須堅(jiān)持?jǐn)?shù)年連續(xù)投入,百度愿意做這件事是國內(nèi)開發(fā)者的幸事。向所有愿意在基礎(chǔ)能力投入的組織和個(gè)人致敬,因?yàn)樗麄兺苿?dòng)了整個(gè)產(chǎn)業(yè)的可持續(xù)性發(fā)展。」

  楊鋆源想法的改變,源于一項(xiàng)為期六個(gè)月的培訓(xùn)。

  今年初,百度聯(lián)合「深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程實(shí)驗(yàn)室」成立「黃埔學(xué)院」,旨在為各行各業(yè)培養(yǎng)第一批「首席 AI 架構(gòu)師」。

  第一期學(xué)員共 35 人,分別來自不同企業(yè)和單位(包括國家衛(wèi)星氣象中心、中油瑞飛、中信銀行、神思電子、OPPO、廣東電網(wǎng)、廣東長隆集團(tuán)、中國聯(lián)通軟件研究院、華為、米文動(dòng)力、愛奇藝等),當(dāng)然楊鋆源是其中之一。

  他們?cè)诒本┻M(jìn)修半年,在半年時(shí)間里,他們結(jié)合自身行業(yè)和企業(yè)需求,使用飛槳(PaddlePaddle),將 AI 結(jié)合到業(yè)務(wù)實(shí)踐中應(yīng)用落地。

  上周日(6 月 16 日)下午,他們?cè)诎俣瓤萍紙@熊掌報(bào)告廳上完「最后一課」后,28 位通過畢業(yè)答辯的學(xué)員獲得了畢業(yè)證書,成為百度認(rèn)證的業(yè)界首批「首席 AI 架構(gòu)師」。

  在這半年時(shí)光里,陪伴著楊鋆源們一起成長的,還有 PaddlePaddle——中文名為「飛槳」,是由百度自主研發(fā),集深度學(xué)習(xí)訓(xùn)練和預(yù)測(cè)框架、模型庫、工具組件、服務(wù)平臺(tái)等為一體的開源深度學(xué)習(xí)平臺(tái)。

  2016 年,在百度世界大會(huì)上,百度宣布 PaddlePaddle 開源,國內(nèi)首個(gè)也是目前唯一一個(gè)開源開放、功能完備的端到端深度學(xué)習(xí)平臺(tái)誕生。

  去年,PaddlePaddle 核心框架 Paddle Fluid v1.0 發(fā)布了穩(wěn)定版本;半年來,飛槳(PaddlePaddle)在易用性、性能、模型豐富度等方面取得了大量突破性進(jìn)展,百度深度學(xué)習(xí)技術(shù)平臺(tái)部總監(jiān)、黃埔學(xué)院副院長馬艷軍說。

  基于百度多年的產(chǎn)業(yè)應(yīng)用經(jīng)驗(yàn),以及百度大腦生態(tài)伙伴的人工智能解決方案實(shí)踐,飛槳(PaddlePaddle)目前已經(jīng)支持六十多個(gè)經(jīng)過真實(shí)業(yè)務(wù)場景驗(yàn)證的官方模型,涵蓋視覺、自然語言處理、推薦等 AI 核心技術(shù)領(lǐng)域。

  在核心框架層面,它提供開發(fā)、訓(xùn)練和預(yù)測(cè)一整套的技術(shù)能力,它同時(shí)支持稠密參數(shù)和稀疏參數(shù)場景,支持千億規(guī)模參數(shù)、數(shù)百個(gè)節(jié)點(diǎn)的高效并行訓(xùn)練,為用戶提供業(yè)界最強(qiáng)的超大規(guī)模并行深度學(xué)習(xí)能力;它提供性能全面領(lǐng)先的底層加速庫和推理引擎、Paddle Mobile、Paddle Serving、高效自動(dòng)化模型壓縮庫 PaddleSlim,為用戶提供端到端全流程部署方案;

  為適應(yīng)工業(yè)大生產(chǎn)階段的「標(biāo)準(zhǔn)化、自動(dòng)化和模塊化」,它提供包括遷移學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、自動(dòng)化網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練可視化工具、彈性深度學(xué)習(xí)計(jì)算等在內(nèi)的工具組件;

  在服務(wù)平臺(tái)層面,它提供零基礎(chǔ)定制化訓(xùn)練和服務(wù)平臺(tái) EasyDL 和一站式開發(fā)平臺(tái) AI Studio,進(jìn)一步降低深度學(xué)習(xí)應(yīng)用門檻,讓零算法基礎(chǔ)加速推動(dòng)產(chǎn)業(yè)智能化變革。

  「飛槳(PaddlePaddle)核心框架 Paddle Fluid v1.5 馬上就要發(fā)布」,馬艷軍當(dāng)日透露。

  飛槳(PaddlePaddle)總架構(gòu)師于佃海、主任架構(gòu)師胡曉光和董大祥分別從飛槳的基本能力、設(shè)計(jì),模型的穩(wěn)定性和易用性,飛槳在大規(guī)模分布式應(yīng)用場景中的應(yīng)用等方面,對(duì)飛槳在這半年里取得的進(jìn)展做了更詳細(xì)的介紹。

  于佃海說,最近半年,他們?cè)?OP 的完備性上做了很多建設(shè);飛槳(PaddlePaddle)的 API 也逐漸穩(wěn)定下來;他們還完善了對(duì)應(yīng)的中英文雙語文檔,優(yōu)化了底層性能,并增加了對(duì)動(dòng)態(tài)圖編程的支持。

  胡曉光表示,飛槳(PaddlePaddle)模型庫中模型的數(shù)量已經(jīng)從早期的不到二十個(gè)模型,增長到六十多個(gè),覆蓋方方面面,還包含「非常前沿」的模型。

  他還表示,飛槳(PaddlePaddle)提供的算法模型全部源于百度的工業(yè)實(shí)踐,歷經(jīng)大規(guī)模數(shù)據(jù)、場景訓(xùn)練,特別是針對(duì)中文的語義表示、情感分析等,百度基于特有的數(shù)據(jù)算法已可提供成熟穩(wěn)定的模型,大幅提升訓(xùn)練速度和實(shí)現(xiàn)效率。比如機(jī)器翻譯的模型,在訓(xùn)練上比其他框架快 60% 以上,預(yù)測(cè)速度快近 4 倍。

  董大祥透露,他們?cè)诖髷?shù)據(jù)訓(xùn)練的過程中做了很多優(yōu)化,包括數(shù)據(jù)分布式的 I/O,隨機(jī)打亂等功能。他們將在飛槳(PaddlePaddle)的開源項(xiàng)目里逐步增強(qiáng)模型的異步能力,以更高性價(jià)比擴(kuò)展節(jié)點(diǎn)?!敢子眯苑矫妫?.5 版本會(huì)發(fā)布分布式訓(xùn)練的 API?!?/p>


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。