技術擴散能力在國家技術力量中非常重要,特別是在AI的背景下。有研究顯示,與美國分散且更利于擴散的生態(tài)系統(tǒng)相比,中國的擴散能力遠遠落后于創(chuàng)新能力——比后者排名低近30位。目前,中國正在計劃提高擴散能力,重要方式是對AI教育進行大規(guī)模投資,以培養(yǎng)中端、以工業(yè)為重點的AI勞動力。
美國最近在大型語言模型(LLM)和擴散模型方面取得了源源不斷的突破。這些成功推動了美國風險投資對專注于科技和服務行業(yè)的生成式AI初創(chuàng)公司的激增,如HarveyAI、Jasper和Runway。美國的這種樂觀情緒與中國相對較慢的AI創(chuàng)業(yè)公司形成了鮮明對比。例如,有分析稱備受關注的阿里巴巴支持的初創(chuàng)公司零一萬物(01.AI)的語言模型在很大程度上是基于Meta的開源LLaMA基金會模型。
然而,中國在生成式AI領域的遲緩,可以解釋為政府將工業(yè)應用置于服務業(yè)和傳統(tǒng)知識工作應用之上的戰(zhàn)略優(yōu)先地位。特別是,政府希望通過工業(yè)部門的AI投資來對抗工業(yè)生產力增長的下降,以期擺脫中等收入陷阱。
為此,政府已要求教育部在國內的工業(yè)部門推廣尖端的機器學習技術。因此,中國各大學開設了2300多個AI本科生項目,其中大多數是專注于工業(yè)應用的應用AI項目。教育部的AI高等教育包括兩個目標:旨在降低傳統(tǒng)工業(yè)企業(yè)采用AI的障礙;龐大的中端AI勞動力將如何在經濟中擴散AI。
AI在工業(yè)企業(yè)中的商業(yè)模式
教育部對應用AI高等教育項目的空前投資在于政府認識到大多數專注于工業(yè)的AI公司面臨的一個根本問題:構建特定行業(yè)的AI解決方案需要耗費大量時間和資金,通常無法通過橫向商業(yè)模式實現。這個問題很普遍,因為除了回收等利基行業(yè)(AMP Robotics等成功的西方初創(chuàng)公司已經出現)之外,大多數工業(yè)部門都有特定于公司的數據基礎設施。制造公司通常在稱為制造執(zhí)行系統(tǒng)(MES)和監(jiān)控與數據采集(SCADA)的軟件系統(tǒng)上運行。這些系統(tǒng)往往結合了內部工具和SAP或西門子等傳統(tǒng)供應商構建的軟件服務的混亂組合。
因此,為了構建一個可以實際部署的AI模型,這些不同的系統(tǒng)必須首先通過跨系統(tǒng)的數據通道進行統(tǒng)一。這項工作的大部分都是定制的,涉及在傳統(tǒng)的、斷開連接的系統(tǒng)之間構建強大的數據通道的繁瑣過程,這些系統(tǒng)通常來自具有不同數據模式的不同提供商。只有完成了這項艱巨的工作,計算機視覺模型才能開始訓練和部署。即使在這些復雜的數據通道建成后,對AI系統(tǒng)進行工業(yè)流程培訓也會帶來自身的挑戰(zhàn):
鑒于工業(yè)企業(yè)使用的產品和流程眾多,每個模型都必須在公司或產品線的特定系統(tǒng)上進行培訓。換言之,大規(guī)模、全行業(yè)的多樣性限制了工業(yè)AI解決方案的可擴展性。
此外,每當一家公司改變流程或轉向新產品時,該公司不僅必須建立新的制造流程,還必須重新培訓其計算機視覺模型——如果這是一個沒有大量現有培訓數據的新產品或流程,這通常是一項艱巨的任務。因此,如果沒有一個穩(wěn)健的數據集來調整新過程的機器學習算法,制造商往往被迫手動測試和生成體能訓練數據,直到模型變得足夠可靠。
在工業(yè)AI領域,由于需要不斷更新、客戶規(guī)模有限以及高昂的前期成本,軟件即服務(SaaS)公司利潤豐厚的經濟效益不再適用。李開復的AI產業(yè)初創(chuàng)公司創(chuàng)新奇智(AInnovation),為中鋼國際和建筑巨頭中鐵四號等工業(yè)企業(yè)開發(fā)AI系統(tǒng)。隨著創(chuàng)新奇智擴大其客戶群,它被迫增加軟件支出,部署更多專有的低利潤硬件,導致毛利率從2018年的62.9%暴跌至2020年的29.1%。
由于工業(yè)部門的AI不能通過一刀切的橫向解決方案來采用,該行業(yè)需要一大批新的中級AI人才——比一般的數據分析師更熟練,但比ML工程師和研究人員成本更低。中國的AI教育戰(zhàn)略旨在填補這一應用AI人才的利基市場,以便每家工業(yè)公司都可以聘請內部團隊來構建自己的機器學習基礎設施。
這項投資的成果已經開始顯現。例如,CATL等公司正在電池制造質量控制過程中大規(guī)模部署計算機視覺。當然,考慮到電池的同質化和商品化性質,政府戰(zhàn)略能否將其AI努力擴大到這一相對較低的成果之外,還有待觀察。
AI的教育擴散
除了促進現有AI技術與工業(yè)部門的融合外,AI高等教育政策還尋求建立所需的受過中等教育的勞動力隊伍,以將新興的AI突破傳播到全國其他地區(qū)。隨著許多新的應用AI項目位于農村和工業(yè)地區(qū),新一波AI項目旨在將AI的好處傳播到全國各地,而不是將其限制在北京和深圳等以服務為重點的沿??萍贾行?。
同時,通過關注這一中級AI人才,中國將以成本效益培訓那些愿意建設其工業(yè)企業(yè)所需數據基礎設施的工人,同時也了解前沿的相關突破。這一點可以通過創(chuàng)建應用AI程序來實現,這些程序省略了復雜的AI概念的教學,而是專注于數據模型和最基本的機器學習概念——事實證明,這種方法具有很強的可擴展性。
這種方法不同于美國大學的AI教育。美國本科生AI課程很少讓學生參與并學習構建數據通道和清理數據集的混亂但關鍵的技能,而是專注于深度學習和transformer等更具理論性的主題。教授這些主題可能會帶來更前沿的研究突破,但在培養(yǎng)一支能夠將這些突破擴散到整個經濟中的傳統(tǒng)行業(yè)的勞動力方面并不那么有效。
相比之下,長春吉林大學的一名畢業(yè)生——教育部在那里啟動了一個新的應用AI項目——將精通為建筑和制造公司構建有效的數據通道,同時也熟悉卷積神經網絡(CNN)等基本的機器學習概念。由于這些學生主要學習如何構建AI系統(tǒng)的基礎設施,大學并不依賴罕見的頂級AI教授,這使得應用AI項目更容易擴大規(guī)模。
中國有大量具備ML基礎知識的畢業(yè)生,不一定需要在AI突破方面領先。隨著清華等大學或者像OpenAI這樣的西方實驗室涌現出新技術,國內訓練有素的勞動力可以在整個經濟中快速學習和利用這些新興技術。例如,盡管工作人員可能主要花時間構建數據整理流程和通道,但他們仍然會對ML技術感到足夠舒適,從而學習如何使用CLIP或其他圖像處理突破,即使他們最初只熟悉CNN等基本技術。這種領域專業(yè)化、AI快速追隨者的隊伍在ML領域尤其有效,在ML領域,知識可以通過開源論文輕松獲取。
需要指出的是,對AI工業(yè)應用的關注與國家的發(fā)展愿景一致,即中國要實現類似德國的高端制造業(yè)模式,而不是更以服務業(yè)為導向的美國經濟模式。事實上,今年兩會提出的最新AI提案——包括備受關注的AI+倡議——就是旨在將“AI技術的進步轉化為實體經濟中的有形生產力”。