減少代碼調(diào)試時間與成本支出
由于代碼調(diào)試對于程序開發(fā)至關(guān)重要,幾乎所有的大型軟件都需要調(diào)試,才能最大程度上避免軟件出錯。
但是對于絕大多數(shù)開發(fā)人員來說,這個過程不僅非常耗時,而且大部分調(diào)試只能手工作業(yè)。因為修復(fù)一個軟件缺陷可能需要幾天、幾周甚至幾個月的時間,據(jù)估計,多達 50% 的軟件開發(fā)時間浪費在調(diào)試程序上。這是因為大多數(shù)錯誤都需要語義分析來識別、評估根本原因,即使是最先進的調(diào)試系統(tǒng)也無法有效地執(zhí)行這種分析。
英特爾實驗室首席人工智能科學(xué)家 Justin Gottschlich 也表示:“盡管在過去的幾十年里,研究自動化調(diào)試方面取得了部分進展,但現(xiàn)有工具仍無法完美發(fā)現(xiàn)日益復(fù)雜的軟件錯誤。這也是調(diào)試仍然主要由人為驅(qū)動的過程的一個關(guān)鍵原因?!?/p>
除此之外,調(diào)試代碼的預(yù)算支出也很高。據(jù)英特爾官方介紹,2020 年 IT 行業(yè)在與調(diào)試代碼相關(guān)的環(huán)節(jié)上大約花費了 2 萬億美元,約占 IT 平均預(yù)算的一半。
“超能的” ControlFlag
據(jù)悉,該系統(tǒng)是英特爾機器編程研究 (MPR) 項目的一部分,該項目的總體目標是通過自動化有望將開發(fā)軟件所需的時間減少 1,000 倍。例如,Gottschlich 的團隊正在研究的領(lǐng)域之一是最終擴展 ControlFlag 的能力,以自動修復(fù)它檢測到的錯誤。
自去年推出以來,英特爾已在各種軟件系統(tǒng)上測試了該機器學(xué)習(xí)工具,并取得了可喜的成果?!爱?dāng)我們最初設(shè)計系統(tǒng)時,我們沒有預(yù)料到它能夠發(fā)現(xiàn)高度復(fù)雜的缺陷,”英特爾實驗室首席人工智能科學(xué)家 Justin Gottschlich 表示。“然而,鑒于其自我監(jiān)督的設(shè)計,ControlFlag 能夠發(fā)現(xiàn)高度復(fù)雜、細微的軟件缺陷,甚至連我們這些構(gòu)建它的人都感到震驚?!?/p>
英特爾的團隊通過使用一種“無監(jiān)督”的學(xué)習(xí)方法,以允許 ControlFlag 檢測更廣泛的存儲庫中的錯誤。該系統(tǒng)從超過 10 億行未標記的源代碼中學(xué)習(xí)編碼模式,使其能夠達到很高的準確性,甚至可以適應(yīng)開發(fā)人員的風(fēng)格,以區(qū)分軟件異常和編程語言的風(fēng)格變化。
ControlFlag 適用于任何包含控制結(jié)構(gòu)的編程語言(如 C/C++),而且ControlFlag 能夠不斷地從未標記的源代碼中學(xué)習(xí),隨著新數(shù)據(jù)的引入而 “進化”,使自己變得更好。雖然它還不能自動解決它所發(fā)現(xiàn)的代碼錯誤,但該工具可以為開發(fā)人員提供了潛在的修改建議。
Justin Gottschlich 還表示,目前為止僅在兩個專有軟件存儲庫上使用 ControlFlag,就發(fā)現(xiàn)了生產(chǎn)質(zhì)量、已部署程序中的 300 多個缺陷。例如,去年 ControlFlag 在名為 Client URL (cURL) 的計算機軟件項目中檢測到代碼異常,該項目每天使用各種網(wǎng)絡(luò)協(xié)議傳輸數(shù)據(jù)超過 10 億次。在向 cURL 團隊報告異常后,他們同意 ControlFlag 的發(fā)現(xiàn)并重新設(shè)計代碼以修補問題。
不斷進步的 ControlFlag
隨著英特爾團隊致力于開發(fā) ControlFlag,過去的一年也帶來了相當(dāng)多的學(xué)習(xí)點。Gottschlich 認為,需要改進的兩個關(guān)鍵領(lǐng)域是減少該工具報告的誤報數(shù)量,以及將更先進的語義分析器集成到 ControlFlag 的推理中。
然而,作為一個將成為英特爾機器編程工具套件之一的系統(tǒng),ControlFlag 將繼續(xù)發(fā)展?!癈ontrolFlag 的進步不太可能停止,”Gottschlich 強調(diào)?!斑@主要是因為隨著軟件編程語言、硬件描述語言和計算設(shè)備的發(fā)展,ControlFlag 也需要發(fā)展以跟上它們的步伐?!?/p>
與此同時,英特爾的 MPR 團隊正在開展一些專注于簡化軟件開發(fā)的項目。例如,去年該公司還發(fā)布了一款與麻省理工學(xué)院實驗室共同開發(fā)的工具,該工具可以研究代碼片段以了解軟件打算做什么。該系統(tǒng)稱為 MISIM(機器推斷代碼相似性),它使用預(yù)先存在的代碼目錄來理解新算法背后的意圖,并通過建議其他編程方法或提供使代碼更高效的選項來幫助工程師開發(fā)軟件。
Gottschlich 預(yù)計 MISIM 有一天會與 ControlFlag 一起工作?!爱?dāng)正確想法融合在一起時,我們設(shè)想了一個更強大的新系統(tǒng),該系統(tǒng)將能夠檢測 ControlFlag 目前可以檢測到的所有缺陷,以及由于潛在的復(fù)雜性而目前無法檢測到的數(shù)百種缺陷?!盙ottschlich表示。