文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2022.06.007
引用格式: 余澤霖,徐云. MATLAB到高性能C的代碼轉換系統(tǒng)設計與實現[J].信息技術與網絡安全,2022,41(6):36-42,56.
0 引言
MATLAB由于其強大的功能、友好的開發(fā)界面和簡單易用的編程語言形式而被開發(fā)人員廣泛使用,許多企業(yè)和科研單位都存在著大量的MATLAB遺留代碼(Legacy Code)。但由于MATLAB程序運行依賴于MATLAB軟件系統(tǒng),部分工作平臺無法滿足要求,并且它的運行速度相較于C等更底層的語言慢,無法滿足高性能計算的需求,通常需要將這些遺留MATLAB代碼轉換為C代碼。而人工轉換代碼需要付出高昂的人力成本,因此,理想的解決方案是將MATLAB代碼自動轉換成C代碼。
程序轉換可以節(jié)省軟件開發(fā)的成本,并在軟件的移植、重用、更新和編譯等方面有著重要的應用[1],因此在國內外有大量的對編程語言轉換的研究。本文對已有的編程語言轉換方法進行了借鑒和改進,提出了一個MATLAB到C的自動轉換方法,著重解決了以下三個關鍵問題:一是引入了一種基于抽象語法樹(Abstract Syntax Tree,AST)的中間表示(Intermediate Representation,IR)來解決兩語言間的差異問題,為MATLAB和C轉換過程中提供統(tǒng)一的接口,避免為兩種語言的語法結構映射制定繁瑣的規(guī)則。二是由于C中變量需要聲明后使用,而MATLAB不需要,因此在轉換時需要對MATLAB中的矩陣變量的類型信息(矩陣的大小和矩陣元素的類型)進行識別。已有許多對此類高級語言的變量類型信息識別的研究成果[2-6],本文借鑒并實現了MATLAB到C的轉換過程中的類型信息推導。三是MATLAB中大部分表達式是矢量間的運算,直接轉換到C語句會導致性能下降,并且很多內置的科學計算函數沒有直接對應的C代碼。本文設計了轉換算法,使用C數學核心庫(Math Kernel Library,MKL)中的函數為MATLAB中的矢量運算和庫函數生成高性能C代碼段,解決轉換困難和性能問題。本文實現的系統(tǒng)能幫助開發(fā)人員將MATLAB代碼自動轉換生成C代碼,提升代碼性能,減少人工成本。
本文詳細內容請下載:http://ihrv.cn/resource/share/2000004533
作者信息:
余澤霖1,2,徐 云1,2
(1.中國科學技術大學 計算機科學與技術學院,安徽 合肥230026;
2.安徽省高性能計算重點實驗室,安徽 合肥230026)