《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于故障模式的裝備質(zhì)量問題文本分類方法
基于故障模式的裝備質(zhì)量問題文本分類方法
信息技術與網(wǎng)絡安全 9期
費清春1,史瑩瑩1,曾慶國2
(1.南京電子技術研究所,江蘇 南京210039;2.工業(yè)和信息化部電子第五研究所,廣東 廣州511300)
摘要: 面對大規(guī)模的海量裝備質(zhì)量問題文本,如何精準有效地將它們按照故障模式分類具有重要的理論意義。目前,主要以專家人工判定的傳統(tǒng)方式開展問題分類費時費力,難以滿足實際的應用需求。在此背景下,提出了一種基于故障模式的裝備問題自動分類方法。該方法首先利用中文分詞技術開展文本切詞,生成文本關鍵詞特征向量,進而計算質(zhì)量問題與故障模式文本特征向量的相似度,最后按照相似度的閾值判定質(zhì)量問題歸屬故障模式的種類。采用信息化技術進行裝備質(zhì)量問題分類方法簡單易行,實驗結(jié)果表明效果良好。
中圖分類號: TP311.5
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.09.003
引用格式: 費清春,史瑩瑩,曾慶國. 基于故障模式的裝備質(zhì)量問題文本分類方法[J].信息技術與網(wǎng)絡安全,2021,40(9):14-18.
Text classification method for equipment quality problems based on failure mode
Fei Qingchun1,Shi Yingying1,Zeng Qingguo2
(1.Nanjing Research Institute of Electronics Technology,Nanjing 210039,China; 2.The Fifth Electronic Research Institute of Ministry of Industry and Information Technology,Guangzhou 511300,China)
Abstract: In the face of large-scale and massive equipment quality problem texts, how to accurately and effectively classify them according to failure modes has important theoretical significance. At present, the mainly method based on manual judgement is a time-consuming and laborious task, which is difficult to satisfy the real-world application requirements. Under the above background, this paper proposes an automatic classification approach based on failure modes. It firstly utilizes Chinese word segmentation technology to segment text, which is used to generate keyword feature vectors. Then, it calculates the similarity of the quality problem text vectors and failure mode text vectors, and finally determines the type of failure mode that the quality problem belongs to according to similarity threshold. The proposed approach is implemented by information technology that is simple in its implementation for equipment quality problem classification. Experimental results show that the proposed approach has received superior performance on classification for equipment quality problem texts.
Key words : equipment quality;quality problem;text classification;failure mode;similarity

0 引言

隨著計算機技術的快速發(fā)展,企業(yè)建立了產(chǎn)品質(zhì)量問題處理信息系統(tǒng),存儲了大量的產(chǎn)品質(zhì)量問題處理歷史記錄。產(chǎn)品質(zhì)量改進通常是建立在產(chǎn)品質(zhì)量問題數(shù)據(jù)分析的基礎上,將質(zhì)量問題快速、準確地自動歸類為不同的故障模式,對于促進企業(yè)識別質(zhì)量問題關鍵因素,推動產(chǎn)品質(zhì)量改進具有十分重要的現(xiàn)實意義。如何將成千上萬,甚至是幾十萬條質(zhì)量問題數(shù)據(jù)按照故障模式自動分類,單憑專家篩選、甄別和分類,是一個巨量的、難以短時間完成的任務,成為了亟需解決的實際問題。以關鍵詞檢索等自動化程度較低的人機協(xié)作模式開展質(zhì)量問題分類,結(jié)果存在大量的誤報和漏報,不能滿足實際使用的需要。

運用大數(shù)據(jù)技術,分析挖掘產(chǎn)品質(zhì)量問題數(shù)據(jù),能夠為產(chǎn)品質(zhì)量改進的技術創(chuàng)新提供有效的技術支持[1]。當前,計算機領域已形成了中文分詞、文本挖掘等自然語言處理技術,在此背景下,本文重點聚焦裝備質(zhì)量問題文本數(shù)據(jù)的故障模式自動分類方法展開研究。



本文詳細內(nèi)容請下載http://ihrv.cn/resource/share/2000003760




作者信息:

費清春1,史瑩瑩1,曾慶國2

(1.南京電子技術研究所,江蘇 南京210039;2.工業(yè)和信息化部電子第五研究所,廣東 廣州511300)




微信圖片_20210517164139.jpg


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權禁止轉(zhuǎn)載。