| 基于混合视觉策略的异构表格抽取研究 | |
| 所屬分類:技术论文 | |
| 上傳者:wwei | |
| 文檔大?。?span>1671 K | |
| 標(biāo)簽: 表格检测 表格文本识别 PP-OCRv4 | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹:本研究旨在解决军事领域中异构表格数据的识别与抽取问题,提出了一种基于混合视觉策略的表格抽取与体系化存储框架。首先采用融合Mask R-CNN和Unet的表格检测算法与基于PP-OCRv4表格文本识别方法,实现了对于原始数据的检测及电子化,并引入IoT指标解决现实表格数据的文本换行、溢出等问题;然后,提出了一种自适应的表格标准化重构方法,使得多来源的异构表格数据可实现结构化、体系化的统一存储;最后探讨了如何将提取的结构化数据应用于军事知识库构建,为海量知识数据的自动化提取与标准化存储提供了数据支撑。 | |
| 現(xiàn)在下載 | |
| VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2