引用格式:高娜,東梅.基于Word2Vec和LDA主題模型的中國省級五年規(guī)劃“文化政策”文本研究[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2024,43(7):47-55.
引言
政策指政黨或國家為實現(xiàn)一定歷史時期的任務(wù)而制定的行動綱領(lǐng)、方針和準(zhǔn)則[1]。政策文本是在政策制定與實施中所產(chǎn)生的過程性文件,包括法律法規(guī)、行政規(guī)章、辦法、通知等。省級政府頒布的五年規(guī)劃文本為地方經(jīng)濟發(fā)展遠景規(guī)定目標(biāo)和方向,具有戰(zhàn)略性和規(guī)劃性的特點,成為政策文本研究的重要工具和載體。隨著文化產(chǎn)業(yè)的興起及其在經(jīng)濟發(fā)展中的作用日益凸顯,文化發(fā)展也成為推動地方繁榮與創(chuàng)新的關(guān)鍵?!?a class="innerlink" href="http://ihrv.cn/tags/文化政策" target="_blank">文化政策”是國家干預(yù)文化的工具,是影響文化生產(chǎn)的政府行為[2]。通過五年規(guī)劃中“文化政策”文本進行主題抽取分析,可以掌握政府的政策傾向與關(guān)注焦點,助力區(qū)域高質(zhì)量發(fā)展。政策文本分析被廣泛應(yīng)用于氣候變化協(xié)議(Lipschutz & McKendry,2014)、環(huán)境政策(Lester et al.,2016)以及公共衛(wèi)生政策(Gruening et al.,2017)等領(lǐng)域?,F(xiàn)有研究有文本內(nèi)容分析、政策文獻計量、社會網(wǎng)絡(luò)分析和政策文本挖掘等,其中政策文本挖掘又涵蓋政策文本分類、情感分析及主題挖掘等諸多方法[3]。潛在狄利克雷分布模型(Latent Dirichlet Allocation,LDA),通過對文本語義降維處理,使其結(jié)果具有更好的可解釋性,被廣泛應(yīng)用于政策文本主題挖掘,該模型最早由Blei等人提出,但其不考慮單詞之間的關(guān)聯(lián)以及使用onehot形式進行編碼,導(dǎo)致詞間的語義關(guān)系缺失和雙重稀疏性,后來Nguyen等提出將LDA與Word2Vec結(jié)合,創(chuàng)建LDA2Vec模型以克服傳統(tǒng)模型的缺點[4]?!拔幕摺敝黝}研究聚焦于政策制定、政策實施、政策評價方面。國內(nèi)學(xué)者專注于“文化事業(yè)”和“文化產(chǎn)業(yè)”兩大領(lǐng)域,一部分學(xué)者研究文化事業(yè)的公共文化服務(wù)領(lǐng)域[5]、公共治理[6]等問題;另一部分學(xué)者從理論層面關(guān)注文化產(chǎn)業(yè)概念辨析[7]、發(fā)展戰(zhàn)略研究[8]以及文化高質(zhì)量發(fā)展[9]等問題,在實踐層面聚焦文化產(chǎn)業(yè)的園區(qū)建設(shè)[10]、發(fā)展方式轉(zhuǎn)變[11]、數(shù)字文化產(chǎn)業(yè)設(shè)計[12]。國外學(xué)者對于文化政策研究主要聚焦于文化消費[13]、文化認(rèn)同[14]、文化產(chǎn)業(yè)政策與產(chǎn)業(yè)能力的研究[15]、文化產(chǎn)業(yè)政策與全球化研究[16]??傮w而言,目前政策文本挖掘集中于信息抽取、聚類、分類等方向,缺乏語義相關(guān)的視角,基于政策特征的“文化政策”文本挖掘欠缺,難以揭示政策文本隱含語義和關(guān)系,不利于政策文本主旨內(nèi)涵的準(zhǔn)確把握等問題。本文在內(nèi)涵挖掘與差異化比較分析需求的驅(qū)動下,基于LDA2Vec構(gòu)建政策文本主題挖掘模型,對比分析不同區(qū)域、不同時間的主題特征,以期實現(xiàn)“文化政策”文本核心重點的挖掘和差異分析,據(jù)此提出對策建議,推動政府對已有工作的準(zhǔn)確梳理以及政策布局的優(yōu)化調(diào)整,進而為我國文化領(lǐng)域發(fā)展決策提供參考。
本文詳細內(nèi)容請下載:
http://ihrv.cn/resource/share/2000006091
作者信息:
高娜1,東梅2
(1.寧夏大學(xué)農(nóng)學(xué)院,寧夏銀川750000;
2.寧夏大學(xué)經(jīng)濟管理學(xué)院, 寧夏銀川750000)