一種基于隱含信息補(bǔ)全的NL2SQL訓(xùn)練集生成改進(jìn)方法
所屬分類:技術(shù)論文
上傳者:wwei
文檔大?。?span>1341 K
標(biāo)簽: 訓(xùn)練數(shù)據(jù) NL2SQL 隱含信息
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著深度學(xué)習(xí)技術(shù)成熟,自然語言轉(zhuǎn)為SQL(NL2SQL)技術(shù)得到了更加廣泛的使用,一個(gè)高質(zhì)量訓(xùn)練數(shù)據(jù)集對(duì)于NL2SQL技術(shù)來說非常重要。為了建立基于某內(nèi)部數(shù)據(jù)庫的訓(xùn)練數(shù)據(jù)集,調(diào)研中文高質(zhì)量數(shù)據(jù)集CHASE,發(fā)現(xiàn)忽略數(shù)據(jù)中的隱含信息可能會(huì)導(dǎo)致SQL與自然語言要求不一致。結(jié)合內(nèi)部數(shù)據(jù)庫字典表占比大的特點(diǎn),提出了基于隱含信息補(bǔ)全的NL2SQL訓(xùn)練集生成改進(jìn)方法,用于指導(dǎo)生成更加準(zhǔn)確有效的訓(xùn)練數(shù)據(jù)集。最后通過案例說明了該方法的有效性。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。