自然圖像領域中存在著許多海量數(shù)據(jù)集,如ImageNet,MSCOCO?;谶@些數(shù)據(jù)集產(chǎn)生的預訓練模型推動了分類、檢測、分割等應用的進步。與自然圖像不同的是,醫(yī)療影像大部分都是3D結構形態(tài)的,同時,由于數(shù)據(jù)獲取和標注難度大,數(shù)據(jù)量稀少,此前并沒有海量數(shù)據(jù)集及對應的預訓練模型開源。
騰訊優(yōu)圖表示,這正是其開源MedicalNet的原因所在。目前,MedicalNet具備5大特性:
1、預訓練網(wǎng)絡可遷移到任何3D醫(yī)療影像的AI應用中,包括但不限于分割、檢測、分類等任務;2、尤其適用小數(shù)據(jù)醫(yī)療影像AI場景,能加快網(wǎng)絡收斂,提升網(wǎng)絡性能;3、通過簡單配置少量接口參數(shù)值,即可進行微調訓練;4、提供多卡訓練以及測試評估代碼,接口豐富,擴展性強;5、提供不同深度3D ResNet預訓練模型,可供不同數(shù)據(jù)量級應用使用。MedicalNet是如何做出來的?騰訊優(yōu)圖給出了解釋:
MedicalNet聚集了來自多個不同3D醫(yī)療領域的語義分割小規(guī)模數(shù)據(jù)集,并提出了基于多分支解碼器的多域聯(lián)合訓練模型來解決數(shù)據(jù)集中的標注缺失問題。這一預訓練的適用性也很強,可以遷移到任何3D醫(yī)療影像應用的深度學習模型中。
為了衡量模型效果,他們將MedicalNet模型遷移到預訓練時未接觸過的Visceral和LIDC數(shù)據(jù)集中。并用它來完成全新的肺部分割和肺結節(jié)分類任務,并與目前常用的從零訓練(train from scratch)以及Kinetics視頻3D預訓練模型在性能以及收斂速度上做了比較。
在肺部分割應用上,與Train from Scratch相比,MedicalNet在Dice上有16%到33%幅度的提升,與KineTIcs相比有4%到7%幅度的提升。在肺結節(jié)良惡性分類應用上,與Train from Scratch先比,MedicalNet的預測準確度提升了6%到23%幅度,與KineTIcs相比,提升了7%到20%。
在收斂速度上,無論是在肺分割任務還是肺結節(jié)分類任務上,MedicalNet都能為模型提供一個較低的初始化損失值,明顯加快損失下降速度。騰訊在AI醫(yī)療方面沉淀已久,近年來業(yè)內名聲愈盛,刷新多項世界紀錄。比如今年6月,全球胸部多器官分割大賽上,騰訊優(yōu)圖與廈門大學王連生老師實驗室聯(lián)手,刷新3項全球新紀錄。在此此前,雙方也在肝分割、肝腫瘤分割兩項技術挑戰(zhàn)賽中斬獲世界第一。
騰訊優(yōu)圖表示,其醫(yī)療AI已經(jīng)具備進行上億規(guī)模的模型訓練及合作接入的能力。而且,他們不僅僅只是研究,技術落地也早已開始。近年來,這些醫(yī)療AI技術正在通過騰訊旗下首個醫(yī)療影像產(chǎn)品“騰訊覓影”持續(xù)對外輸出,目前已支持宮頸癌、肺癌、糖尿病視網(wǎng)膜病變等癌癥篩查,并在國內100多家頂尖三甲醫(yī)院進行落地。