《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 其他 > 業(yè)界動(dòng)態(tài) > 能和谷歌和蘋(píng)果齊名,Sophia Genetics靠的是什么?

能和谷歌和蘋(píng)果齊名,Sophia Genetics靠的是什么?

2018-02-20
關(guān)鍵詞: SophiaGenetics 基因 人工智能

  在最新的一期《麻省理工科技評(píng)論》評(píng)選出的2017年最聰明的50家公司中,除了大家耳熟能詳Google、Apple、Amazon、Alibaba等巨頭,以及NVdia、Telsa、SpaceX等明星公司外,還有一家看似不起眼的公司引起了我們的注意——Sophia Genetics。

  這是一家總部位于瑞士洛桑的的生物醫(yī)藥公司,成立于2011年,主營(yíng)業(yè)務(wù)是幫助醫(yī)療機(jī)構(gòu)建立基因分析系統(tǒng),協(xié)助其利用機(jī)器學(xué)習(xí)技術(shù)分析患者基因數(shù)據(jù),給出診療建議。2017年9月該公司拿到歐洲知名風(fēng)投機(jī)構(gòu)Balderton的3000萬(wàn)美元的D輪融資。

  過(guò)去兩年里AI和基因熱度不減,這兩個(gè)領(lǐng)域似乎在世界范圍內(nèi)都不是新鮮事,為何唯獨(dú)選擇了Sophia Genetics?

  智能,平臺(tái)與隱私

  智能

  當(dāng)我們對(duì)給定樣本測(cè)序完畢后,基因測(cè)序診斷分析一般要經(jīng)過(guò)三個(gè)步驟:序列比對(duì)(Alignment)—變體識(shí)別(Variant Calling)—診斷預(yù)測(cè)(predictions)。

  每一個(gè)部分都有對(duì)應(yīng)的通用算法。但是由于基因種類(lèi)太多,這些通用算法的效果并不讓人十分滿意。

  Sophia Genetics于是抓住了這個(gè)痛點(diǎn),研制出了三款以人工智能為基礎(chǔ)的基因分析專利技術(shù):PEPPER?, MUSKAT? 和 MOKA?,分別是為了識(shí)別單核苷酸多態(tài)性變異與刪除(SNP and INDEL),識(shí)別拷貝變異數(shù)(CNV)以及對(duì)基因的變異進(jìn)行嚴(yán)重性的評(píng)估。

  編者注:單核苷酸多態(tài)性變異,堿基的刪除,拷貝變異都是基因突變的種類(lèi)。分析基因,很大程度上就是在找到這些突變基因,并且評(píng)估他們會(huì)帶來(lái)的潛在危險(xiǎn)。)

  由于筆者未能在網(wǎng)上找到其專利數(shù)據(jù),因此不能做出進(jìn)一步分析,但是根據(jù)官網(wǎng)顯示,這些技術(shù)能夠?qū)崿F(xiàn)99%以上的準(zhǔn)確率。

5a740f5b8b62e-thumb.png

  Sophia Genetics CEO Dr. Jurgi Camblong

  Sophia Genetics的聯(lián)合創(chuàng)始人之一,現(xiàn)任CEO Jurgi Camblong博士在一次采訪中談到,智能算法作為企業(yè)的核心技術(shù),他們投入了大量精力進(jìn)行研發(fā)。

  為了得到適用范圍更廣的算法,他們花費(fèi)幾年時(shí)間組織專家一起標(biāo)注了來(lái)自10000名患者的近50000條基因信息,從最底層開(kāi)始設(shè)計(jì)算法,以求完全理解每一個(gè)細(xì)節(jié)。

  功夫沒(méi)有白費(fèi),Sohpia公司智能算法對(duì)基因變體的分類(lèi)準(zhǔn)確率由原來(lái)的85%上升到99%。

  Jurgi 面對(duì)媒體采訪時(shí),表示“正是這種一步步從底層開(kāi)始建立模型,融合專業(yè)知識(shí),力求了解每一個(gè)細(xì)節(jié)的技術(shù)堅(jiān)持,讓他們和領(lǐng)域內(nèi)其他的公司區(qū)分開(kāi)來(lái)。”

  投資方Balderton的合伙人James Wise也對(duì)媒體表示,Sophia Genetics 最吸引他們的一點(diǎn)在于,他們的算法能夠處理來(lái)自各種不同測(cè)序儀的基因數(shù)據(jù),并且給出的預(yù)測(cè)已經(jīng)達(dá)到可供臨床使用的準(zhǔn)確率。

  目前,Sophia Genetics主打腫瘤,遺傳性癌癥,心血管疾病,代謝疾病,兒科疾病五大門(mén)類(lèi)的基因輔助診斷與智能預(yù)測(cè)。

  涉及的疾病診斷門(mén)類(lèi)

  平臺(tái)

  如果說(shuō)對(duì)技術(shù)的執(zhí)著是Sophia Genetics能夠脫穎而出的底氣與資本,準(zhǔn)確把握醫(yī)院需求,建立共享平臺(tái)則是其對(duì)未來(lái)的憧憬與投資。

  Sophia DDM是公司推出的一款平臺(tái)。DDM代表 Data-Driven for Medicine (以數(shù)據(jù)驅(qū)動(dòng)醫(yī)療),反映了公司的愿景。

  上述提到的智能算法,都包含在這款平臺(tái)上。Sophia Genetics瞄準(zhǔn)的是B端的醫(yī)療機(jī)構(gòu),其核心業(yè)務(wù)就是通過(guò)幫助那些有測(cè)序條件的醫(yī)療機(jī)構(gòu),接入SophiaDDM平臺(tái),從而使得醫(yī)務(wù)工作人員能夠快速準(zhǔn)確得對(duì)基因進(jìn)行分析。

  在醫(yī)生上傳基因數(shù)據(jù)的同時(shí),其實(shí)也同時(shí)貢獻(xiàn)了一條新的基因數(shù)據(jù),并且很有可能會(huì)給出自己的診斷結(jié)果。

  這樣一來(lái),隨著使用DDM平臺(tái)進(jìn)行分析的人數(shù)越來(lái)越多,后臺(tái)積累的標(biāo)注過(guò)的數(shù)據(jù)也越多,底層的智能算法,得益于高質(zhì)量的數(shù)據(jù),表現(xiàn)也會(huì)越來(lái)越好,由此形成了一個(gè)良性循環(huán)。

  當(dāng)被問(wèn)到為何要如此堅(jiān)定的推進(jìn)平臺(tái),提供軟件服務(wù),Camblong 表示,隨著測(cè)序成本的不斷下降,人們獲取自己的基因信息也變得越發(fā)容易,這也就意味著市場(chǎng)上必然會(huì)有大量的對(duì)于快速、準(zhǔn)確的基因分析算法的需求。

  好的基因分析算法離不開(kāi)專業(yè)知識(shí)和優(yōu)質(zhì)的數(shù)據(jù)。因此,如果能夠與醫(yī)院建立良好的聯(lián)系,幫助醫(yī)院建立系統(tǒng),去分析患者的基因數(shù)據(jù),這樣一方面得到了患者的數(shù)據(jù),另外一方面還能夠利用醫(yī)生的專業(yè)知識(shí)對(duì)基因進(jìn)行標(biāo)注。

  平臺(tái)連接的醫(yī)院越多,儲(chǔ)存的基因數(shù)據(jù),凝結(jié)的專業(yè)知識(shí)也越多,由此訓(xùn)練出的算法更加智能,能夠吸引的醫(yī)院也更多。這是一個(gè)自激過(guò)程。

  當(dāng)然,Camblong 坦言,這個(gè)過(guò)程并不輕松。

  這是一個(gè)先有雞還是先有蛋的過(guò)程—也就是說(shuō),如何在診斷算法表現(xiàn)并不突出的情況下,和醫(yī)院建立好的聯(lián)系?Camblong給的答案是,發(fā)現(xiàn)醫(yī)院當(dāng)時(shí)在基因分析中面臨的最大問(wèn)題,先解決這個(gè)痛點(diǎn)!

  在當(dāng)時(shí)2011年,他們發(fā)現(xiàn)的痛點(diǎn)的是,醫(yī)院里采集的基因數(shù)據(jù)精度太低了,噪聲太大。因此團(tuán)隊(duì)便在早期專門(mén)設(shè)計(jì)算法來(lái)解決提高采集基因數(shù)據(jù)的準(zhǔn)確率。早期的幫助于是換來(lái)了醫(yī)院的長(zhǎng)期信賴與支持。

  2011年公司成立。從2014年初推出平臺(tái),到2014年底平臺(tái)上就有了50家醫(yī)院。而現(xiàn)在,這個(gè)數(shù)字已經(jīng)上升到了400。

  這400家醫(yī)院分部于全世界55個(gè)國(guó)家,截至發(fā)稿,官網(wǎng)上顯示,已經(jīng)有167000名患者通過(guò)DDM平臺(tái)得到了診斷。

  Sophia Genetics號(hào)稱要推進(jìn)基因測(cè)序分析的“去中心化”,要建立世界上最大的臨床基因社區(qū),讓基因密碼真正服務(wù)于臨床診斷,幫助更多的患者盡早擺脫病魔。

  對(duì)一個(gè)尚處在D輪融資階段的公司來(lái)說(shuō),這個(gè)愿景十分遠(yuǎn)大,但是我們卻確實(shí)能夠看到Sophia Genetics在一步步得推進(jìn)自己的平臺(tái)帝國(guó)。

  隱私

  在平臺(tái)共享基因數(shù)據(jù),這個(gè)想法很讓人心動(dòng)。但是,隨之帶來(lái)最大的麻煩就是基因數(shù)據(jù)的隱私安全問(wèn)題。

  自從基因分析走入人們視線以來(lái),有關(guān)基因數(shù)據(jù)的隱私安全,倫理道德的討論就不絕于耳。Sophia Genetics也想到了這一點(diǎn),隱私安全是它的第三項(xiàng)法寶。最后簡(jiǎn)單介紹一下Sophia Genetics在用戶數(shù)據(jù)隱私上的考量。

  Sophia Genetics的信息安全管理體系拿到了ISO27001的國(guó)際認(rèn)證。

  同時(shí),它和洛桑聯(lián)邦理工學(xué)院信息安全相關(guān)專家,斯坦福大學(xué)的生物醫(yī)學(xué)專家正在共同研發(fā)一款能夠保障在全球范圍內(nèi)儲(chǔ)存獲取平臺(tái)上基因數(shù)據(jù)的信息安全技術(shù)(SECRAM, Selective retrieval on Encrypted and Compressed Reference-oriented Alignment Map,有專利信息)。

  公司承諾,所有的私密信息都將在私有的數(shù)據(jù)中心,至少保存5年,同時(shí)嚴(yán)格限制讀取。所有患者的個(gè)人信息將不會(huì)以任何形式披露。

  Camblong 表示,在這個(gè)行業(yè)已經(jīng)有一些公司做了不好的示范,沒(méi)能保護(hù)好患者的數(shù)據(jù),公司因此非常重視隱私問(wèn)題。

  Sophia Genetics也永遠(yuǎn)不會(huì)考慮面向C端個(gè)人客戶,他們堅(jiān)信,大的醫(yī)療機(jī)構(gòu)始終能夠吸納更多客戶,與這些大型醫(yī)療機(jī)構(gòu)打交道也會(huì)讓信息安保流程更加可靠。

  尾聲

  在被問(wèn)到對(duì)公司未來(lái)發(fā)展的規(guī)劃時(shí),Camblong談到,希望在推進(jìn)DDM平臺(tái)的同時(shí),強(qiáng)化多層次醫(yī)療數(shù)據(jù)的處理能力。

  具體來(lái)說(shuō),希望能夠綜合醫(yī)學(xué)影像數(shù)據(jù)和基因數(shù)據(jù),從而從多個(gè)角度為臨床提供參考和決策信息。

  比如,借助影像數(shù)據(jù)和基因信息,醫(yī)生可以得知腫瘤在未來(lái)的一段時(shí)間內(nèi)的生長(zhǎng)情況,由此決定是否要立刻實(shí)施手術(shù)。這也是所謂精準(zhǔn)醫(yī)療的應(yīng)用場(chǎng)景。

  Sophia在希臘語(yǔ)中是智慧的意思,我們也衷心希望,未來(lái)有那么一天,能像Jurgi Camblong 希望的那樣,我們能夠參透基因密碼告訴我們的所有信息,從而更好得戰(zhàn)勝病魔,面對(duì)未來(lái)。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。