by Bob Yirka , Tech Xplore
來自巴比倫健康學院和大學學院的一個聯合研究小組發明了一種算法,他們聲稱可以在重疊的醫學數據集中找到信息之間的因果關系。他們寫了一篇描述他們算法的論文,并將其上傳到arXiv預打印服務器。他們還將在今年的人工智能發展協會會議上介紹他們的研究。
在人工智能研究中,尋找一種系統的方法來篩選數據,以找出單個病人出現特定情況的原因是一個重大挑戰。如果一個病人最近打噴嚏的次數超過正常值,是不是因為過敏原被引入了他們的環境?或者他們感冒了?更糟糕的是,也許他們的鼻竇或大腦中有癌細胞。目前在這種情況下尋求正確答案的系統是基于人的。醫生問問題,并搜索他們的記憶尋找答案。如果他們找不到,他們可以咨詢其他醫生或學習醫學教科書或在線數據庫。
這個系統有它的優點,當然,它是最好的。但它也有缺點,它受到人類記憶和足智多謀的限制。許多計算機專家認為有更好的方法讓計算機來做這件事。目前這是不可能的,但科學家們正在研究。在這項新的工作中,研究人員引入了一個系統,該系統具有一種算法,可以分析來自不同、重疊數據集的數據,并找到因果關系。
該算法基于熵的概念,在熵中任何系統都會隨著時間的推移變得更加無序。研究人員提出,熵與數據集中的信息一起存在,并且因果力比描述其結果的數據更有序。既然如此,就應該可以反向尋找原因,這正是他們的算法所做的。
該系統能夠在比較已知因果關系的數據集時正確評估乳腺癌腫瘤的大小和結構,確定它們之間沒有因果關系,但兩者都是腫瘤是良性還是惡性的指標。
更多信息: Anish Dhir, Ciarán M. Lee. Integrating overlapping datasets using bivariate causal discovery. arXiv:1910.11356v2 [stat.ML]: arxiv.org/abs/1910.11356
原文鏈接:https://techxplore.com/news/2020-02-ai-relationships-overlapping-medical-datasets.html
聲明:本文由 Newfellow 編譯,中文內容僅供參考,一切內容以英文原版為準。