MIT研究员最新AI模型可提前5年预测乳腺癌风险!-[db:标签3]

  • 时间:
  • 浏览:2
  • 来源:理财金字塔

乳腺癌是美国第二大、中国第一大女性恶性肿瘤相关的致死因素。2019年的最新数据显示,美国有近27万名女性被诊断为乳腺癌,4万多人因此死亡。在中国,仅2015年就有约28万乳腺癌新发病例,位居女性恶性肿瘤发病的首位。在现代医学的众多研究领域中,如何尽早发现和治疗乳腺癌,早已成为一个十分重要的核心课题。

近日,来自麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)和马萨诸塞州综合医院的研究人员合作,共同打造出了一种深度学习模型。通过分析约9万张乳腺X光照片与6万多名患者的真实数据,该模型可以找出人眼不易察觉的精细信息和规律,作为预测女性是否可能在未来五年内罹患乳腺癌的依据。相比于传统检测模型,该模型将预测准确率从18%提高到31%,在不同族裔女性罹患乳腺癌风险的预测普适性上取得突破。

新的深度学习模型可以在癌症发病(右图)前4年,识别出乳腺癌风险(左图)

个性化检查方案,抓住最佳治疗时机

乳腺X光检查技术是目前临床医学广泛使用的检测乳腺癌风险的手段,但业界对检查频次和合适的检查年龄一直存在争议。美国癌症协会认为女性应从45岁开始进行年度检查,有些机构则建议50岁以上的女性每两年接受一次检查。不过由于个人体质各异,其罹患乳腺癌的风险也不同,以年龄作为标准划分筛查频率过于泛化,很容易无法及时发现早期乳腺癌而错失最佳治疗时机。另外,由于X光的辐射性和乳腺的敏感性,很多人甚至认为乳腺癌X光筛查对女性有一定危害。

针对这一情况,MIT的研究人员认为如果能够提前预测出女性罹患乳腺癌的风险系数,可以帮助个体制定更完善的个性化筛查方案,如建议高危人群在 30 多岁时进行年度检查,低危人群则每三年检查一次。该论文的作者之一Regina Barzilay博士是乳腺癌幸存者,她希望通过该模型帮助更多女性将乳腺癌风险扼杀在摇篮中,抑制其发病率增长趋势。

Regina Barzilay博士

设计检测模型,获取精准信息

自1989年第一个乳腺癌风险预测模型诞生以来,很多风险因素被囊括在内:年龄、家族遗传、荷尔蒙和生殖激素、乳腺密度等。但是由于大多数因素与乳腺癌的关联度较低,导致这些传统模型对个体的预测并不准确。

与传统的检测模型不同,MIT的研究团队开发出了一种全新的深度学习模型——基于逻辑回归模型+图片识别深度学习模型的混合模型,使用乳腺X光照片与真实已知结果对模型进行训练、验证和测试

“1960年以来,放射科医生已经注意到女性乳腺X光片上可以看到各具特性且不断变化的乳房组织,代表着遗传、激素、怀孕、哺乳、饮食、体重变化对乳腺产生的影响。现在我们可以利用深度学习在风险评估中更准确地利用这些详细信息,从而提出个性化的预测结果和预防方案。”Regina Barzilay表示。

首先,每一个风险因素都会经过独热编码(one-hot encoding)——一种在机器学习中常见的变量转换机制,将变量的状态用 0 和 1 组成的二进制向量表示,再将所有编码整合组成风险因素向量,作为逻辑回归模型(risk-factor-based logistic regression model: RF-LR)的输入值。

在此基础上,研究人员又开发了一套以深度卷积神经网络(CNN)为核心的图片识别模型(image-only DL),使用开源的预训练模型 ResNet-18 。他们没有根据图片分辨率变化调整模型,直接以1664 x 2048 像素的乳腺X 光照片作为输入值进行训练。

风险因素的训练、验证及测试

最后,他们整合了逻辑回归和图像识别两个模型,制作了一个混合模型(Hybrid DLModel)。结合风险因素和图像信息,该模型开始学习预测女性在五年内是否会出现乳腺癌风险。

几种模型预测准确率的比较

以乳腺密度为例,与目前临床上使用乳腺密度作为评估乳腺癌风险标准的Tyrer-Cuzick模型相比,该模型识别风险的准确率有所提高。研究人员发现,高乳腺密度且模型评估乳腺癌风险高的患者癌症发病率,是乳腺密度和乳腺癌风险都较低的患者的3.9倍。这一趋势在不同女性群体中都体现了出来。

对不同族裔的女性预测准确率相同

值得注意的是,该论文提出的深度学习模型提高了对不同族裔女性的预测适用性,而包括Tyrer-Cuzick模型在内的很多现有模型大多依照白人女性数据建立,对非白人族裔的预测效果较差。该论文的突破对于预防乳腺癌的种族平等尤为重要,数据显示黑人女性罹患乳腺癌的机率比白人女性高40%,这可能由于不同族裔女性在检测和获得医疗保健方面的差异。

模型对不同族裔女性未来5年罹患乳腺癌的风险预测

研究人员成该深度学习模型在未来可以为乳腺X光检查奠定基础,从而预测患者是否可能存在其他健康风险,如心血管疾病、胰腺癌等。他们希望这个模型能帮助更多人早发现、早预防、早治疗,将癌症风险扼杀于摇篮之中。

猜你喜欢

净利大跌频现亏损 区域酒企遭遇生死考验

近日,白酒企业陆续发布2019年上半年业绩报告和业绩预告,白酒行业“马太效应”进一步加剧,并迎来新的拐点。一方面,一线白酒品牌业绩保持继续增长,但增速趋于放缓;另一方面,部分区

2019-07-24

上半年工业经济形势如何?工信部细数五大亮点

23日上午,国新办就2019年上半年工业通信业发展情况举行发布会。工业和信息化部副部长辛国斌在会上指出,上半年我国的工业经济形势呈现以下特点:一是经济运行总体平稳,符合预期;二

2019-07-24

多国“药荒”愈演愈烈,政府出招遭吐槽

近年来,欧洲多地相继出现药品匮乏,许多病人等药续命却发现无处可买。上个月,葡萄牙公布了一项调查报告,数据显示五分之一病人拿着医生处方却无处购买处方药。近日,法国政府也出台一项计

2019-07-24

202项!自贸试验区形成大批制度创新成果复制推广

202项!自贸试验区形成大批制度创新成果复制推广记者23日从商务部获悉,我国自贸试验区设立近6年来,累计形成202项制度创新成果得以复制推广,切实发挥了全面深化改革和扩大开放试

2019-07-24

英国推动“电信供应链多元化” 华为有信心继续合作

英国政府22日公布了一份电信行业供应链评估报告,其中涉及5G以及光纤网络的建设,建议采取一系列新措施,推动“电信供应链多元化”。中国华为公司表示,该报告使其有信心继续与运营商合

2019-07-24