AI辅助乳腺癌筛查再获突破！这一关键难点就这么被新型算法解决了

▎药明康德内容团队编辑

近年来，随着生活水平的提高，人们对健康愈发重视，早期癌症的筛查也在加速普及中。为了提高癌症筛查的准确性和效率，人工智能（AI）在癌症筛查领域已做出了不少尝试，尤其是在乳腺癌筛查场景中的应用。

目前，FDA已经批准了至少16款乳房X光筛查算法，用于癌症检测、癌症风险预测和质控。但近期的一项荟萃分析显示，AI似乎还没能发挥出其在帮助癌症筛查方面应有的潜力——在乳腺癌筛查方案中使用AI进行图像分析，纳入研究的36个AI系统中有34个（94%）的准确性都低于单位放射科医生作出的判断，而且所有36个AI系统的准确性都低于2位及2位以上的放射科医生作出的共同判断。

基于这项研究，学者们对目前辅助乳腺癌筛查的AI算法作出了如下总结：“近期的证据显示，现有的AI系统在乳腺癌筛查中无论是从质量还是数量上来说，都远未达到临床应用的要求。”

AI算法在乳腺癌筛查中的表现不佳，原因在哪儿？

来自华盛顿大学医学院的放射学助理教授Aaron Mintz教授指出，尽管可能的原因有很多，但其中最重要的还是由于用于训练AI的数据集来源过于单一，缺乏不同种族、不同地域及不同社会经济地位人群的多样化的高质量数据。

目前大多数大型AI培训队列的数据都来源于欧洲，这是因为欧洲有国家性的注册和筛查计划。而美国用于AI培训的数据集往往是单中心的，在数量和多样性上存在着严重的不足，这会导致据此训练的AI产生系统性的偏倚。

2020年，一项调查了用于深度学习算法的美国队列的地理分布研究显示，纳入的76项用于图像诊断的深度学习算法研究（涉及放射学、眼科、皮肤病学、病理学、胃肠病学和心脏病学）中，有56项（76%）使用了至少1个地理上可识别的队列来训练算法。在这56项研究中，来自加利福尼亚州的队列出现了22次（39%），来自马萨诸塞州的队列出现了15次（27%），来自纽约的队列出现了14次（25%）。56项研究中共计有40项（71%）使用了来自这3个州中至少1个州的患者队列。在其余47个州中，有34个州没有贡献任何患者队列，其余的13个州分别贡献了1至5个队列。

▲用于训练临床机器学习算法的美国患者队列表（按州统计）（图片来源：参考资料[3]）

也就是说，来自加利福尼亚州，马萨诸塞州和纽约州的队列被不成比例地大量用于训练临床深度学习算法，而其余47个州的人群数据就像是“数据沙漠”地带，基本上没有被覆盖到。

随着越来越多的乳腺癌筛查中开始应用这种基于多样性不足的数据集训练而成的AI算法，其在实际使用时的表现欠佳问题也逐渐被突显。尤其是乳腺癌的发病率在不同人种间存在着很大的差异，若用于AI训练的数据集缺乏对不同人群足够的代表性，将会导致大量的漏诊和误诊。

原因找到了，该如何解决？

构建大型、多样化的数据集的主要障碍之一是各医疗保健组织内部的数据都是孤立的。出于信息安全的考虑，管理患者健康数据的机构或管理者不会将这些数据分享出去。

然而，一种名为联邦学习（federated learning）的新兴AI训练技术有望突破这个困境。联邦学习不需要原始数据在各个组织间传送就可以让研究人员在本地实现信息共享。这是怎么做到的呢？

原来，联邦学习是让算法本身在各个数据提供点进行“旅游”，AI在接触到用于训练的数据后会进行加权评分，将评分结果而不是原始数据本身发送给研究人员，从而既获得了想要的数据结果，又保护了患者原始数据，这被认为是十分安全的。

如果所有的机构都愿意敞开他们数据库的大门，通过联邦学习将建立起一个生物医学数据合作研究的新世界——未来我们可以构建一个巨大的多站点联合乳腺影像学数据网络，除了标准的数字乳腺X线摄影和数字乳房断层合成信息，同时还囊括了大量的必需参数例如年龄、种族、性别、社会经济地位、地理位置、乳腺摄影设备、乳腺摄影发现、癌症诊断和患者结局等等不同的信息。

图片来源：123RF

通过来自这个多站点数据网络的数据集，可以确保目前处于边缘化的群体的数据也能被覆盖到。这种方法将解决“数据沙漠”问题，确保开发出来的AI能够适应多样的患者数据。

通过引入联邦学习，AI开发人员可以在大型真实数据集上验证他们的模型，来检验算法是否存在偏差或性能上的缺陷。一旦发现存在此类问题，研究人员可以通过深入访问该模型应用性能较差的队列对AI继续进行调整，最终建立起能在不同患者特征下都表现良好的技术。

联邦学习构建数据网络的现状与展望

目前，不少开源和商业数据平台的用户都参与搭建了这个多站点联合网络。当前的计划是，在城市和乡村代表性不足的社区站点进行推广并招聘相关人员，然后对其进行入职培训。

希望在不久的将来，为AI研究人员提供数据的机构能够把他们的数据摘要上传到类似目录的统一界面，研究人员可以通过浏览这种目录来联系想要的数据的持有者，最后通过联邦学习获取数据或是通过其他兼容的数据共享协议获得数据使用许可。

这种创新模式可以通过获取更多样的数据矫正AI对某一类人群的偏向性，加速AI适应真实世界的应用场景。在这种新形势下，医院必须认识到他们所拥有的多样化数据是一座尚待开发的宝库，并利用各种机会让这些数据发挥出更大的价值。

人们对AI帮助临床医生提高图像诊断的工作效率和准确性寄予了厚望，尽管目前还有很长的路要走，但我们相信，只要找到了问题的原因所在，有了明确的改进方向，各类机构和研究人员将会不遗余力地去解决，使新的算法更完善。期待AI在医疗领域中的应用和发展越来越好！

药明康德为全球生物医药行业提供一体化、端到端的新药研发和生产服务，服务范围涵盖化学药研发和生产、生物学研究、临床前测试和临床试验研发、细胞及基因疗法研发、测试和生产等领域。如您有相关业务需求，欢迎点击下方图片填写具体信息。

盖茨盛赞ChatGPT：人工智能历史意义不亚于“PC或互联网诞生”

腾讯科技讯 2月3日消息，微软联合创始人比尔·盖茨表示，像ChatGPT这样的AI聊天机器人将变得与个人电脑或互联网同样重要。盖茨今日接受采访时表示:“AI将成为2023年最热门的话题。这是不可避免的。”他随后补充道:“ChatGPT将变得与个人电脑、互联网同样重要。”盖茨在20世纪80年代帮助开创了个人电脑时代。在微软和苹果等

专访墨奇科技CEO邰骋：人工智能需要新的AI数据基础设施

“人工智能要发展到下一代，必然需要基础理论和基础设施的革新，特别是需要新的 AI 数据基础设施。”9月2日，新京报贝壳财经记者获悉，在近日举办的HICOOL2022全球创业者峰会上，AI（人工智能）基础技术和平台墨奇科技的项目团队获得“HICOOL 2022 全球创业大赛一等奖”。墨奇科技联合创始人、CEO 邰骋接受了新京报贝壳财

人工智能大会将举办智慧体育高峰论坛，发布AI＋体育蓝皮书

2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。主办方供图AI+体育，将成为世界人工智能大会的全新命题和新亮点。2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。论坛上将发布由上海人工智能研究院牵头，联合上海交通大学、上海体育学院、首都体育学院、同济大学等单位编制的国内首本《“AI+体育”蓝

大脑还有多少秘密？世界人工智能大会首开脑机接口主题论坛

在2022世界人工智能大会上，天桥脑科学研究院（简称TCCI）转化中心联合中国科学院上海微系统与信息技术研究所、脑虎科技、中国神经科学学会、上海市神经科学学会共同举办“脑·机智能融合-让大脑连接未来”论坛，这也是脑机接口首次以主题论坛的形式登陆世界人工智能大会。英国皇家工程院院士、上海交大医疗机器人研究院院

我国人工智能学科主要奠基人涂序彦逝世，享年 88 岁

IT之家 3 月 28 日消息，据北京科技大学消息，我国人工智能领域著名科学家、人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一、第二和第三届中国人工智能学会理事长、北京科技大学计算机与通信工程学院教授涂序彦先生，因病医治无效，于 2023 年 1 月 1 日 0 时 10 分在北京逝世，享年 88 岁。IT之家附讣告原文

梁建章：人工智能如何影响经济和各行各业

近日人工智能再次成为了热门话题。很多人好奇的是，人工智能未来到底会如何影响经济、人口和创新？今天，我跟大家分享个人的一些看法——谈谈人工智能对于经济以及各行各业的影响。自从深度神经网络出现以来，人工智能的发展速度超乎想象。ChatGPT的出现是个奇迹，超出了几乎所有计算机科学家的预料。一个简单的神经网络模

AI炒股新纪元？头部量化私募幻方宣布全力探索人工智能应用

头部量化私募幻方宣布成立新的独立的研究组织，探索AGI（即通用人工智能，Artificial General Intelligence）的本质。4月14日，幻方发布公告显示，幻方将集中资源和力量，全力投身到服务于全人类共同利益的人工智能之中，成立新的独立的研究组织，探索AGI的本质，“我们将充分而持续地投入，不做中庸的事，用最长期的眼光去

卷完模型卷芯片！为提升效率，微软准备推出专属人工智能芯片

在早期成功押注ChatGPT的研发公司OpenAI之后，市场发现，微软在其武器库中还拥有另一个秘密武器：自研人工智能芯片，这一芯片将为生成式AI背后的大型语言模型提供强大动力。4月18日周二，据媒体援引两位知情人士的话说，微软早在2019年就开始开发内部代号为Athena的AI芯片。其中一位知情人士称，一些微软和OpenAI的员工已经

真正的应用级量子人工智能距离我们还有多远？

·“量子科技是强国竞争的战略制高点，但不能一哄而上，低水平重复内卷，或片面追求发论文、抢专利，各自为战，闭门造车，而缺少真正的技术投入和系统配合。”·“当下量子系统的规模非常重要，而这很大程度上取决于芯片。”当前，发展量子计算和人工智能已成为世界各国的重要战略，两者交汇而生的量子人工智能更是发展迅速

为您推荐