华南理工团队建立眼科专用AI数据集，累计涵盖30多种眼疾，推动病理性近视自动筛查工具的面世

深科技 | 2024-02-26 20:47:14 阅读：90

发布文章

“我们研发出一种智能眼病筛查系统，它集成了基于数据集训练的 AI 模型和眼底照相机等系列硬件设备，能在完成眼底彩照拍摄后 15 秒内，针对 30 多种疾病给出诊断建议，而这些都基于高质量的训练数据。”华南理工大学许言午教授表示。

图 | 许言午（来源：许言午）‍

数据，也是许言午近年来打交道最多的对象。在眼科 AI 领域，糖尿病视网膜和青光眼一直是学者们关注的热门病种。关于这两个病种的自动筛查和诊断，此前已经取得了显著发展，也有不少医用设备落地。

但是，鲜少有人研究病理性近视眼的自动筛查诊断，该疾病是一种不可逆性致盲性眼病[1]。在 40 岁以上的中国人群中，病理性近视眼的患病率大约为 3.1%，年发病率约为 0.05%。

病种公开数据的匮乏，是该疾病未得到充分研究的重要原因。同时，数据也是医疗 AI 在发展中面临的一大挑战。医疗数据的获取，通常面对隐私、伦理等方面的限制。

不同于其他的 AI 细分领域，由于对专业知识和对经验的要求，医疗数据的标注通常要由专职医生完成。

这更加拉高了数据的获取成本和获取难度。眼科 AI 领域的研究也是如此，数据缺失成为前行路上最大的一只“拦路虎”。

建立 iChallenge 数据集，让模型训练“弹药”更丰富

几年前，许言午开始研究眼科 AI，当时眼科图像分析尚未成为热门方向，研究者少、论文也少。不过，他有幸获得一些数据资源，相关成果也获得了不错的影响力。

这让他深刻认识到，如果想推动这个领域的发展和壮大，必须让公开数据集更加丰富，只有这样才能为研究者们提供模型训练的“弹药”。而这也正是许言午投身数据集建设的初衷。

后来，他的这个想法得到了中山大学张秀兰教授这位一线临床专家的支持。她非常愿意贡献所在医院收集到的数据，和许言午共同推动国内眼科图像分析领域的发展。

随后，许言午和张秀兰教授一同建立了名为 iChallenge 的数据集，在遵循数据隐私和伦理规范的前提下，许言午等人每年都会针对眼科图像数据进行收集、标注和公开。

该团队为医生群体搭建了完善的标注框架和标注流程，同时也为他们提供标注工具，让医生可以在标注工作中充分发挥专业知识。

而为了推动病理性近视自动筛查诊断领域的发展，课题组在 iChallenge 中发布了 PALM 数据集。

当下，全球范围内的病理性近视患病率正在不断增长，在眼疾 AI 自动诊断工具日渐普及的背景下，PALM 数据集的公开非常及时。PALM 数据集累计包含 1200 张和病理性近视相关的眼底彩照。

以往的公开眼科数据集通常只提供患病与否的标签。而 PALM 数据集除了提供患病与否的标签之外，还提供了解剖结构和相关病变的标注，具体包括视盘分割、中央凹定位、斑片状视网膜萎缩和视网膜脱离这两种病变区域的分割标注。

这些标注能提供更加丰富的细节信息，借此提升模型效果，进而更全面地分析疾病模式，最终提供更准确的病理性近视诊断建议。

据了解，所有标注工作均由中山大学中山眼科中心的 7 名眼科医生完成，这是一群平均年资在 8 年以上的医生群体。另外，一名年资超过 10 年的眼科医生负责把控标注质量。

2018 年，iChallenge 数据集发布了第一个子数据集 REFUGE——1200 张分析青光眼的眼底彩照数据集。

后来，该团队在医学影像顶级期刊 Medical Image Analysis（2022 年 IF 为 10.9）上发表了关于 REFUGE 的综述论文，论文题为《REFUGE 挑战:基于眼底彩照自动分析青光眼方法的统一评估框架》（REFUGE Challenge: A unified framework for evaluating automated methods for glaucoma assessment from fundus photographs），许言午和张秀兰担任通讯作者。

这篇综述论文获得了出乎意料的影响力，此后 Medical Image Analysis 期刊的投稿类别中新增了“Challenge Report”选项，专门用于接受此类算法挑战比赛的相关论文。

截至目前，这篇论文已入选《基本科学指标》近十年高被引论文。在谷歌学术上的引用次数也已经达到 502 次。

图 | 相关论文（来源：Medical Image Analysis）

让数据集“物尽其用”，连续举办八届比赛引入创新活水

数据集的建设耗时耗力，为了让数据集真正实现“物尽其用”，许言午开始举办 iChallenge 算法挑战赛，希望通过比赛的形式、竞争的性质，激发学界和业界的创新热情。

同时，他充分利用自己的另外一个身份——医学图像顶级会议 MICCAI（Medical Image Computing and Computer Assisted Intervention Society）OMIA 国际眼科研讨会创始主席的“便利”，将数据集的公开、挑战赛的举行、以及 OMIA 研讨会三者相结合，把数据集和挑战赛主动带到眼科 AI 研究者们面前。

事实证明，这两种数据集的推介方式非常有效。截至 2023 年，这一赛事已经连续举办 8 次，累计超过 5000 支队伍参加过挑战赛。参赛者们利用数据集训练他们的 AI 模型，提出了很多创新解决方案。

在 2021 年举办的 GAMMA 挑战赛中，曾经有一个由医学生组成的参赛队伍，获得单任务前三名的好成绩。医学生普遍被认为没有太多计算机基础，在算法设计和模型训练环节上似乎不占优势。

但是这组队伍却在一众图像分析专业选手中脱颖而出，这让作为赛事举办者的许言午感到非常惊喜，也深深感受到 AI 的普及程度。

他说：“如果人人都能像这些学生一样，将 AI 和个人专业领域的知识经验相结合，必将给个人和团队带来额外的竞争优势。”

在 2023 年举行的 STAGE 挑战赛中，有两支企业参赛队伍冲进前三名。STAGE 挑战赛的难度很高，作为主办方的许言午等人预计只有具备良好临床背景的参赛者，才能设计出更具针对性的高性能算法。

出乎意料的是，来自芜湖明瞳数科公司的两人团队 AIFuture Lab、和来自唯智医疗科技（佛山）有限公司的三人团队 VisionWise，分别获得冠军和季军。这也是 iChallenge 算法挑战赛中第一次出现 2 支企业队伍获奖的情况。

这让许言午感受到企业愈发重视产研结合的趋势。目前，iChallenge 数据集已经成为全球最大的精准标注眼科数据集，截至 2023 年，iChallenge 数据集支撑了 750 余篇学术论文的发表。一系列挑战赛也成为全球眼科 AI 研究者们探索、创变和交流的舞台。

病理性近视自动筛查诊断设备或将面世

总的来说，基于 PALM（iChallenge）数据集训练的病理性近视自动筛查诊断算法，有望落地一款病理性近视自动筛查诊断设备。

同时，自动筛查诊断设备可以辅助医生进行疾病诊断，提升诊疗效率，实现医疗资源普惠。

随着老龄化进程的加速，再加上患者呈现出低龄化趋势，眼病患者数量正在日渐增长。

其中，许多眼病存在较高的致盲风险，发现得越晚风险就越大，治疗支出也就越高。因此，早期筛查和早期诊疗具有重要意义。

然而，在基层以及大部分偏远落后地区，医生患者数量的不匹配，导致无法开展大规模人群的定时筛查，同时也存在医生缺少专业能力的情况。而引入 AI 自动筛查诊断设备则有望改善这一难题。

已有研究表明[2]，相比人工筛查和非 AI 辅助远程筛查，AI 辅助远程筛查眼病的经济效益最高，有助于更多早期眼病患者的检出和及时转诊。

通过 AI 自动筛查诊断设备，能够实现致盲眼病的“早期发现、早期诊断、早期治疗”，从而为患者带来更多福祉。

随着人口老龄化程度的增加、以及人们对于眼健康关注度的提升，背后蕴藏着多种眼疾自动筛查诊断的巨大需求。

医疗数据共享未来方向：多模态、多地区、多科室

过去，该课题组公开的数据集以眼结构数据为主，主要涵盖眼底彩照、AS-OCT 图像等，这些数据集为眼部结构相关分析提供了基础。

2023 年 10 月，iChallenge 公开了 400 套分析青光眼的 3D 光学相干断层成像检查和视野检查关键指标数据。

其中，视野检查是眼科检查的一种，关键指标主要包括视野灵敏度、视野平均偏差、视野模式偏差等。

在一些疾病中，比如青光眼、视神经疾患、脑部疾病，患者会出现视野缺损或缺失的情况。

视野检查数据，则能呈现被检查者的眼部功能状态。结合分析眼结构数据和眼功能相关的数据，人们将能更全面地学习和理解眼部疾病的特征，更深入地挖掘眼部疾病与视野异常的潜在关联，从而进行更全面、多角度的眼健康评估，也为医生提供更为完整的诊断依据。

2023 年公开的视野检查数据是团队在开放更多模态数据方面迈出的第一步。而在 2024 年，iChallenge 数据集会继续增加新的子数据集，以及涵盖更多模态的数据，同时算法挑战赛也会随数据集公开举行。

众所周知，医疗数据在不同地区呈现明显的差异。如果想要获得更加全面的研究成果，从训练数据开始就需要囊括各个地区的数据。

因此，未来他们也将尝试与在东南亚地区的合作伙伴一起，共同建立该地区的眼科数据集，为该地区的研究者填补数据的空白，也希望能借此促进不同地区间的数据共享与合作，进一步推动全球范围内眼科医学的发展。

此外，主动健康是现在备受关注的一个方向。许言午将携手合作者建立更多科室的公开数据集，例如体检科、心血管科、肾脏科等，希望能复制他们在眼科 AI 领域的数据集建设经验，通过数据集开放、举办挑战赛和发表综述论文等方式，为主动健康领域的发展和创新贡献一份力量，最终实现成果的落地和转化。

参考资料：

1.中华眼科杂志, 2021, 57（6） : 401-405.

****：https://rs.yiigle.com/CN112142202106/1323618.htm

2.Hanruo Liu, Ruyue Li, Yue Zhang, Kaiwen Zhang, Mayinuer Yusufu, Yanting Liu, et al. Economic evaluation of combined population-based screening for multiple blindness-causing eye diseases in China: a cost-effectiveness analysis. The Lancet Global Health 2023, 11（4）: 456-465

运营/排版：何晨龙

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。