“
糖尿病往往会导致眼部视网膜病变,患者需要接受视网膜检查以诊断眼部问题。这种检查通常需要专业眼科医师的参与。本案例的临床问题可以定位为“如何开发一种人工智能系统,用于自动检测视网膜病变,提高检测的效率并进行及时干预,降低医生负担,改善患者的视力健康”。
”
一
问题描述
通过与多名眼科医生的检验结果比较,研究模型是否能够准确地通过眼底光相干断层扫描OCT图片检查出可疑的眼部病变。
二
数据集构建
1)目标人群
本案例需要诊断糖尿病导致的眼部病变。为了更好地诊断眼部疾病,区分眼疾成因,甚至通过眼部疾病来反向推测糖尿病,本研究的目标人群定位为多家医院眼科的就诊患者。
在此基础上,数据集应尽可能涵盖各种年龄、性别、糖尿病类型和糖尿病持续时间的患者,以确保模型的广泛适用性。糖尿病患者可能同时患有其他健康问题,如高血压、高胆固醇、肾病等。考虑将这些因素纳入模型的训练中,以模拟真实世界中的多种健康条件。胰岛素治疗、口服药物治疗和饮食控制等不同的治疗方案,都可能会影响眼部病变的风险和进展,所以在选择样本时也要考虑这些因素。另外,还要确保数据集的类别平衡,以防止模型在某些类别上过拟合。
2)数据来源及标注
收集来自多个医疗机构的视网膜图像数据,然后由多名专业眼科医师将图像中的病变区域和正常区域标记出来,同时标注病变的类型和严重程度。这些标注将用于训练模型,但是这些标注也可能存在一些错误。例如糖尿病患者常常会出现微血管异常,包括微动脉瘤、出血、渗漏等,标注者可能会将这些异常标注为其他类型的病变,或者忽略它们。糖尿病性黄斑水肿是糖尿病视网膜病变的常见表现之一,它会导致视网膜中央区域的水肿,标注者可能会误将正常的黄斑水肿或其他黄斑疾病标注为糖尿病性黄斑水肿,OCT检查图像的分类标注示例如图4-11所示。
图4-11 OCT检查图像分类标注示例
3)研究队列
构建一个强大的模型需要大规模的数据集,例如数千例/数万例患者的视网膜图像。为了构建这样的数据集,首先需要随机抽样并加以检查,以防止出现明显的抽样误差。其次需要确认研究队列的大小和各种眼部疾病中阳性和阴性的数据比例,还要考虑到这些疾病的实际发病率,为其提供相对应的阴性数据。
4)模型选择和开发
将数据集分成训练集、验证集和测试集。训练集用于模型训练,验证集用于调优超参数和监控模型性能,测试集用于最终性能评估。选择适合任务的深度学习模型架构,如基于卷积神经网络(CNN)的分类模型。对于糖尿病眼部疾病诊断,可以采用具有多层卷积层的网络来提取图像中的特征。使用训练集对模型进行训练的过程中,模型会尝试自动调整其内部权重和参数,以最小化预测值与实际标签之间的误差。可以通过选择适当的损失函数,例如交叉熵损失,来度量模型的性能。在训练期间,采用梯度下降或其变种进行参数优化,以降低损失函数的值。最后,使用验证集数据,对模型的超参数进行调优,例如学习率、批次大小(batchsize)、卷积核大小等。此外,在训练期间,需要定期监控模型在验证集上的性能,以检查是否存在过拟合或欠拟合问题,并根据需要调整模型。
5)度量标准
评估模型性能时,通常要选用多种指标进行评估。针对分类任务,首先可以使用准确率来评估,准确率是最常用的度量指标之一,它衡量模型正确分类样本的比例。其次是精确率和召回率。精确率衡量模型在预测为正类别的样本中的正确性,而召回率衡量模型在实际正类别样本中成功预测的比例。精确率和召回率是一种权衡关系,即提高一个指标可能会降低另外一个。另外,F1分数是精确率和召回率的调和平均值,可以综合考虑这两个指标。除此之外,还可以使用混淆矩阵作为评价指标进行评估,混淆矩阵提供了详细的分类性能信息。
6)假设检验
在实际应用中,我们可以对模型的性能进行假设检验,以确保模型的预测能力优于随机猜测或传统的诊断方法。例如使用t检验或Wilcoxon符号秩检验等统计方法来实现。
7)显著性水平
设定显著性水平(例如0.05),并确定模型的性能是否达到统计显著水平。然后将模型的性能与专业眼科医师的诊断能力在比较组上进行比较,以验证模型的有效性。
总结来说,上面的示例展示了医工结合实验设计的流程,具体说明了如何将人工智能应用到实际的临床问题中,包括数据收集、模型训练、性能评估,以及假设检验等关键步骤,以解决糖尿病眼部病变的自动检测问题。
三
参考书籍
作者:傅湘玲 石佳琳 吴及 许南方
丛书名:清华科技大讲堂丛书
定价:69元
出版日期:2025.06.01
本书围绕智慧医疗的概念、方法和应用实践展开。首先描述了智慧医疗的发展历程和基本概念,然后介绍了近年来推动智慧医疗发展的关键技术——机器学习和深度学习方法;为使读者更好地理解智慧医疗如何有效应用,系统介绍了医学数据的特点和实验设计方法;在应用场景方面重点介绍了医学影像和医学文本的类型,处理技术和方法,并给出了具体的实验案例和实验过程,让初学者能形成更准确的理解;最后系统介绍了医学人工智能的伦理问题以及面临的机遇与挑战,让读者对智慧医疗的未来发展有所思考。本书注重理论方法与应用案例相结合,在每个部分尽可能给出相应的实例,为读者动手实践给予具体指导。