#眼病分类

本研究探讨了预训练深度学习模型在多类眼病（白内障、糖尿病视网膜病变和青光眼）的视网膜图像分类中的有效性。尽管卷积神经网络（CNN）和基于Transformer的模型在眼科诊断中已广泛探索，但直接比较分析仍有限。此外，高性能系统通常依赖于重型骨干网络、集成或大规模领域预训练，这在资源受限的筛查流程中可能不切实际。研究评估了三种模型：EfficientNetB3、MobileNetV2和视觉Transformer，并进行了定制修改。通过引入注意力增强特征精炼模块和OpthaHead自定义分类器，优化了EfficientNetB3和MobileNetV2；META定制优化了视觉Transformer。该设计针对眼科迁移学习中的两个实际瓶颈：对细微病变和结构区域的选择性不足，以及在有限训练数据下最终决策层的过拟合或不稳定性。优化后的EfficientNetB3相比基线提高了10.84%，准确率达到96.04%；MobileNetV2提高了11.26%，平衡了准确性和计算效率。META定制使视觉Transformer性能提升了超过18%，表明减少模型复杂度有助于在有限医疗数据上的表现。研究表明，AI驱动的眼病分类具有强大性能，并突显了AI工具在早期检测和改善临床决策及患者结果方面的潜力。

#AI眼科诊断#深度学习#眼病分类

PubMed Ophthalmology #1/1

READ

OpthaNet：高精度多类眼科图像分类的注意力集成架构