学术研究
OpthaNet:高精度多类眼科图像分类的注意力集成架构
本研究探讨了预训练深度学习模型在多类眼病(白内障、糖尿病视网膜病变和青光眼)的视网膜图像分类中的有效性。尽管卷积神经网络(CNN)和基于Transformer的模型在眼科诊断中已广泛探索,但直接比较分析仍有限。此外,高性能系统通常依赖于重型骨干网络、集成或大规模领域预训练,这在资源受限的筛查流程中可能不切实际。研究评估了三种模型:EfficientNetB3、MobileNetV2和视觉Transformer,并进行了定制修改。通过引入注意力增强特征精炼模块和OpthaHead自定义分类器,优化了EfficientNetB3和MobileNetV2;META定制优化了视觉Transformer。该设计针对眼科迁移学习中的两个实际瓶颈:对细微病变和结构区域的选择性不足,以及在有限训练数据下最终决策层的过拟合或不稳定性。优化后的EfficientNetB3相比基线提高了10.84%,准确率达到96.04%;MobileNetV2提高了11.26%,平衡了准确性和计算效率。META定制使视觉Transformer性能提升了超过18%,表明减少模型复杂度有助于在有限医疗数据上的表现。研究表明,AI驱动的眼病分类具有强大性能,并突显了AI工具在早期检测和改善临床决策及患者结果方面的潜力。
#AI眼科诊断#深度学习#眼病分类
PubMed Ophthalmology #1/1
READ