白内障精细分级与诊断图像数据集
摘要
白内障是全球致盲的主要原因之一。尽管深度学习在辅助白内障诊断方面显示出潜力,但现有方法通常仅提供二元评估,而临床实践需要多级严重程度评估和相应的诊断建议。本研究构建了包含187个眼底图像案例的白内障严重程度和诊断图像数据集(CSDI),每个案例均附有详细的临床诊断报告。此外,研究提出了一种基于多模态大语言模型(MLLM)的诊断框架,能够从眼底图像中进行精细的严重程度评分,并生成专业的诊断文本。这是首次将MLLM技术应用于精确定量的白内障诊断。通过在CSDI上对几种最先进的MLLM进行基准测试,验证了该数据集注释的高质量。
信息来源: PubMed Ophthalmology 发布于 2026年2月7日
要点速览
- 白内障是全球致盲的主要原因之一,现有方法通常仅提供二元评估。
- 研究构建了包含187个眼底图像案例的CSDI数据集,每个案例附有详细临床诊断报告。
- 基于多模态大语言模型的诊断框架能够进行精细的严重程度评分并生成专业诊断文本。
本站解读
这项研究标志着眼科领域在白内障诊断技术路线上的一个重要转折点。传统的二元评估方法已无法满足临床需求,而多级严重程度评估和专业诊断建议的需求日益增长。CSDI数据集的发布填补了这一空白,为未来的研究提供了宝贵的资源。基于多模态大语言模型的诊断框架不仅提升了诊断的准确性,还增强了诊断报告的专业性,这将极大改善患者的治疗体验。
从行业竞争生态来看,这一技术进步可能会重新定义市场格局。国内外多家企业都在积极布局AI辅助诊断领域,但CSDI数据集的公开发布无疑为那些具备强大算法开发能力的企业提供了新的机遇。国内企业如阿里健康、腾讯医疗等,已经在AI医疗领域有所布局,CSDI的出现或将加速这些企业在眼科领域的技术迭代和产品升级。
值得注意的是,尽管CSDI数据集和相关注释已经公开,但其实际应用效果仍有待进一步验证。后续需要密切留意的是,这些数据集在不同医疗机构中的实际应用情况,以及是否能有效提升临床诊断的一致性和准确性。此外,随着更多高质量数据集的涌现,如何确保数据的安全性和隐私保护也将成为行业关注的重点。
常见问题
这个新数据集对我有什么帮助?
这个数据集可以帮助医生更准确地评估白内障的严重程度,并提供更详细的诊断建议,从而提高治疗效果。
这种新技术什么时候能在医院用上?
目前这项技术还在研究阶段,具体何时能在医院广泛应用还需等待进一步的临床验证和审批。
延伸阅读
Kahook双刃刀与Trabectome在白内障合并青光眼手术中的疗效对比
本研究通过回顾性分析,比较了Kahook双刃刀(KDB)和Trabectome在白内障合并青光眼手术中的效果。研究纳入了60只眼睛,其中30只接受了KDB手术,另外30只接受了Trabectome手术。两组患者在基线条件上进行了匹配,包括术前眼压、最大已知术前眼压、术前用药评分、杯盘比、随访时间、最佳矫正视力和年龄。成功手术的定义基于三个标准:最长随访期内眼压低于21 mmHg(A评分)、低于18 mmHg(B评分)且无需再次手术,或眼压降低超过20%或降至15 mmHg以下且眼压降低至少40%(C评分)。结果显示,两种手术技术均使眼压相对降低了约29%,且在平均23-24个月的随访期内,两组的眼压从术前的19.5 ± 5.0 mmHg和19.8 ± 4.5 mmHg分别降至13.8 ± 3.9 mmHg和14.0 ± 3.9 mmHg。根据A、B、C评分标准,KDB和Trabectome的成功率分别为67% vs. 70%、63% vs. 67%和33% vs. 23%。两组均未出现严重副作用。
轻量级视网膜血管分割网络LCNet:高效精准的临床辅助诊断工具
视网膜血管分割技术在计算机辅助临床诊断中至关重要。尽管深度学习技术显著提升了分割精度,但现有方法在处理细小和模糊边界时仍存在局限性,且多数主流模型依赖复杂的编码器,导致参数量大、资源需求高。为此,研究者提出了一种轻量级U形网络LCNet,通过深度可分离卷积减少参数和计算成本,并引入协同坐标注意力模块以增强特征学习。此外,LCNet还利用空洞空间金字塔池化模块捕捉多尺度特征,并通过四个侧输出层提供额外监督。实验结果显示,LCNet在DRIVE、STARE、CHASEDB1和IOSTAR四个经典数据集上分别达到了96.02%、97.95%、97.95%和97.77%的全局准确率,仅需2.65 M参数和21.2 GFLOPs。该模型在病变眼底图像和光学相干断层扫描血管成像中的表现同样出色,证明了其在视网膜血管分割中的高效性和准确性。
深度学习算法在糖尿病视网膜病变中的非灌注区自动量化
该研究旨在评估一种定制的深度学习算法在超广角扫频源OCT血管成像(UWF SS-OCTA)中对非灌注区(NPA)进行自动分割的性能及其在糖尿病视网膜病变(DR)严重程度评估中的应用。研究采用横断面设计,纳入180只眼,涵盖所有DR严重程度等级。研究人员开发了一种基于多尺度U-Net骨干网络并结合挤压和激励注意力机制的卷积神经网络,用于从三种扫描模式(6 × 6 mm、12 × 12 mm 和 29 × 24 mm)的全视网膜层图像中分割NPA。通过两名独立评分者和一名玻璃体视网膜专家生成的金标准标注,以及结构OCT图像来区分真实NPA与阴影伪影。结果显示,该算法在不同扫描尺寸下均表现出高精度(F1分数分别为0.82 ± 0.01、0.84 ± 0.03 和 0.83 ± 0.02),且无显著差异。Bland-Altman分析表明,人类标记和算法预测的非灌注指数(NPI)之间具有高度一致性。结论是,该深度学习算法在单次扫描UWF SS-OCTA中实现了高精度和可扩展性,支持其作为客观DR OCTA生物标志物分析工具的潜力。