学术研究高优关注

HOG-CNN：融合梯度直方图与卷积神经网络的视网膜图像分类

2026年4月2日

PubMed Ophthalmology (2026年3月9日)

#81/864

摘要

视网膜图像分析在早期检测和诊断糖尿病视网膜病变（DR）、青光眼和年龄相关性黄斑变性（AMD）等疾病中至关重要。然而，传统诊断流程依赖于人工解读，耗时且资源密集。为解决这些问题，研究提出了一种基于HOG-CNN混合特征提取模型的自动化临床决策支持框架。该模型将手工设计的梯度直方图（HOG）特征与预训练深度卷积神经网络EfficientNetB3学习到的表示相结合，从而捕捉视网膜图像中的局部纹理模式和高级语义特征。通过在APTOS 2019、ORIGA和IC-AMD三个公开基准数据集上的评估，HOG-CNN在二分类和多分类DR、AMD诊断以及青光眼检测中均表现出色，准确率和AUC值显著高于现有先进模型。此外，其轻量级和可解释的设计使其特别适合资源受限的临床环境。

信息来源： PubMed Ophthalmology 发布于 2026年3月9日

要点速览

HOG-CNN结合了手工设计的HOG特征与深度学习模型EfficientNetB3，提高了视网膜图像分类的准确性。
在APTOS 2019、ORIGA和IC-AMD三个公开数据集上，HOG-CNN在DR、AMD和青光眼检测中表现出色。
HOG-CNN的轻量级和可解释设计使其适合资源受限的临床环境，具有广泛应用前景。

本站解读

这项研究标志着视网膜图像分析技术路线的一次重要变迁。传统的手动解读方法不仅耗时费力，还容易受到主观因素的影响。HOG-CNN通过结合手工设计的HOG特征与深度学习模型EfficientNetB3，实现了对视网膜图像的高效自动分类。这种融合策略不仅提升了模型的性能，还增强了其在实际应用中的可解释性。从商业格局来看，这一技术进步可能会重新定义眼科诊断工具的竞争生态。目前，国内外多家企业都在积极布局AI辅助诊断领域，但HOG-CNN的出现无疑为市场注入了新的活力。尽管国外企业在研发管线进度上暂时领先，但国内企业也在迅速跟进，未来几年内有望看到更多本土创新成果。

值得注意的是，HOG-CNN在多个公开数据集上的表现已经证明了其在多种视网膜疾病诊断中的潜力。这不仅为临床医生提供了可靠的辅助工具，也为患者带来了更快速、准确的诊断体验。然而，随着技术的不断迭代，后续需要密切留意的是，如何进一步优化模型以适应不同地区和人群的数据特点，以及如何在实际临床环境中实现大规模部署。这些将是决定HOG-CNN能否真正改变眼科诊疗格局的关键因素。

常见问题

这个新技术能帮助我更快地诊断出视网膜疾病吗？

是的，HOG-CNN技术能够提高视网膜图像分类的准确性和速度，有助于更快地诊断出糖尿病视网膜病变、青光眼和年龄相关性黄斑变性等疾病。如有疑虑可咨询眼科医生。

这项技术是否已经在医院中使用了？

目前，HOG-CNN技术还在研究阶段，尚未广泛应用于临床。不过，其轻量级和可解释的设计使其在未来有潜力在医院中得到应用。

#视网膜图像分析 #人工智能 #眼科诊断

延伸阅读

学术研究

2026年4月2日

PathFinder AI工具在非视网膜专家中的诊断一致性评估

本研究旨在评估非视网膜专科医生（NRS）使用PathFinder人工智能辅助工具与视网膜专科医生在诊断和转诊决策上的一致性。研究纳入了202名连续接受CIRRUS平台OCT检查的患者，其中PathFinder AI模块被用于辅助诊断。结果显示，在202只眼睛中（平均年龄62.7 ± 12.3岁），PathFinder AI工具在资源有限的情况下具有显著的实时决策支持价值，但在特定疾病尤其是威胁视力的条件下，仍需进一步优化和临床监督。

ChatGPT在鉴别眼表肿瘤中的准确性研究

该研究旨在评估ChatGPT-4在鉴别结膜上皮内瘤变（CIN）、翼状胬肉和假性翼状胬肉中的诊断可靠性及其推荐治疗策略的能力。研究使用了60例经组织病理学确诊的病例，包括CIN、翼状胬肉和假性翼状胬肉各20例。每个病例包含详细的临床数据，如病史、裂隙灯检查结果、前段光学相干断层扫描（AS-OCT）和活体共聚焦显微镜（IVCM）描述。这些数据被整合成标准化的临床摘要并上传至ChatGPT-4进行分析。结果显示，ChatGPT-4在鉴别CIN、翼状胬肉和假性翼状胬肉方面的准确率分别为85%、75%和70%，治疗建议与专家意见的一致率为80%。尽管ChatGPT-4在某些情况下存在误诊，但其作为辅助决策工具的潜力值得关注。

融合Transformer框架SwinCup-DiscNet助力青光眼早期诊断

青光眼是全球永久性视力障碍的主要原因之一，其病理机制涉及视神经头（ONH）的进行性破坏。早期检测对于预防视力丧失至关重要。本研究提出了一种新的融合Transformer框架SwinCup-DiscNet，该框架结合了视盘和视杯特征以及基于U-Net的注意力机制，以实现更有效的青光眼筛查。通过提取视盘和视杯的形状描述符，并结合Swin Transformer编码器提取的眼底图像特征，该模型能够综合评估垂直杯盘比（CDR），并最终通过概率融合方法获得青光眼分类。实验结果表明，SwinCup-DiscNet在三个公开数据集（LAG、ACRIMA和DRISTHI-GS）上的表现优于传统的基于CNN的模型和其他仅基于分割的方法，在DSC IoU、准确率、F1分数和CDR MAE等指标上均表现出色。这证明了SwinCup-DiscNet在临床应用中的鲁棒性、可靠性和可解释性。