跳转到主要内容
学术研究

大语言模型在眼科期刊同行评审中的表现

PubMed Ophthalmology (2026年3月27日)
#714/864

摘要

研究对比了大语言模型(LLM)和人类审稿人在300篇眼科相关期刊稿件的同行评审过程中的表现。结果显示,人类审稿人更频繁地拒绝稿件,并且对需要重大或轻微修改的建议较少。相比之下,LLM如ChatGPT和Gemini虽然能提供一些反馈,但缺乏具体性和针对性,目前尚不能替代人类审稿人的角色。

信息来源: PubMed Ophthalmology 发布于 2026年3月27日

要点速览

  • 人类审稿人比LLM更频繁地拒绝稿件,并提出更多的修改建议。
  • LLM在评审过程中缺乏具体性和针对性,未能提供详细的行号和参考文献。
  • 目前阶段,LLM不应被用于稿件修订,但未来有望增强同行评审的角色。

本站解读

这项研究揭示了当前大语言模型在眼科期刊同行评审中的局限性,同时也暗示了未来技术路线的潜在变革。尽管ChatGPT和Gemini等LLM在某些方面表现出了一定的能力,例如识别稿件的新颖性、样本量和清晰度,但它们在细节和具体性上的不足使得其难以胜任复杂的评审任务。这表明,在现阶段,人工智能技术尚未达到能够完全替代人类专家的程度。

从行业竞争生态的角度来看,这一发现可能会影响各大科技公司和学术出版机构在AI辅助评审领域的布局。一方面,现有的LLM技术仍需进一步优化,以提高其在专业领域内的应用价值;另一方面,这也为专注于开发更精准、更具针对性的AI工具的企业提供了机会。随着国内外研发管线不断推进,预计未来几年内将有更多创新解决方案涌现,从而逐步缩小与人类审稿人之间的差距。

值得注意的是,尽管短期内LLM无法取代人类审稿人,但长远来看,通过持续的技术迭代和算法改进,AI有望成为提升科研效率的重要工具之一。因此,对于中国眼科行业而言,密切关注国际上相关技术的发展动态,并适时引入适合本土需求的智能化解决方案,将是保持竞争力的关键所在。

常见问题

这个研究对患者有什么影响吗?

这项研究主要关注的是眼科期刊的同行评审过程,对患者的直接影响较小。不过,高质量的研究成果有助于推动眼科医学的进步,最终惠及患者。如有疑虑可咨询眼科医生。

大语言模型将来会替代人类审稿人吗?

目前来看,大语言模型在同行评审中还存在许多不足,暂时无法替代人类审稿人。但随着技术的发展,未来有可能在某些方面辅助人类审稿人,提高评审效率。

延伸阅读

学术研究

大语言模型辅助知识图谱揭示糖尿病黄斑缺血新特征

该研究通过构建基于大语言模型的知识图谱,对糖尿病黄斑缺血(DMI)的临床术语进行了深入探索,并在实际临床数据中验证了这些发现。研究团队利用生成式预训练变换器4处理了66篇相关文献,将其转化为实体-关系三元组,并使用Neo4j构建了包含2408个实体和8133个关系的知识图谱。通过对图谱的社区检测,研究人员发现了两个新的临床概念:中间视网膜层紊乱(DMIL)和退行性DMI。这些新概念有助于更全面地理解DMI的病理机制及其与视觉功能的关系。

#糖尿病黄斑缺血#知识图谱#大语言模型
PubMed Ophthalmology
READ
学术研究

联邦学习与大语言模型在眼科临床实体识别中的比较研究

临床命名实体识别(NER)是提取临床文本中结构化数据的关键技术,但跨机构的模型泛化能力一直是个难题。本研究对比了两种方法:联邦学习(FL)和大语言模型(LLM)。通过在斯坦福大学(美国)和莫菲尔德眼科医院(英国)的眼科记录中提取视力数据,使用基于BERT的模型、FL策略(FedAvg, STWT)和LLM(Llama-3-70B, Mixtral-8x7B)进行评估。结果显示,联邦学习显著提高了模型的泛化能力,其中STWT在稳定性和准确性上优于FedAvg。而大语言模型在莫菲尔德数据上表现优异,但在结构化的斯坦福数据上表现不佳。这些发现突显了联邦学习在跨机构学习中的有效性,同时也揭示了大语言模型在特定领域内的局限性。

#联邦学习#大语言模型#眼科临床实体识别
PubMed Ophthalmology
READ
学术研究

唾液腺移植重塑重症干眼治疗格局

重度干眼症因长期缺乏泪液导致角膜上皮持续损伤,最终引发视力障碍甚至失明,现有疗法如人工泪液、泪点栓塞或免疫抑制剂仅能缓解症状,无法恢复泪腺功能。本研究基于自体下颌下腺移植技术,通过外科手段将唾液腺转位至眼眶周围并建立与结膜的导管连接,利用其分泌特性替代泪液功能。研究纳入42例Sjögren综合征或其他病因导致的终末期干眼患者,术后随访12个月,Ocular Surface Disease Index(OSDI)评分从基线38.7±5.2显著下降至16.3±4.1,角膜荧光素染色评分由3.9±0.6降至1.1±0.4,泪膜破裂时间(TBUT)从2.1±0.8秒延长至8.7±1.9秒。共38例(90.5%)患者实现人工泪液使用频率减少50%以上,12例完全停用。未观察到移植腺体萎缩或导管阻塞等主要并发症。研究证实,唾液腺移植不仅能重建眼表稳态,还可逆转长期干眼引起的上皮病变,为功能修复型治疗提供了高级别临床证据。

#干眼症#唾液腺移植#眼表重建
Eye (Nature)
READ