如何搭建一个完整的网站,给设计公司起名大全,做虚拟网站要花多少钱,中廉建设网站中科院1区|IF10#xff1a;加大医学系团队利用GPT-4电子病历分析#xff0c;革新肝硬化并发症队列识别
在当下的科研领域#xff0c;人工智能尤其是大语言模型的迅猛发展#xff0c;正为各个学科带来前所未有的机遇与变革。在医学范畴#xff0c;从疾病的早期精准筛查加大医学系团队利用GPT-4电子病历分析革新肝硬化并发症队列识别
在当下的科研领域人工智能尤其是大语言模型的迅猛发展正为各个学科带来前所未有的机遇与变革。在医学范畴从疾病的早期精准筛查如AI预测系统可提前数年察觉阿尔茨海默病等千余种疾病风险到影像诊断中显著降低骨折漏诊率AI的应用已逐步渗透。在生物医学研究方面单细胞RNA测序技术结合人工智能为深入解析细胞异质性开拓了新思路。于此同时大语言模型在医学知识问答、临床报告生成等场景中也崭露头角。在这样充满活力与创新的大背景下一篇发表于知名期刊Hepatology的论文另辟蹊径巧妙运用生物信息方法及其他手段在肝病研究领域取得了令人瞩目的成果接下来就让我们深入探究这篇论文的精妙之处。
https://doi.org/10.1097/HEP.0000000000001115 正式介绍 基本信息 论文标题利用GPT-4评估基于编码的肝硬化及其并发症识别的阳性预测值 发表期刊Hepatology中科院医学大类分区1区IF12.9002 发表日期2025年6月1日在线发表 研究背景
临床需求矛盾肝硬化及并发症的队列识别依赖诊断编码如 ICD 码但编码准确性低既往研究 PPV 仅 43%-91%且无法区分“活动性”与“历史性”病情手动 chart review 虽为金标准却耗时耗力难以规模化。技术机遇大语言模型LLM如 GPT-4 具备非结构化文本解析能力可高效处理电子健康记录EHR为解决上述问题提供可能。 研究思路
数据提取从 UCSF 医疗中心提取2013-2022 年 3788 份肝硬化相关出院小结基于OMOP 编码分为肝硬化、肝性脑病、腹水等 5 类队列。双轨验证设计 金标准随机抽取 5%-10% 病例进行手动 chart review由资深医生校正。LLM 方法使用GPT-4-turbo-128k 设计零-shot 提示识别出院小结中“活动性”病情对比手动 review 计算准确性Accuracy、PPV 等。规模化评估编码性能以 LLM 分类为“银标准”计算传统 OMOP 编码在全部 3788 份小结中的 PPV评估编码可靠性。 研究亮点
方法学突破首次在肝病领域将 GPT-4 作为“银标准”规模化评估诊断编码性能替代部分手动 review。临床价值证明 LLM 可准确区分肝硬化并发症的“活动性”Accuracy 87.8%-98.8%为 EHR 数据的高效利用提供技术支撑。成本效益LLM 单例分析成本仅 0.05 美元显著低于手动 review为大规模队列研究提供经济可行的方案。 数据来源和生物信息方法
1、数据来源
数据来源UCSF 医疗中心 2013-2022 年肝硬化患者的电子健康记录EHR包含 3788 份出院小结涉及 2747 例患者。
2、生物信息方法
GPT-4 部署通过 UCSF 合规的 Versa API 调用 GPT-4-turbo-128k使用零-shot 提示工程温度参数调优至 0.0 和 0.7。提示工程设计 5 组针对性提示识别肝硬化及 4 种并发症的活动性如“请判断该患者在住院期间是否存在活动性肝性脑病并说明临床管理措施”。统计分析。 主要结果
1、传统编码vs手动chart review金标准
肝硬化识别 PPV 为 82.2%并发症中腹水 PPV 最高72.8%肝性脑病最低41.7%。小结传统编码对肝硬化本身识别尚可但对并发症尤其是肝性脑病准确性差提示编码无法可靠反映“活动性”病情。
2、GPT-4vs手动chart review金标准
肝硬化识别Accuracy 最高达 98.8%温度 0.0PPV 98.9%肝性脑病 Accuracy 96.3%温度 0.7腹水 PPV 达 100%温度 0.0 和 0.7胃肠道出血与自发性细菌性腹膜炎 Accuracy 分别为 87.8% 和 90.7%。小结GPT-4 对肝硬化及并发症的“活动性”识别准确性显著高于传统编码尤其在腹水等场景中接近完美PPV 100%。
3、传统编码 vs GPT-4银标准
肝硬化PPV 79.8%并发症PPV 53.9%-67.6%其中肝性脑病53.9%和腹水55.3%仍较低。小结以LLM为银标准传统编码局限性进一步凸显提示需结合NLP技术优化队列识别。
4、LLM 成本与效率分析
单例分析成本0.05 美元总 token 消耗随病例数增加而线性增长如肝硬化 3788 例消耗 1881 万tokens成本 188.18 美元。小结LLM 方法兼具高效性与经济性适合大规模队列研究。 研究结论
GPT-4等LLM可准确识别肝硬化及并发症的“活动性”Accuracy 87.8%-98.8%性能显著优于传统诊断编码。以LLM作为“银标准”可规模化评估编码性能发现传统方法对并发症识别的不足。LLM方法成本低、可扩展有望替代部分手动chart review成为临床研究队列识别的新标准。 研究的局限性和未来方向
局限性手动review存在9.2%的校正率本身可能引入误差数据依赖OMOP编码提取可能存在信息丢失GPT-4的通用性有待外部队列验证。
未来方向在不同医疗机构使用Llama 3、Claude等模型验证结果应用LLM区分肝硬化病因开发基于LLM的实时EHR数据标注工具。
感谢您的阅读欢迎关注“生信学术纵览”。谢谢您的分享、点赞在看