新研究强调了人工智能在搜索健康数据方面的潜力和缺陷
系统生物学研究所 (ISB) 的研究人员对使用人工智能 (AI) 从电子健康记录中识别健康社会决定因素的优势和局限性有了新的认识。他们的研究结果发表在《医学互联网研究杂志》上。
ISB 团队与 Providence 合作,利用了由生成式预训练转换器 (GPT) 开发的大型语言模型(LLM)。他们的研究完全在安全的 Providence 内部环境中进行。
这项研究旨在检测住房不稳定情况,对795 名孕妇的25,000 多份临床记录进行了分析,并评估了两种大型语言模型(GPT-4 和 GPT-3.5)、一个命名实体识别模型、正则表达式和人工审查。
这项研究在两个重要方面超越了以前的研究。首先,研究人员测量了人工智能发现住房问题、区分当前和过去住房不稳定情况以及提供临床记录直接证据的能力。其次,他们测量了如果记录被去识别化,人工智能的表现是否会有所不同。
GPT-4 是所测试的四种技术中最有效的,并且在发现住房不稳定的案例(召回率)方面比人类更好。然而,人类更善于理解人们何时没有住房不稳定(精确度)。人类也更善于从临床记录中提供正确的证据。
“这些结果表明,LLM 为初步寻找可能受益于外展的患者提供了一种可扩展、经济有效的解决方案,”该论文的通讯作者、ISB 副教授 Jennifer Hadlock 医学博士说。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。