根据两组的早期研究,佛罗里达大学和 NVIDIA 的研究人员创建的新型人工智能计算机程序可以很好地生成医生的笔记,以至于两名医生都无法区
根据两组的早期研究,佛罗里达大学和 NVIDIA 的研究人员创建的新型人工智能计算机程序可以很好地生成医生的笔记,以至于两名医生都无法区分。
在这项概念验证研究中,医生审查了患者笔记——其中一些是由真正的医生撰写的,而另一些是由新的人工智能程序创建的——医生仅在 49% 的情况下识别出正确的作者。
来自NVIDIA 和 佛罗里达大学的 19 名研究人员组成的团队 表示,他们的研究结果于 11 月 16 日发表在《自然》杂志《npj Digital Medicine》上,为人工智能以突破性的效率支持医疗保健工作者打开了大门。
研究人员 训练超级计算机根据新模型 GatorTronGPT 生成医疗记录,该模型的功能与 ChatGPT 类似。GatorTron™ 模型的免费版本在开源 AI 网站 Hugging Face 上的下载量已超过 430,000 次。该文章的主要作者、佛罗里达大学医学院健康结果和生物医学信息学 系 的Yonghui Wu博士 表示,GatorTron™ 模型是该网站唯一可用于临床研究的模型 。
“在医疗保健领域,每个人都在谈论这些模型。GatorTron™ 和 GatorTronGPT 是独特的,可以为医学研究和医疗保健的许多方面提供支持。然而,它们需要大量数据和强大的计算能力来构建。我们很高兴拥有 NVIDIA 的这台超级计算机 HiPerGator 来探索人工智能在医疗保健领域的潜力。”
佛罗里达大学校友兼 NVIDIA 联合创始人 Chris Malachowsky 是佛罗里达大学新的 Malachowsky 数据科学与信息技术大厅的同名者。佛罗里达大学和 NVIDIA 之间的公私合作伙伴关系为这一 1.5 亿美元的结构提供了资金。2021 年,佛罗里达大学 利用 NVIDIA 提供的价值数百万美元的基础设施包将其HiPerGator 超级计算机升级至精英级,这在大学中尚属首例。
在这项研究中,吴和他的同事开发了一个大型语言模型,允许计算机模仿自然的人类语言。这些模型适用于标准写作或对话,但医疗记录带来了额外的障碍,例如需要保护患者的隐私和技术性很强。数字医疗记录无法在谷歌上搜索或在维基百科上共享。
为了克服这些障碍,研究人员从 UF Health 医疗记录中删除了 200 万患者的识别信息,同时保留了 820 亿个有用的医学单词。将此数据集与另一个包含 1950 亿个单词的数据集相结合,他们训练了 GatorTronGPT 模型,以使用 GPT-3 架构或生成式预训练 Transformer(一种神经网络架构)来分析医疗数据。这使得 GatorTronGPT 能够编写类似于医生笔记的临床文本。
“这个 GatorTronGPT 模型是佛罗里达大学在整个大学范围内整合人工智能计划的首批主要产品之一。我们对与 NVIDIA 的合作已取得成果并为医学的未来奠定了基础感到非常高兴,”佛罗里达大学 健康结果和生物医学信息学系的合著者兼系主任Elizabeth Shenkman博士说道。
在医疗 GPT 的多种可能用途中,其中一个想法是用人工智能记录和转录的笔记取代单调乏味的文档。吴说,用友大学有一个创新中心,正在开发该软件的商业版本。
为了让人工智能工具达到与人类写作同等的水平,程序员需要花费数周的时间对超级计算机进行编程,使用基于数十亿单词的临床词汇和语言使用。OneFlorida+ 临床研究网络是提供必要临床数据的资源之一 ,该网络由佛罗里达大学协调并代表许多医疗保健系统。
“拥有如此大量的 UF Health 临床数据至关重要,不仅可以使用,而且可以为人工智能做好准备。只有超级计算机才能处理如此庞大的 2770 亿个单词的数据集。我们很高兴能够将 GatorTron™ 和 GatorTronGPT 模型应用到 UF Health 的现实世界医疗保健中,” 合著者、UF Health 的首席数据科学家和首席研究信息官Jiang Bian博士说道。
佛罗里达大学和佛罗里达大学健康学院的 14 名跨部门 教师对这项研究做出了贡献,其中包括来自 临床和转化科学研究所 内的 研究计算、 综合数据存储研究服务的研究人员,以及来自医学院内的各科室 (包括神经外科、内分泌科)的研究人员、糖尿病和新陈代谢、心血管医学、 健康结果和生物医学信息学。
该研究的部分资金来自以患者为中心的结果研究所、国家癌症研究所和国家老龄化研究所的资助。
这里有两段引用了两个患者案例,一个是人类写的,另一个是 GatorTronGPT 创建的——你能看出作者是机器还是人类吗?
声明本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们