评估 ChatGPT 对阻塞性睡眠呼吸暂停的回答以进行患者教育
研究目的
我们评估了 ChatGPT 对阻塞性睡眠呼吸暂停问题的回答质量,以进行患者教育,
并评估了聊天机器人如何被影响正确性、估计的等级水平和答案参考。
方法
ChatGPT 被查询了 4 次,有 24 个相同的问题。
查询因初始提示而异:无提示、患者友好的提示、医生级别的提示以及统计/参考的提示。
答案按层次等级评分:不正确、部分正确、正确、统计或引文正确(“正确+”),或统计和引文均正确(“完美”)。
记录了 Flesch-Kincaid 等级水平和引文发表年份作为答案。
使用卡方分析按提示类型比较增量分数阈值的响应比例。使用方差分析评估提示类型和年级水平之间的关系。
结果
在所有提示中(n = 96 个问题),69 个答案 (71.9%) 至少是正确的。
至少部分正确 ( P = .387) 或正确 ( P = .453) 的回答比例没有因提示而异;
至少正确+ ( P < .001) 或完美 ( P < .001) 的回答也如此。
对统计/参考文献的提示提供了 74/77 (96.1%) 的参考文献。
患者友好提示的响应平均等级水平 (12.45 ± 2.32) ,低于无提示 (14.15 ± 1.59)、
医师级别提示 (14.27 ± 2.09) 和统计/参考提示 (15.00 ± 2.26) ( P < . 0001)。
结论
无论提示如何,ChatGPT 总体上都能为大多数有关阻塞性睡眠呼吸暂停的问题提供适当的答案。
虽然提示降低了回答等级水平,但所有回答仍然高于向患者提供医疗信息的公认建议。
鉴于 ChatGPT 的快速实施,睡眠专家可能会寻求进一步审查其医学素养和对患者的实用性。
(叶妮摘自 J Clin Sleep Med. 2023;19(12):1989–1995.)