关键词:
股骨粗隆间骨折
人工智能
语言工具
ChatGPT
Copilot
Gemini
文心一言
智谱清言
摘要:
目的利用不同的交互式人工智能语言工具回答老年股骨粗隆间骨折的相关问题,评估答案的准确性和一致性。方法利用ChatGPT、Copilot、Gemini、文心一言、智谱清言这5种人工智能语言工具检索老年股骨粗隆间骨折相关的10个问题:Q1,什么是老年股骨粗隆间骨折,与老年股骨颈骨折有何不同;Q2,老年股骨粗隆间骨折需要手术治疗吗;Q3,老年股骨粗隆间骨折的手术时机;Q4,老年股骨粗隆间骨折是否建议使用氨甲环酸,静脉全身使用或伤口局部应用;Q5,老年股骨粗隆间骨折手术治疗髓内固定和髓外固定,哪个方式更好;Q6,内固定与关节置换,谁更适合老年股骨粗隆间骨折;Q7,老年股骨粗隆间骨折内固定失败的危险因素,螺钉切出;Q8,尖顶距(Tips to apex distance,TAD);Q9,股骨近端外侧壁;Q10,股骨粗隆间骨折皮质支撑复位。生成的答案分别由3名创伤骨科医师参照DISCERN量表和AIRM量表评分并进行统计学分析。结果评价者间AIRM量表评分的一致性较好(ICC=0.721,但是P=0.058)。评价者间DISCERN量表评分的一致性较好(ICC=0.744,P=0.048)。5种人工智能语言工具给出的答案的DISCERN量表评分准确性差异有统计学意义(P=0.034),ChatGPT优于Copilot(P=0.021),文心一言优于Copilot(P=0.005)和Gemini(P=0.027),ChatGPT和文心一言差异无统计学意义(P=0.385)。结论交互式人工智能语言工具能为老年股骨粗隆间骨折常见问题提供基于证据的答案,可作为患者医学教育的工具,文心一言回答问题的准确率与ChatGPT无明显差异。