ChatGPT 在醫學測驗中的得分高於真正的醫生

06/06/2023 16:00

一些醫生不知道如何治療病人，就像沒有靈魂的機器人，充滿了醫學知識。但是，如果人工智能回答了通常向醫生提出的問題，並且做得很好呢？這個問題是加州大學最近進行的一項研究的推動力。該研究測試了醫生回答移情問題的能力和人工智能回答這些問題的能力。另一方面，ChatGPT 更好地回答了 195 個醫學問題。

研究人員在名為 AskDocs 的公共 subreddit 上提出了問題。例如，有人問吞下牙籤有多危險。另一個人問如果他的頭撞在金屬棒上會不會腦震盪。這些問題由一名醫務人員回答，其資歷已由主持人核實。研究人員還通過 ChatGPT 提出問題以獲得答复。

一組醫生被問到哪個答案更好，是聊天機器人還是醫生，但他們不知道誰的答案是誰。每個案例由三位不同的評委進行評審，並取平均分，共計 585 分。在 79% 的案例中，法官更喜歡聊天機器人的回答，其中包含更好的信息，比醫生的回答更有說服力。

與醫生的回答相比，聊天機器人的回答在質量方面獲得最高評分的數量大約是醫生的 4 倍，在同理心方面的評分大約高出 10 倍。聊天機器人的反應也比醫生的反應長大約 4 倍。

研究表明，與忙碌的醫生自願在線回答問題相比，聊天機器人更能給人留下關懷病人的印象。

這種工具在臨床實踐中是否有用還有待觀察。研究人員寫道，在線論壇可能無法反映患者和醫生之間的典型互動，這種互動是預先建立的關係和更多的個性化。

雖然 ChatGPT 會提供禮貌、可讀的回复，乍一看似乎是一致的，但它會犯基本的編碼和數學錯誤，而且其回復中包含的許多事實都是編造的或不正確的。

然而，隨著大流行病遠程醫療的普及，醫生們被來自患者的信息淹沒，因此迫切需要能夠提高生產力和改善護理的工具。例如，聊天機器人可以為患者的問題撰寫答案，然後醫生可以對其進行編輯。

另請閱讀：

分享到

Julia Alexandrova

咖啡師。攝影師。我寫關於科學和空間的文章。我認為我們現在遇到外星人還為時過早。我關注機器人技術的發展，以防萬一......

06/06/2023 16:00