《科學報告》9月14日發表的一項研究指出,大型語言模型(LLM)人工智能(AI)對話機器人在創造性思維任務上能夠超越大部分人類,該任務要求受試者想出日常用品的替代用途,這是發散性思維的一個例子。不過,得分最高的人類受試者依然能超過對話機器人的最佳答案。
發散性思維通常是指與創造性相關的一類思維過程,需要為特定任務想出各種不同創意或對策。發散性思維一般通過替代用途任務(AUT)進行評估,受試者被要求在短時間內想出某個日常用品的其他用途,越多越好。受試者的回答從4個類別進行打分:流利度、靈活性、原創性和精細度。
在這項研究中,ChatGPT3、ChatGPT4和Copy.Ai完成了4個物品,即繩子、盒子、鉛筆、蠟燭的AUT,芬蘭圖爾庫大學Mika Koivisto和挪威卑爾根大學Simone Grassini隨后將其與人類的答案進行了比較。
研究人員通過語義距離,即回答與物品原始用途的相關度,和創造性給回答的原創性打分。他們用一個計算方法在0-2的范圍里量化語義距離,同時讓不知道作答者身份的人類打分者在1-5的范圍里客觀評價創造性。
平均而言,對話機器人的回答在語義距離(0.95相對于0.91)和創造性(2.91相對于2.47)的得分上顯著高于人類的回答。人類回答在這兩項的得分差距更大——最低分遠低于AI的回答,但最高分普遍比AI高。最佳人類回答在8個評分項中的7項都超過了所有對話機器人的最佳回答。
這項研究結果表明,當前AI對話機器人想創意的能力至少已與一般人類相當。但作者也指出,他們只評價了涉及創造性評估的單項任務的表現。作者認為,今后的研究或能探索如何將AI融入創造性過程來提升人類表現。
美國得克薩斯大學西南醫學中心研究人員開發了一種新的人工智能(AI)模型,可分析組織樣本中細胞的空間排列。12月11日發表在《自然·通訊》上的這一創新方法,準確地預測了癌癥患者的結果,標志著在利用AI進......
美國得克薩斯大學西南醫學中心研究人員開發了一種新的人工智能(AI)模型,可分析組織樣本中細胞的空間排列。12月11日發表在《自然·通訊》上的這一創新方法,準確地預測了癌癥患者的結果,標志著在利用AI進......
12月12日,全球健康藥物研發中心(GHDDI)與微軟研究院科學智能中心(Microsoft?Research?AI4Science)宣布,雙方將共同研發全球健康傳染病領域的生成式人工智能與基礎大模型......
12月12日,全球健康藥物研發中心(GHDDI)與微軟研究院科學智能中心(Microsoft?Research?AI4Science)宣布,雙方將共同研發全球健康傳染病領域的生成式人工智能與基礎大模型......
據物理學家組織網11日報道,澳大利亞悉尼科技大學科學家開發出了首款便攜式、非侵入性的人工智能系統,可解碼無聲的想法并將其轉化為有形的文本。這項技術可幫助那些因疾病或受傷(包括中風或癱瘓)而無法說話的人......
據物理學家組織網11日報道,澳大利亞悉尼科技大學科學家開發出了首款便攜式、非侵入性的人工智能系統,可解碼無聲的想法并將其轉化為有形的文本。這項技術可幫助那些因疾病或受傷(包括中風或癱瘓)而無法說話的人......
經過1年多精心準備,NEJMAI第一期今晨正式上線(ai.nejm.org)。我們在此發表該刊主編IsaacKohane教授撰寫的社論。Kohane教授和該刊常務主編CharlotteHaug博士曾多......
經過1年多精心準備,NEJMAI第一期今晨正式上線(ai.nejm.org)。我們在此發表該刊主編IsaacKohane教授撰寫的社論。Kohane教授和該刊常務主編CharlotteHaug博士曾多......
近日,華中科技大學軟件學院教授白翔領銜的VLRLab團隊發布了多模態大模型——“Monkey”。該模型能夠實現對世界的“觀察”,對圖片進行深入的問答交流和精確描述。圖為團隊將Monkey代碼在全球最大......
近日,華中科技大學軟件學院教授白翔領銜的VLRLab團隊發布了多模態大模型——“Monkey”。該模型能夠實現對世界的“觀察”,對圖片進行深入的問答交流和精確描述。圖為團隊將Monkey代碼在全球最大......