Science/Research 詳細

創造的潜在力標準テストでAIが人を凌駕

March, 12, 2024, Fayetteville--最近の研究では、151人の人間の参加者が、創造的思考の指標と考えられている発散的思考を測定するために設計された3つのテストでChatGPT-4と対戦した。

発散的思考は、「両親と政治の話をしないようにするための最良策は何か」など、期待される解決策が1つもない質問に対して独自の解決策を生成する能力によって特徴付けられる。この研究では、GPT-4は人間の参加者よりも独創的で精巧な回答を提供した。

「人工知能生成言語モデルの現状は、発散的思考課題において人間よりも創造的である」と題されたこの研究は、Nature’s Scientific Reportsに掲載され、カリフォルニア大学の心理学博士課程の学生Kent F. HubertとKim N. Awa、および同大学心理学准教授でMechanisms of Creative Cognition and Attention LabのディレクタDarya L. Zabelinaが著者である。

3つのテストは、ロープやフォークなどの日用品の創造的な使い方を考え出すよう参加者に求める「代替使用タスク」。「人間が睡眠を必要としなくなったらどうなるか」というような仮定の状況から起こりうる結果を想像するよう参加者に促す結果課題。また、発散連想タスクでは、参加者に、できるだけ意味的に遠い10個の名詞を生成するよう求めます。例えば、「犬」と「猫」の間にはあまり意味的な距離がないが、「猫」と「存在論」のような言葉の間には大きな意味的な距離がある。

回答は、回答数、回答の長さ、および単語間の意味の違いについて評価された。最終的に、著者は、「全体として、GPT-4は、応答の流暢さを制御した場合でも、発散的思考タスクのそれぞれについて、人間よりも独創的で精巧だった。言い換えれば、GPT-4は、一連の発散的思考タスク全体にわたって、より高い創造的可能性を示した。

この発見にはいくつかの注意点がある。研究チームは、「この研究で用いられた尺度はすべて創造的可能性の尺度であるが、創造的な活動や成果への関与は、個人の創造性を測る別の側面であることに注意することが重要である」とコメントしている。この研究の目的は、人間レベルの創造的可能性を調べることであり、必ずしも創造的資格を確立している可能性のある人々を調べることではなかった。

HubertとAwaはさらに、「AIは人間と違って主体性を持たない。また、人間のユーザの支援に依存している」と指摘している。したがって、AIの創造的な可能性は、促されない限り、常に停滞状態にある。

また、研究チームはGPT-4の反応の妥当性を評価しなかった。そのため、AIはより多くの応答とより独創的な応答を提供したかも知れないが、人間の参加者は、現実世界に根ざした応答が必要であることに制約されていると感じた可能性がある。

Awaはまた、精巧な回答を書く人間のモチベーションは高くなかったかも知れないと認め、「創造性をどのように運用するか」という追加の質問があるとコメントした。これらのテストを人間に使用することは、様々な人に一般化できると本当に言えるか?幅広い創造的思考を評価しているか?したがって、発散的思考の最も一般的な尺度は何かを批判的に検討していると考えている」

テストが人間の創造的可能性を測る完璧な尺度であるかどうかは、実際には重要ではない。重要なのは、大規模言語モデルが急速に進歩し、これまでにない方法で人間を凌駕しているということである。それらが人間の創造性に取って代わる脅威になるかどうかは、まだわからない。今のところ、チームは「今後、AIがインスピレーションのツールとして、人の創造的プロセスの補助として、あるいは固定性を克服するための機能を発揮する可能性は有望である」と見ている。

(詳細は、https://news.uark.edu/