OpenAIの新型推論モデル「o3」「o4-mini」、ハルシネーション問題が悪化していると指摘

3日前4

OpenAIが今月リリースした最新の推論AIモデル「o3」と「o4-mini」で、事実と異なる情報を生成する"ハルシネーション"の発生率が従来モデルよりも高まっていると指摘されています。

Webサービス便利なWebサービスや、面白いWebサービスを紹介します。この特集の一覧を見る

OpenAIの内部テストによると、同社の最新推論モデルo3とo4-miniは、従来の推論モデル（o1、o1-mini、o3-mini）や通常のGPT-4oなどの「非推論」モデルと比較して、より頻繁にハルシネーションを起こすことが判明しました。

OpenAIのテクニカルレポートによると、o3とo4-miniを対象にPersonQAという評価データセットでハルシネーションに関するテストを実施。以下のような結果となったと報告されています。

OpenAIは、「この結果の原因を理解するには、さらなる研究が必要である」と報告しています。

OpenAIの広報担当者はTechCrunchに対し、「全モデルにおけるハルシネーションへの対処は進行中の研究分野であり、精度と信頼性の向上に継続的に取り組んでいる」とコメントしています。