当サイトの一部記事にはプロモーションが含まれます

新ベンチマーク「ARC-AGI-3」が公開されました。

人間の正答率が100%であるのに対し、GPT-5.4の正答率はわずか0.26%。AGI達成の主張に対する直接的な反証データとなっています。