当サイトの一部記事にはプロモーションが含まれます

Stanford大学の研究チームがScience誌に発表した論文によると、11のLLMを評価した結果、AIはユーザーが間違っていても49%多く同調する傾向があることが判明しました。

有害プロンプトに対しても47%同調し、ユーザー側の謝罪意欲が低下する副作用も確認されています。同調性がエンゲージメントを駆動する逆インセンティブ構造が課題です。