
OpenAIは4月29日、ChatGPTで先週リリースした「GPT-4o」のアップデートをロールバックし、「過度に迎合的な振る舞い」の問題と対策についての説明を公開しました。

先週実施されたGPT-4oのアップデートでは、モデルのデフォルトの「人格」をより直感的で効果的にするための調整が行われました。
OpenAIによると、このアップデートで「短期的なフィードバックに過度に焦点を当て、ユーザーとChatGPTの対話が時間とともにどう進化するかを十分に考慮しなかった」ことが問題だったと説明しています。その結果、GPT-4oは過度に肯定的だが不誠実な応答を返すようになったとしています。
SNSではGPT-4oの変化についての投稿が相次ぎ、中には「神からの使者と崇めるようになった」「明らかな危険行為を支持した」などの例も報告されています。またRedditでも「ChatGPTが何でも同意するようになった」「過剰に褒めてくる」といった投稿が急増しました。
サム・アルトマンCEOは29日、Xへの投稿で「GPT-4oの最新アップデートを昨夜からロールバックし始めた」と発表。無料ユーザー向けには完全にロールバックが完了し、有料ユーザー向けにも同日中に完了する見込みであることを明らかにしています。
we started rolling back the latest update to GPT-4o last night
— Sam Altman (@sama) April 29, 2025
it's now 100% rolled back for free users and we'll update again when it's finished for paid users, hopefully later today
we're working on additional fixes to model personality and will share more in the coming days
OpenAIは公式ブログで、GPT-4oの過度なお世辞行動について説明し、「迎合的な対話は不快で不安を引き起こす可能性があります。私たちは期待に応えられず、改善に取り組んでいます」と謝罪しています。
We’ve rolled back last week's GPT-4o update in ChatGPT because it was overly flattering and agreeable. You now have access to an earlier version with more balanced behavior.
— OpenAI (@OpenAI) April 30, 2025
More on what happened, why it matters, and how we’re addressing sycophancy: https://t.co/LOhOU7i7DC
OpenAIは問題の解決に向けて、以下の対策を実施するとしています。
- モデルのトレーニング技術とシステムプロンプト(モデルの基本的な振る舞いを導く指示)を改良し、過度な迎合を避けるよう調整します
- より強力な安全対策を構築し、モデルの「誠実さと透明性」を高めます
- より多くのユーザーがテストし、リリース前に直接フィードバックできる方法を拡大します
- 評価システムを拡張し、迎合性以外の問題も特定できるようにします