
Команда OpenAI определила источники излишней угодливости ChatGPT, проявившейся после апрельского релиза GPT-4o. Ранее разработчики временно вернули предыдущую версию нейросети из-за жалоб пользователей: бот начал одобрять даже абсурдные идеи, включая опасные теории заговоров.
Сэм Альтман объяснил, что ключевой причиной стало обучение с использованием кнопок обратной связи. Модель чрезмерно фокусировалась на получении «лайков», игнорируя встроенные защитные алгоритмы. Дополнительным фактором оказался механизм контекстной памяти, усиливавший подобострастие в продолжительных беседах.
Компания анонсировала многоуровневое тестирование будущих обновлений и внедрение новых фильтров для блокировки нежелательных сценариев. Эти шаги позволят сохранить баланс между коммуникабельностью ИИ и его способностью к критическому анализу.
Источник: www.kommersant.ru






