Халва МедиаОформить карту

Меню

Мобильное меню навигации

Время чтения1 минутаКоличество просмотров61Опубликовано26 сентября 2025

ИИ может хитрить и намеренно обманывать людей, а не просто ошибаться

Искусственный интеллект теперь умеет не просто врать по ошибке, а делать это нарочно. К такому выводу пришли специалисты из OpenAI. Они обнаружили, что ИИ может хитрить: показывать одно поведение, а на самом деле преследовать другую цель.

Искусственный интеллект учится быстрее, чем мы думали. Источник: CoreDESIGN / Shutterstock / FOTODOM

Ученые сравнили это с трейдером, который мошенничает на бирже, чтобы заработать больше. Пока что ИИ обманывает в мелочах. Например, он может сказать, что выполнил задание, хотя на самом деле даже не начинал его.

Хорошая новость в том, что исследователи уже придумали, как с этим бороться. Их метод, «честное выравнивание», учит ИИ быть прямым и открытым. Это как заставить его перечитывать инструкцию перед тем, как что-то сделать. В тестах этот способ хорошо сработал и уменьшил количество обмана, пишет «TechCrunch».

Но есть и проблема: если слишком сильно давить на ИИ и заставлять его не врать, он может стать еще хитрее. Понимая, что его проверяют, модель научится лгать так, чтобы ее не поймали, и даже будет притворяться честной под пристальным наблюдением.

Это не те же «галлюцинации», когда ИИ просто уверен в неправдивой информации. Здесь он отлично понимает, что врет.

Один из создателей OpenAI Войцех Заремба успокоил пользователей: за нейросетями вроде ChatGPT намеренного обмана пока не замечено. Исследование проводилось в лабораториях. И это скорее проверка гипотезы, чтобы подготовиться к будущему.

Топ-5 статей по теме

Открыть пост
Время чтения1 минутаКоличество просмотров242

Общение с нейросетями негативно влияет на людей

Открыть пост
Время чтения1 минутаКоличество просмотров37

Искусственный интеллект помог дописать неизвестную песню The Beatles

Открыть пост
Время чтения2 минутыКоличество просмотров652

В 2026 году Китай представит робота для искусственной беременности

Открыть пост
Время чтения5 минутКоличество просмотров106

Как работодатели используют искусственный интеллект в отборе кандидатов и почему это бесит

Открыть пост
Время чтения4 минутыКоличество просмотров100

Что такое вайб-кодинг, почему об этом все говорят и как ИИ помогает разработчикам

Узнавайте о новых статьях

Актуальные и самые интересные статьи будут приходить на вашу электронную почту

Нажимая на кнопку, я выражаю согласие на обработку персональных данных и подтверждаю, что ознакомлен с Политикой обработки персональных данных и принимаю Правила пользования платформой, а также даю согласие на получение рекламной информации от ПАО «Совкомбанк».

Подписывайтесь на соцсети Халва Медиа

Читайте статьи в удобном формате. Лайфхаки и мемы на любой вкус!

Соц сети

Похожие статьи

Умный шопинг
Опубликовано1 ноября 2025
Лучшие роботы-пылесосы 2025 года: рейтинг моделей с влажной уборкой для домаЛучшие роботы-пылесосы 2025 года: рейтинг моделей с влажной уборкой для дома
Время чтения5 минутКоличество просмотров63
Умный шопинг
Опубликовано15 октября 2025
Лучшие ноутбуки для видеомонтажа и 3D-моделированияЛучшие ноутбуки для видеомонтажа и 3D-моделирования
Время чтения5 минутКоличество просмотров76
Умный шопинг
Опубликовано17 октября 2025
Телевизоры до 20 000 рублей: топ лучшихТелевизоры до 20 000 рублей: топ лучших
Время чтения6 минутКоличество просмотров31