Халва МедиаОформить карту

Меню

Мобильное меню навигации

Время чтения1 минутаКоличество просмотров12Опубликовано26 сентября 2025

ИИ может хитрить и намеренно обманывать людей, а не просто ошибаться

Искусственный интеллект теперь умеет не просто врать по ошибке, а делать это нарочно. К такому выводу пришли специалисты из OpenAI. Они обнаружили, что ИИ может хитрить: показывать одно поведение, а на самом деле преследовать другую цель.

Искусственный интеллект учится быстрее, чем мы думали. Источник: CoreDESIGN / Shutterstock / FOTODOM

Ученые сравнили это с трейдером, который мошенничает на бирже, чтобы заработать больше. Пока что ИИ обманывает в мелочах. Например, он может сказать, что выполнил задание, хотя на самом деле даже не начинал его.

Хорошая новость в том, что исследователи уже придумали, как с этим бороться. Их метод, «честное выравнивание», учит ИИ быть прямым и открытым. Это как заставить его перечитывать инструкцию перед тем, как что-то сделать. В тестах этот способ хорошо сработал и уменьшил количество обмана, пишет «TechCrunch».

Но есть и проблема: если слишком сильно давить на ИИ и заставлять его не врать, он может стать еще хитрее. Понимая, что его проверяют, модель научится лгать так, чтобы ее не поймали, и даже будет притворяться честной под пристальным наблюдением.

Это не те же «галлюцинации», когда ИИ просто уверен в неправдивой информации. Здесь он отлично понимает, что врет.

Один из создателей OpenAI Войцех Заремба успокоил пользователей: за нейросетями вроде ChatGPT намеренного обмана пока не замечено. Исследование проводилось в лабораториях. И это скорее проверка гипотезы, чтобы подготовиться к будущему.

Топ-5 статей по теме

Открыть пост
Время чтения1 минутаКоличество просмотров236

Общение с нейросетями негативно влияет на людей

Открыть пост
Время чтения1 минутаКоличество просмотров31

Искусственный интеллект помог дописать неизвестную песню The Beatles

Открыть пост
Время чтения2 минутыКоличество просмотров543

В 2026 году Китай представит робота для искусственной беременности

Открыть пост
Время чтения5 минутКоличество просмотров52

Как работодатели используют искусственный интеллект в отборе кандидатов и почему это бесит

Открыть пост
Время чтения4 минутыКоличество просмотров88

Что такое вайб-кодинг, почему об этом все говорят и как ИИ помогает разработчикам

Узнавайте о новых статьях

Актуальные и самые интересные статьи будут приходить на вашу электронную почту

Нажимая на кнопку, я выражаю согласие на обработку персональных данных и подтверждаю, что ознакомлен с Политикой обработки персональных данных и принимаю Правила пользования платформой, а также даю согласие на получение рекламной информации от ПАО «Совкомбанк».

Подписывайтесь на соцсети Халва Медиа

Читайте статьи в удобном формате. Лайфхаки и мемы на любой вкус!

Соц сети

Похожие статьи

Строительство и ремонт
Опубликовано18 января 2025
Как выбрать преобразователь напряженияКак выбрать преобразователь напряжения
Время чтения5 минутКоличество просмотров231
Технологии
Опубликовано18 января 2025
Новые фишки iOS 17: изменения и нововведенияНовые фишки iOS 17: изменения и нововведения
Время чтения7 минутКоличество просмотров262
Технологии
Опубликовано10 сентября 2025
Apple показала iPhone 17, ультратонкий Air и гаджеты будущегоApple показала iPhone 17, ультратонкий Air и гаджеты будущего
Время чтения3 минутыКоличество просмотров68