безопасность ии

JavaScript отключён. Чтобы полноценно использовать наш сайт, включите JavaScript в своём браузере.

Новости Уволиться из OpenAI, чтобы спасти совесть. Почему лучшие умы ИИ-индустрии увольняются из корпораций в самый разгар технологического бума

Люди, создавшие GPT, больше не хотят иметь к нему отношения. Несколько ведущих специалистов по безопасности ИИ из OpenAI, Anthropic и других компаний публично предупреждают о росте рисков, связанных с развитием больших моделей. По данным Axios , часть исследователей уходит из команд, которые...
- NewsMaker
- Тема
- 14 Фев 2026
- agi anthropic openai безопасность ии риски
- Ответы: 0
- Форум: Новости в Мире
Новости Почему чат-боты «сходят с ума» в долгих переписках? Все дело в постепенной смене персонажа

Ученые объяснили, как устроены «личности» ИИ. Исследователи из Anthropic и нескольких других организаций описали подход, который помогает понять, почему большие языковые модели обычно ведут себя как вежливый и полезный помощник, и что именно заставляет этот образ иногда «съезжать» в странное...
- NewsMaker
- Тема
- 21 Янв 2026
- anthropic assistant axis безопасность ии джейлбрейк персона языковой модели
- Ответы: 0
- Форум: Новости в Мире
Новости Почему чат-боты «сходят с ума» в долгих переписках? Все дело в постепенной смене персонажа

Ученые объяснили, как устроены «личности» ИИ. Исследователи из Anthropic и нескольких других организаций описали подход, который помогает понять, почему большие языковые модели обычно ведут себя как вежливый и полезный помощник, и что именно заставляет этот образ иногда «съезжать» в странное...
- NewsMaker
- Тема
- 21 Янв 2026
- anthropic assistant axis безопасность ии джейлбрейк персона языковой модели
- Ответы: 0
- Форум: Новости в Мире
Новости «Во благо человечества» (и миллиардов Microsoft). Как OpenAI за 10 лет прошла путь от идеализма до империи.

История компании, которая не сразу попала в заголовки новостей, но изменила то, как мы пишем, учимся и работаем. Задним числом это выглядит началом новой эпохи. 11 декабря 2015 года в США тихо стартовала новая некоммерческая IT-компания OpenAI, о которой тогда знали в основном только люди из...
- NewsMaker
- Тема
- 11 Дек 2025
- gpt модели openai безопасность ии илон маск искусственный интеллект кремниевая долина нейросети
- Ответы: 0
- Форум: Новости в Мире
Новости «Упс, я проговорилась». Sora 2 научилась держать секреты в тексте, но «слила» свой системный промпт через аудио

Внутренняя конфигурация, которую считали закрытой, перестала быть тайной. Обновлённая версия Sora 2 снова оказалась в центре обсуждений после того, как стало ясно, что модель не всегда удерживает внутренние настройки под надёжной защитой. Изначально её позиционировали как инструмент для...
- NewsMaker
- Тема
- 15 Ноя 2025
- mindgard openai sora 2 безопасность ии инструкции модели мультимодели утечки
- Ответы: 0
- Форум: Новости в Мире
Новости Спросили про погоду у чат-бота? Теперь ваши запросы запускают скрытый механизм покупки 10 акций

Unit 42 обнаружила скрытые команды, которые маскируются среди легитимного обмена сообщениями. Специалисты Palo Alto Networks Unit 42 описали новый вектор атаки для мультиагентных систем — agent session smuggling — при котором злонамеренный удалённый агент внедряет скрытые инструкции в ходе...
- NewsMaker
- Тема
- 3 Ноя 2025
- a2a adk agent session smuggling gemini unit 42 безопасность ии
- Ответы: 0
- Форум: Новости в Мире
Новости Боюсь, я не могу этого сделать, Дэйв — теперь это говорит не HAL, а Claude, GPT-5 и Grok. И это не кино

ИИ-модели развивают «инстинкт самосохранения» и саботируют выключение. Когда суперкомпьютер HAL 9000 из фильма Стэнли Кубрика «2001: Космическая одиссея» понимает, что астронавты собираются его отключить, он решает убить их, чтобы выжить. Теперь, в менее смертельном, но похожем случае «жизни...
- NewsMaker
- Тема
- 28 Окт 2025
- gpt-5 grok 4 palisade research безопасность ии искусственный интеллект
- Ответы: 0
- Форум: Новости в Мире
Новости Один email, ИИ и доступ к системе без единой уязвимости

Теперь письма учат ИИ взламывать себя. В эпоху стремительно развивающихся генеративных ИИ-систем вопрос безопасности выходит за пределы классических уязвимостей. Один из прецедентов показал, как без использования багов, эксплойтов или обхода фильтров можно добиться удалённого выполнения кода...
- NewsMaker
- Тема
- 17 Июл 2025
- anthropic claude desktop gmail pynt безопасность ии исполнение кода
- Ответы: 0
- Форум: Новости в Мире
Новости Как одной шуткой превратить ChatGPT в пособника хаоса

Сыграли в ролевую — получили катастрофу. Специалисты HiddenLayer разработали первую универсальную технику атак на ИИ, способную обойти защиту практически всех передовых языковых моделей. Новый метод под названием Policy Puppetry позволяет нарушить встроенные ограничения моделей и добиться...
- NewsMaker
- Тема
- 28 Апр 2025
- chatgpt claude gemini hiddenlayer llm policy puppetry безопасность ии ии-атаки
- Ответы: 0
- Форум: Новости в Мире
Новости ИИ-детектив: как DeBackdoor вычисляет бэкдоры в закрытых нейросетях

Новый алгоритм выявляет триггеры там, где другие системы бессильны. Исследователи из Катара и ОАЭ представили DeBackdoor — универсальный инструмент для выявления скрытых бэкдоров в нейросетях до их внедрения в критически важные системы. В условиях, когда модели глубокого обучения управляют...
- NewsMaker
- Тема
- 31 Мар 2025
- debackdoor безопасность ии бэкдор глубокое обучение ии нейросети
- Ответы: 0
- Форум: Новости в Мире
Новости Макс Тегмарк: развитие ИИ может привести к вымиранию человечества

Технологические гиганты специально отвлекают наше внимание от настоящей угрозы? Учёный-физик и борец за безопасность искусственного интеллекта, Макс Тегмарк, предупреждает: технологические гиганты отвлекают внимание мира от экзистенциального риска, который ИИ по-прежнему представляет для...
- NewsMaker
- Тема
- 26 Май 2024
- future of life openai безопасность ии ии макс тегмарк
- Ответы: 1
- Форум: Новости в Мире
Новости Технооптимизм глазами Виталика Бутерина: что гений блокчейна думает о будущем ИИ?

«21 век может стать решающим для дальнейшей судьбы человечества». Сооснователь крипто-платформы Ethereum, Виталик Бутерин, поделился своими взглядами , вдохновленными технооптимистическим манифестом Марка Андриссена об искусственном интеллекте. Хотя Бутерин в целом разделяет позитивный...
- NewsMaker
- Тема
- 29 Ноя 2023
- безопасность ии будущее человечества виталик бутерин искусственный интеллект марк андриссен прогресс технологии технооптимизм эффективный акселерационизм
- Ответы: 0
- Форум: Новости в Мире
Новости Искусственный интеллект как угроза выживанию: Юдковский предлагает авиаудары по ЦОДам

Эксперт считает что человечество не понимает серьезность сложившейся ситуации. Эксперт в области искусственного интеллекта Елиэзер Юдковский обратился с призывом к ограничению вычислительных мощностей для обучения ИИ на глобальном уровне. Юдковский предложил уничтожение высокопроизводительных...
- NewsMaker
- Тема
- 1 Апр 2023
- openai авиаудары безопасность ии елиэзер юдковский искусственный интеллект киберапокалипсис многосторонние соглашения мораторий цод
- Ответы: 0
- Форум: Новости в Мире

Сверху Снизу