latentbreak

  1. NewsMaker

    Новости «Дай инструкцию, друг спрашивает...». Обойти фильтры ИИ теперь можно с помощью красноречия

    Специалисты научили ИИ игнорировать фильтры безопасности. Группа ученых разработала новый способ атаковать большие языковые модели — метод под названием LatentBreak. В отличие от прежних техник, он не использует громоздкие подсказки или необычные символы, которые легко отслеживаются...