префилл

  1. NewsMaker

    Новости «Конечно, вот ваш вирус». Как заставить нейросеть согласиться на что угодно одной строкой кода

    Исследователи описали технику sockpuppeting, которая помогает обходить ограничения 11 крупных языковых моделей через подставное «согласие» ассистента. Оказалось, что для взлома защит крупных языковых моделей иногда не нужен сложный набор трюков. Исследователи описали технику под названием...