бенчмарк

  1. NewsMaker

    Новости MemPalace: Милла Йовович запустила открытый инструмент для долгосрочной памяти ИИ… и сообщество тут же его разнесло

    Инструмент собрал 34 тысячи звезд за три дня. В чем подвох? Милла Йовович неожиданно оказалась в центре спора о памяти ИИ. Актриса вместе с Беном Сигманом запустила MemPalace , открытый инструмент для долгосрочной памяти моделей, и за считаные дни проект успел собрать десятки тысяч звезд на...
  2. NewsMaker

    Новости ИИ попросили поработать реверсером. Получилось так себе (но прогресс всё равно пугает)

    Opus 4.6 показала лучший результат в тесте на выявление скрытых бэкдоров. В мире информационной безопасности появился новый способ оценить, насколько современные ИИ-модели способны находить скрытые бэкдоры в уже скомпилированных программах. Компания Quesma представила результаты проекта...
  3. NewsMaker

    Новости 100 видеоигр против всех ИИ мира — счет 100:0 в пользу человечества

    ARC-AGI-3: новый тест на здравый смысл, который нейросети массово проваливают. Фонд ARC Prize представил новый эталон для проверки универсальных способностей искусственного интеллекта — ARC-AGI-3. Если ранние версии теста предлагали абстрактные головоломки с цветными решётками, то теперь...
  4. NewsMaker

    Новости GPT-5 прошёл тест на пространственное мышление. Результат удивил даже учёных

    Миллиард токенов потратили на эксперимент, который перевернул представления о возможностях машин. Исследователи из SenseTime Research и S‑Lab Наньянского технологического университета представили подробный технический отчёт о прогрессе мультимодальных моделей в области пространственного...
  5. NewsMaker

    Новости 2 миллиона кубитов: DARPA приближается к квантовому превосходству

    DARPA выясняет, как новые технологии изменят мир науки и бизнеса. DARPA запустила программу Quantum Benchmarking в 2021 году для оценки прогресса в области квантовых вычислений. Программа направлена на создание новых метрик для измерения достижений в квантовых вычислениях и устранение...
  6. NewsMaker

    Новости Intel обвиняется в манипулировании результатами тестов процессоров

    Под угрозой многомиллионные инвестиции. Организация по оценке производительности систем SPEC (Standard Performance Evaluation Corporation) аннулировала более 2600 результатов тестирования процессоров Intel Xeon за 2022 и 2023 годы. Причина – использование Intel специальных компиляторов...
  7. NewsMaker

    Новости Гонка суперкомпьютеров продолжается. Кто заберёт золотую медаль в этом противостоянии?

    MLPerf поделилась результатами тестирования суперкомпьютеров от Nvidia, Intel и Google. MLPerf , ведущий публичный бенчмарк на способность компьютерных систем обучать нейронные сети, добавил в свою таблицу результаты тестирования производительности различных систем для обучения крупных...
  8. NewsMaker

    Новости Новый открытый бенчмарк поможет оценить и улучшить навыки роботов-сборщиков

    Исследователи представили платформу для сравнения и развития робототехники в области производства и сборки. Роботы-сборщики - это роботы, которые могут собирать различные продукты из отдельных деталей. Они могут быть очень полезны для промышленности, но для этого им нужно уметь манипулировать...