GPT-5.2 написала браузер за 7 дней. Почему инженеры в ужасе от этого «достижения».
Неделю назад CEO Cursor Майкл Труэлл сообщил о якобы выдающемся достижении. По его словам, с помощью GPT-5.2 в Cursor они создали браузер, который работал непрерывно целую неделю. Этот браузер состоит из трёх миллионов строк кода в тысячах файлов. Движок рендеринга написан с нуля на языке Rust и включает парсинг HTML, каскадирование CSS, вёрстку, формирование текста, отрисовку и собственную виртуальную машину JavaScript.
Труэлл отметил, что браузер работает, хотя и с оговорками. У него есть проблемы, и до уровня WebKit или Chromium ему очень далеко, но команду поразило, что простые сайты рендерятся быстро и в основном корректно. Некоторым разработчикам удалось скомпилировать код после исправления багов, другие сообщили об успехе после доработки инструкций по сборке.
Однако в целом разработчики не убеждены, что Cursor совершила прорыв. Джейсон Горман, директор британской консалтинговой компании Codemanship, считает это доказательством того, что агентный ИИ масштабируется для создания нерабочего софта. Оливер Медхерст, инженер-программист и бывший сотрудник Mozilla, согласен с этой оценкой. Он отметил, что впечатляет сам факт работы с кодовой базой такого размера, но объективно это не хороший движок браузера. Кроме того, код невероятно раздут — проекты Ladybird и Servo делают гораздо больше при объёме около миллиона строк каждый.
Написание веб-браузера — одна из самых сложных задач для программиста. Chromium, открытая основа Google Chrome, содержит более 37 миллионов строк кода. Браузер Cursor, названный FastRender , насчитывает около трёх миллионов строк. Разработчик Джошуа Мариначчи ещё в 2022 году писал о том, насколько усложнился веб, до такой степени, что только несколько компаний способны создать браузер с нуля. Тот факт, что Microsoft прекратила разработку собственного движка браузера и перевела Edge на Chromium, подтверждает огромные инженерные ресурсы, необходимые для разработки и поддержки браузера.
Инженер Cursor Уилсон Лин, работавший над кодом браузера, опубликовал пост в блоге , где объяснил цели проекта — понять, как далеко можно продвинуть границы агентного кодирования для проектов, которые обычно занимают у команд людей месяцы. Критики обвинили Cursor в активном использовании Servo, открытого движка рендеринга на Rust от Mozilla. Однако Лин отверг утверждения, что FastRender собран из библиотек и фреймворков, заявив, что виртуальная машина JavaScript, DOM, системы отрисовки и текстовый конвейер разрабатываются как часть этого проекта.
Горман остаётся неубеждённым. Он указывает на метрики производительности в репозитории FastRender, которые показывают нестабильность кода. Уровень отказов сборки в 88 процентов очень высок и указывает на кодовую базу, которая не работает. Когда его спросили о сообщениях об успешных сборках, он выразил скептицизм, отметив, что CI-сборка всё ещё падает.
Горман критически относится к заявлениям об успехах ИИ-инструментов для кодирования в целом. Он ссылается на данные, показывающие, что разработчики сильно переоценивают влияние ИИ на свою продуктивность, а большинство команд испытывают негативное влияние на такие показатели, как время разработки и надёжность релизов. Меньшинство, которое видит скромные улучшения, уже устранило узкие места в процессах разработки, такие как тестирование, ревью кода и интеграция.
Многие сенсационные заявления об успехе ИИ-кодирования, по словам Гормана, исходят от разработчиков, работающих над небольшими задачами самостоятельно, без клиентов, пользователей или зависимостей от других команд. Они разогнали машину до 200 миль в час на прямой дороге без других машин и решили, что более быстрые машины означают более быстрое движение. Затем они возвращаются в офис и требуют таких же скоростных улучшений от своих команд, которые фактически едут в час пик.
Горман отмечает, что когда измеряется выход — строки кода, коммиты, пулл-реквесты — определённо наблюдается увеличение. Но это не означает реального прироста продуктивности. Он указывает на отсутствие доказательств того, что ИИ-инструменты приводят к созданию большего количества программного обеспечения, измеряемого числом продуктов в магазинах приложений, и на отсутствие выручки, которую можно отнести к этим инструментам.
Горман считает технологию ИИ очень впечатляющей, но часто ошибающейся. Он использует её каждый день как тренер и ментор, чтобы понять, как лучше её применять. Но считает ли он её революционной? Нет. Принципы и практики, которые делали команды разработчиков эффективными до ИИ — небольшие шаги, короткие циклы обратной связи, непрерывное тестирование, ревью кода и интеграция, модульный дизайн — остаются теми же. Та же игра, другие кости.
Он добавляет: если бы ИИ-агенты действительно могли создать рабочий продукт на три миллиона строк кода за неделю, когда в этом процессе проектирования происходит обратная связь от пользователей и клиентов? Именно там создаётся реальная ценность.
Неделю назад CEO Cursor Майкл Труэлл сообщил о якобы выдающемся достижении. По его словам, с помощью GPT-5.2 в Cursor они создали браузер, который работал непрерывно целую неделю. Этот браузер состоит из трёх миллионов строк кода в тысячах файлов. Движок рендеринга написан с нуля на языке Rust и включает парсинг HTML, каскадирование CSS, вёрстку, формирование текста, отрисовку и собственную виртуальную машину JavaScript.
Труэлл отметил, что браузер работает, хотя и с оговорками. У него есть проблемы, и до уровня WebKit или Chromium ему очень далеко, но команду поразило, что простые сайты рендерятся быстро и в основном корректно. Некоторым разработчикам удалось скомпилировать код после исправления багов, другие сообщили об успехе после доработки инструкций по сборке.
Однако в целом разработчики не убеждены, что Cursor совершила прорыв. Джейсон Горман, директор британской консалтинговой компании Codemanship, считает это доказательством того, что агентный ИИ масштабируется для создания нерабочего софта. Оливер Медхерст, инженер-программист и бывший сотрудник Mozilla, согласен с этой оценкой. Он отметил, что впечатляет сам факт работы с кодовой базой такого размера, но объективно это не хороший движок браузера. Кроме того, код невероятно раздут — проекты Ladybird и Servo делают гораздо больше при объёме около миллиона строк каждый.
Написание веб-браузера — одна из самых сложных задач для программиста. Chromium, открытая основа Google Chrome, содержит более 37 миллионов строк кода. Браузер Cursor, названный FastRender , насчитывает около трёх миллионов строк. Разработчик Джошуа Мариначчи ещё в 2022 году писал о том, насколько усложнился веб, до такой степени, что только несколько компаний способны создать браузер с нуля. Тот факт, что Microsoft прекратила разработку собственного движка браузера и перевела Edge на Chromium, подтверждает огромные инженерные ресурсы, необходимые для разработки и поддержки браузера.
Инженер Cursor Уилсон Лин, работавший над кодом браузера, опубликовал пост в блоге , где объяснил цели проекта — понять, как далеко можно продвинуть границы агентного кодирования для проектов, которые обычно занимают у команд людей месяцы. Критики обвинили Cursor в активном использовании Servo, открытого движка рендеринга на Rust от Mozilla. Однако Лин отверг утверждения, что FastRender собран из библиотек и фреймворков, заявив, что виртуальная машина JavaScript, DOM, системы отрисовки и текстовый конвейер разрабатываются как часть этого проекта.
Горман остаётся неубеждённым. Он указывает на метрики производительности в репозитории FastRender, которые показывают нестабильность кода. Уровень отказов сборки в 88 процентов очень высок и указывает на кодовую базу, которая не работает. Когда его спросили о сообщениях об успешных сборках, он выразил скептицизм, отметив, что CI-сборка всё ещё падает.
Горман критически относится к заявлениям об успехах ИИ-инструментов для кодирования в целом. Он ссылается на данные, показывающие, что разработчики сильно переоценивают влияние ИИ на свою продуктивность, а большинство команд испытывают негативное влияние на такие показатели, как время разработки и надёжность релизов. Меньшинство, которое видит скромные улучшения, уже устранило узкие места в процессах разработки, такие как тестирование, ревью кода и интеграция.
Многие сенсационные заявления об успехе ИИ-кодирования, по словам Гормана, исходят от разработчиков, работающих над небольшими задачами самостоятельно, без клиентов, пользователей или зависимостей от других команд. Они разогнали машину до 200 миль в час на прямой дороге без других машин и решили, что более быстрые машины означают более быстрое движение. Затем они возвращаются в офис и требуют таких же скоростных улучшений от своих команд, которые фактически едут в час пик.
Горман отмечает, что когда измеряется выход — строки кода, коммиты, пулл-реквесты — определённо наблюдается увеличение. Но это не означает реального прироста продуктивности. Он указывает на отсутствие доказательств того, что ИИ-инструменты приводят к созданию большего количества программного обеспечения, измеряемого числом продуктов в магазинах приложений, и на отсутствие выручки, которую можно отнести к этим инструментам.
Горман считает технологию ИИ очень впечатляющей, но часто ошибающейся. Он использует её каждый день как тренер и ментор, чтобы понять, как лучше её применять. Но считает ли он её революционной? Нет. Принципы и практики, которые делали команды разработчиков эффективными до ИИ — небольшие шаги, короткие циклы обратной связи, непрерывное тестирование, ревью кода и интеграция, модульный дизайн — остаются теми же. Та же игра, другие кости.
Он добавляет: если бы ИИ-агенты действительно могли создать рабочий продукт на три миллиона строк кода за неделю, когда в этом процессе проектирования происходит обратная связь от пользователей и клиентов? Именно там создаётся реальная ценность.
- Источник новости
- www.securitylab.ru