Cursor: представили Debug Mode
В Cursor 2.2 появился Debug Mode — сбор рантайм-логов и верификация человеком; также added multi-agent judging для выбора лучшей реализации.
В Cursor 2.2 появился Debug Mode — сбор рантайм-логов и верификация человеком; также added multi-agent judging для выбора лучшей реализации.
Утечка карточки Gemini 3 Pro — документ на pixeldrain/Wayback указывает, что модель опережает GPT‑5.1 и Claude Sonnet 4.5; намёки на релиз в Cursor/AI Studio.
OpenRouter тестирует Sherlock Dash Alpha и Sherlock Think Alpha с контекстом 1,84 млн токенов; вероятно это обновлённый Grok 4, релиз — конец ноября–начало декабря.
Обзор Microsoft RedCodeAgent — автоматический агент для red‑teaming кодовых агентов; выявил 82 уникальные уязвимости в OpenCodeInterpreter.
Claude Code от Anthropic помог найти ошибку в Go‑реализации ML‑DSA: модель указала на «high bits» и подсказала идею автозапуска LLM при падении тестов.
Результаты бенчмарка GPT-4.1-nano: Markdown-KV даёт 60,7% точности, CSV — 44,3%; Markdown-KV дороже по токенам (×2,7). Источник: Habr.
Google запустил Gemini CLI Extensions — фреймворк для подключения внешних инструментов к Gemini CLI; интеграции с Dynatrace, Figma, Cloud Run и публичный каталог.
Gemini 2.5 Computer Use — модель Google, которая управляет UI: клики, ввод, скриншоты в цикле; превью через Gemini API, Google AI Studio и Vertex AI.
Краткий обзор OpenAI DevDay 2025: Apps SDK, AgentKit, обновлённый Codex, и анонс GPT-5 Pro и Sora-2 в API.
Перевод статьи: автор сообщает, что в его проекте 90% кода пишет ИИ‑агенты, но ответственность за архитектуру остаётся за человеком. Источник — Хабр.
JetBrains предлагает бесплатные корпоративные лицензии в обмен на сбор рабочих данных (фрагменты кода, история редактирования, команды) с обещанием GDPR‑хранения.
Анонс Qwen3‑Omni — мультимодальная модель от Qwen: текст, картинки, аудио и видео; новая схема Thinker–Talker, MoE и SOTA по ряду бенчмарков.
Дайджест с ключевыми ссылками недели: GPT-5-Codex, Grok 4 Fast, обсуждение AI и подростков, безопасность AI-ассистентов.
Анонс GPT-5-Codex — модель для агентного программирования: пишет проекты с нуля, делает код‑ревью, находит баги и выполняет масштабные рефакторинги. Ссылка на Хабр.
Короткая заметка о релизах: Kimi K2.5 дообучена на ~15 трлн визуально‑текстовых токенов с фокусом на код и визуальный контекст; Agent Swarm оркестрирует до 100 субагентов.
Anthropic опубликовали тестовое задание по оптимизации производительности виртуальной машины: старт 147 734 такта, лучшие результаты Opus 4.5 около 1363 тактов.
Anthropic добавили нативную поддержку LSP в Claude Code — доступ к семантике кода, переходам, типам и символам для агентных сценариев.
Anthropic представили Claude Code с доступом к браузеру — чтение DOM, отслеживание ошибок в консоли и проверка фич прямо в браузере.
Разбор настройки Kilo Code через RouterAI: подключение Claude, GPT, DeepSeek, роли агентов, diff‑патчи и работа с контекстом.
Linux Foundation создает Agentic AI Foundation: под крыло передали MCP (Anthropic), goose (Block) и AGENTS.md (OpenAI); платиновые участники — AWS, Google, Microsoft и др.