Как Anthropic решили три проблемы AI‑агентов
Разбор Opus 4.5: Tool Search Tool, Programmatic Tool Calling и Tool Use Examples — уменьшение токенов и рост точности вызовов агентов.
Разбор Opus 4.5: Tool Search Tool, Programmatic Tool Calling и Tool Use Examples — уменьшение токенов и рост точности вызовов агентов.
Anthropic представила Claude Haiku 4.5 — в три раза дешевле и в два раза быстрее Sonnet 4; доступна через Claude.ai, API, AWS Bedrock, Vertex AI и Copilot.
Краткая выжимка из отчёта JetBrains 2025: 85% разработчиков используют ИИ, TypeScript растёт, Scala — самый высокооплачиваемый язык.
Короткий перевод и ссылка на исследование Apiiro: ускорение разработки с AI‑ассистентами связано с ростом уязвимостей; подробности на Хабр.
4Devs попал в ТОП-2 UGC и в ТОП-8 overall по версии Habr; краткий итог и список каналов проекта, охват более 6.5k.
Краткий обзор GPT-5.2‑Codex: прогресс на SWE‑Bench и Terminal‑Bench, улучшенная компакция и усиленный фокус на defensive cybersecurity.
Пошаговые гайды RouterAI по подключению в VS Code, IntelliJ, NeoVIM и Zed; настройка для Claude 4.5 Sonnet, GPT-5.1 и других.
Короткая заметка о слухах вокруг Opus 4.5: упоминания Sonnet 4.5, Haiku 4.5 и инсайдов с кодовым названием Kayak от Anthropic.
Codex‑Mini — облегчённая версия GPT‑5-Codex: в ~4 раза больше запросов при небольшой потере точности; повышенные лимиты для Plus, Business и Edu.
Notion 3.0 вводит AI‑агентов, выполняющих рабочие задачи в воркспейсе — персонализация, команды агентов и автоматизация процессов. Источник: Хабр.
Дайджест AI for Devs: подборка статей про будущее джунов, галлюцинации LLM, LPU, Instinct и новость о Mistral AI.
Краткий перевод о том, почему RAG (Vector, Graph, Agentic) часто эффективнее дообучения; ссылка на статью на Habr.
Miguel Grinberg объясняет, почему генеративные ИИ‑агенты не ускоряют работу и повышают риски — подробности на Хабр.
Z.ai выпустили GLM-4.7 с фокусом на агентные сценарии и interleaved thinking; заметный прирост в SWE-bench и Terminal Bench, веса на Hugging Face.
В Cursor 2.2 появился Debug Mode — сбор рантайм-логов и верификация человеком; также added multi-agent judging для выбора лучшей реализации.
Утечка карточки Gemini 3 Pro — документ на pixeldrain/Wayback указывает, что модель опережает GPT‑5.1 и Claude Sonnet 4.5; намёки на релиз в Cursor/AI Studio.
OpenRouter тестирует Sherlock Dash Alpha и Sherlock Think Alpha с контекстом 1,84 млн токенов; вероятно это обновлённый Grok 4, релиз — конец ноября–начало декабря.
Обзор Microsoft RedCodeAgent — автоматический агент для red‑teaming кодовых агентов; выявил 82 уникальные уязвимости в OpenCodeInterpreter.
Claude Code от Anthropic помог найти ошибку в Go‑реализации ML‑DSA: модель указала на «high bits» и подсказала идею автозапуска LLM при падении тестов.
Результаты бенчмарка GPT-4.1-nano: Markdown-KV даёт 60,7% точности, CSV — 44,3%; Markdown-KV дороже по токенам (×2,7). Источник: Habr.