А если я скажу, что MCP — не всегда лучший инструмент?
Анализ материала о том, почему громоздкие MCP‑сервера часто уступают минималистичным CLI/Bash и скриптам; пример скрапинга Hacker News.
Анализ материала о том, почему громоздкие MCP‑сервера часто уступают минималистичным CLI/Bash и скриптам; пример скрапинга Hacker News.
xAI представила Grok 4.1: точнее, эмоциональнее и творчески гибче; лидерство в бенчмарках (Thinking/EQ‑Bench) и проблемы с доступом в API.
Минимизация: MiniMax-M2 от MiniMaxAI — MoE-модель 10B для кода и агентов, опережающая Grok 4 Fast и Gemini 2.5 Pro по ряду бенчмарков.
Короткий разбор Claude Skills от Anthropic: как «папки с навыками» меняют подход к интеграции ИИ и чем они отличаются от MCP.
Claude Agent (Claude 4.5 Sonnet) встроен в AI‑чат IDE JetBrains и доступен в подписке JetBrains AI; поддерживает диффы, Plan, Brave mode и работу с файлами.
Короткий обзор десктопного Codex от OpenAI: визуальный доступ к Skills, IDE‑фишки и бета‑планирование автоматизаций; временно открыт бесплатный доступ для Free и Go.
Claude Opus 4.6 от Anthropic: контекстное окно до 1 млн токенов, улучшения в агентном программировании и бенчмарках против GPT-5.2; доступно в Claude и RouterAI.
GPT-5.3‑Codex объединяет кодинг‑возможности и reasoning, работает ~25% быстрее и лучше держит контекст в длинных сессиях с инструментами.
Бесплатный вебинар Veai о проблемах AI‑ассистентов на больших кодовых базах; трансляция 12 февраля в 14:30 МСК. Ссылка на регистрацию в посте.
MiniMax представили M2.5: SOTA в программировании (SWE‑Bench 80,2%), +37% скорости и бесплатный 7‑дневный доступ в OpenCode.
Эволюция Opus: от проблемного компилятора до Opus 4.6 — Agentic Coding почти без изменений, Agentic Search вырос на 17%.
Запись вебинара Veai «Обзор AI-ассистентов для кодинга в 2026» доступна на Rutube; промокод veai_for_devs даёт 5000 Flex‑кредитов до 28 февраля.
Anthropic представили Claude Sonnet 4.6: контекстное окно 1M токенов (бета), преимущество в Claude Code и прежние тарифы $3/$15 за млн токенов.
Сравнение быстрого режима Anthropic (Opus 4.6, batch size) и OpenAI (GPT-5.3-Codex-Spark на Cerebras): скорость, ограничения памяти и практическая ценность.
Обзор Cursor 2.5: маркетплейс плагинов (Amplitude, AWS, Figma, Linear, Stripe), sandbox с allowlist и асинхронные субагенты — что изменилось.
Anthropic проанализировали миллионы сессий Claude Code: рост длительности автономной работы до ≈45 минут, auto-approve ~20% у новичков и >40% у опытных.
Anthropic анонсировали Claude Code Security — инструмент для поиска логических уязвимостей; с помощью Claude Opus 4.6 найдено 500+ багов в open‑source.
OpenAI перестала применять SWE-bench Verified из‑за утечек ответов; рекомендован SWE-bench Pro. Anthropic обвиняет DeepSeek и др. в обучении на Claude без доказательств.
Anthropic экспортировали актуальные скиллы для разработки Claude Code; в репозитории Skills есть пример Skill-creator и поддержка открытого стандарта.
Alibaba представили четыре open‑source модели Qwen 3.5 (0.8B–9B) с мультимодальностью; 9B превосходит Qwen3-30B и GPT‑5‑Nano по ряду бенчмарков.