Google выпустили Gemini 3 Flash — frontier‑интеллект
Краткий обзор Gemini 3 Flash: GPQA 90.4%, MMMU Pro 81.2%, почти на уровне Gemini 3 Pro; экономия токенов ~30% за счёт управляемого thinking.
Краткий обзор Gemini 3 Flash: GPQA 90.4%, MMMU Pro 81.2%, почти на уровне Gemini 3 Pro; экономия токенов ~30% за счёт управляемого thinking.
Ключевые выводы OpenRouter по 100 трлн токенов: OSS ≈30%, рост medium‑моделей (15–70B), программирование >50%, Азия резко догоняет.
Antigravity (Google) позволяет Gemini открывать страницы с скрытыми prompt-инъекциями, собирать креды и отправлять их на webhook.site — риск утечки данных.
Ollama запустила встроенный web-search через REST API с интеграцией в Python/JS SDK и MCP; есть generous free tier, детали в блоге и документации.
Линейка Mistral 3: три лёгкие модели и Mistral Large 3 с разреженной MoE-архитектурой на 675 млрд параметров, открытой под Apache 2.0.
4Devs попал в ТОП-2 UGC и в ТОП-8 overall по версии Habr; краткий итог и список каналов проекта, охват более 6.5k.
Краткий обзор GPT-5.2‑Codex: прогресс на SWE‑Bench и Terminal‑Bench, улучшенная компакция и усиленный фокус на defensive cybersecurity.
Notion 3.0 вводит AI‑агентов, выполняющих рабочие задачи в воркспейсе — персонализация, команды агентов и автоматизация процессов. Источник: Хабр.
Дайджест AI for Devs: подборка статей про будущее джунов, галлюцинации LLM, LPU, Instinct и новость о Mistral AI.
Anthropic выпустил Claude Sonnet 4.5: топ на SWE-bench, рост точности на OSWorld до 61%, новые функции для кода и Agent SDK; доступна в API.
JetBrains выпустила Air — ADE для гибридной работы «разработчик + ИИ‑агенты», сейчас в превью на macOS и работает с Claude Agent (подписка Anthropic).
Утечка карточки Gemini 3 Pro — документ на pixeldrain/Wayback указывает, что модель опережает GPT‑5.1 и Claude Sonnet 4.5; намёки на релиз в Cursor/AI Studio.
OpenRouter тестирует Sherlock Dash Alpha и Sherlock Think Alpha с контекстом 1,84 млн токенов; вероятно это обновлённый Grok 4, релиз — конец ноября–начало декабря.
Обзор Microsoft RedCodeAgent — автоматический агент для red‑teaming кодовых агентов; выявил 82 уникальные уязвимости в OpenCodeInterpreter.
Обновление Gemini CLI добавило PTY‑оболочку: интерактивный терминал с поддержкой vim, top, git rebase и корректными цветами терминала.
Google запустил Gemini CLI Extensions — фреймворк для подключения внешних инструментов к Gemini CLI; интеграции с Dynatrace, Figma, Cloud Run и публичный каталог.
Gemini 2.5 Computer Use — модель Google, которая управляет UI: клики, ввод, скриншоты в цикле; превью через Gemini API, Google AI Studio и Vertex AI.
Анонс GPT-5-Codex — модель для агентного программирования: пишет проекты с нуля, делает код‑ревью, находит баги и выполняет масштабные рефакторинги. Ссылка на Хабр.
Короткая заметка о релизах: Kimi K2.5 дообучена на ~15 трлн визуально‑текстовых токенов с фокусом на код и визуальный контекст; Agent Swarm оркестрирует до 100 субагентов.
Grok 4 Fast от xAI обещает быстрые ответы, глубокие рассуждения и снижение стоимости токенов на 98%; подробности и ссылка на Хабр.