BLOG · EVOSYSTEM

Production AI
— как мы его строим.

Разборы того, что работает на production. Бенчмарки моделей, провалившиеся подходы, цифры по себестоимости. Раз в неделю, по пятницам.

Стартуємо ленту : з травня 2026 Формат : разбор + кейс
·
START
ПЕРВЫЙ РАЗБОР

ElevenLabs vs MiniMax для UA-голоса.

3 600 минут production-потока, два движка параллельно, цифры по latency, MOS и цене за минуту. Что мы в итоге оставили в проде и почему .

Читать
Май 2026 5 разборов · production data
TOOLS REVIEW

ElevenLabs vs MiniMax для UA-голоса. Замеры на 3 600 минутах прода.

Один inbound-поток, два движка параллельно. Latency, MOS, цена за минуту. Без «вот это звучит круче» — только цифры.

MAY 2026 12 МИН
ENGINEERING

Когда reranker в RAG не нужен. И где он спасает recall на 20 пунктов.

Cohere, BGE, GPT-as-judge — замеры на трёх production-корпусах. С цифрами recall@5, latency и cost.

MAY 2026 10 МИН
PLAYBOOK

IG-DM агент на 200+ диалогов в день. Без банов за 7 месяцев.

24-часовое окно, voice messages, rate limits Graph API и три вещи, за которые Meta банит молча.

MAY 2026 11 МИН
$
PLAYBOOK

Llama on-prem vs Claude API. На каком RPS сходится TCO.

Break-even честно : GPU, инженер, электричество, downtime. На каком потоке съезжать в свой стек — и где это никогда не окупится.

MAY 2026 13 МИН
ENGINEERING

Streaming LLM в Telegram. Где ломается edit-rate и как не ловить flood-wait.

«Печатает...» на production : 1 edit/sec лимит, message_too_long, форматирование съезжает, бот молчит 18 сек и юзер уходит.

MAY 2026 8 МИН
ENGINEERING

Зачем мы запускаем этот блог. Манифест.

Один разбор в неделю. С кодом, цифрами, ссылками. Без «AI-евангелизма» и daily-постов про каждый твит OpenAI.

MAY 2026 5 МИН
START

Читать — одно.
Запустить production AI — другое.

Если статьи отзываются и вы хотите построить под себя — расскажите о задаче.