Блог / Заметки
Пишу про backend-архитектуру, AI-инфраструктуру, gamedev и всё что узнаю в работе с production-системами под нагрузкой.
Разбор реального кейса: от постановки задачи до production-деплоя. Какие модели выбрали, почему отказались от облачных API и как добились задержки ответа менее 80мс на P99.