Виртуальная примерочная ВКонтакте: как мы превратили VTO из невозможной технологии в масштабируемый продукт
Когда VK пришли к нам с запросом на виртуальную примерочную, казалось, что сама идея опережает реальность. Рынок был переполнен прототипами, которые красиво смотрелись на конференциях, но рассыпались при попытке масштабирования. Пять минут на генерацию, искажения тел, зависимость от «идеальных» поз — всё это делало виртуальную примерку скорее экспериментом, чем инструментом для миллионов пользователей.
Но именно в таких условиях рождаются проекты, которые сдвигают рынок. Так началась работа над виртуальной примерочной — mini-app, в котором любой человек может за секунду примерить одежду более чем 20 российских брендов прямо на своём фото.
VK поставили задачу, которая на тот момент не имела рабочих аналогов:
- создать внутри ВКонтакте виртуальную примерочную, доступную для аудитории в 79 млн пользователей в сутки;
- дать брендам новый канал продвижения;
- обеспечить генерацию за секунду, а не за минуты;
- обеспечить реалистичность для разных телосложений, поз и освещения, а не только «подготовленных» студийных фото.
Проще говоря: нужно было создать не VTO-демо, а настоящую продуктовую систему, которая выдержит массовое ежедневное использование.
Любая высокотехнологичная система начинается с выбора фокуса. Мы сознательно выбрали фокусом момент, когда человек нажимает кнопку «Примерить». Именно в эту секунду он либо получает магию, либо закрывает приложение навсегда. Этот эмоциональный центр стал основой всего продукта.
Эта точка определила требования:
- генерация должна происходить мгновенно — иначе исчезает эффект живого взаимодействия;
- изображение должно быть реалистичным на любом теле, без артефактов, гендерных ошибок и ломанных поз;
- система должна быть частью экосистемы VK, а не разовым экспериментом;
- бренды должны получать органический охват, а не просто «красивую витрину».
На этой логике выросло продуктовое решение: масштабируемый VTO-сервис на базе оптимизированной диффузионной модели, собственного сбалансированного датасета и архитектуры из девяти микросервисов.
Микросервисы (9 компонентов):
- orchestrator
- preprocessor
- human parser
- mask generator
- latent encoder
- diffuser
- launcher
- keypoint detector
- prompt & image embedder
Инфраструктура
- масштабируемая микросервисная архитектура
- автоматизация загрузки товаров
- административная панель для брендов
R&D: понять, почему не работает рынок VTO
Прежде чем писать код, нам нужно было найти решение, которое обеспечит фотореалистичное качество примерки. Мы отказались от готовых коробочных API в пользу собственного пайплайна.
- Провели исследование SOTA-решений (State of the Art) в области компьютерного зрения.
- Протестировали более 5 гипотез реализации, отсеяв архитектуры с низким качеством генерации.
- Собрали первый черновой прототип для валидации технологии.
Оптимизация производительности
Изначально генерация одного образа занимала критические 5 минут — это недопустимо для пользователя соцсети. Нашей задачей было ускорить процесс без потери качества.
- Оптимизировали работу нейросети и архитектуру запросов.
- Сократили Latency (задержку отклика) с 5 минут до 1 секунды.
- Запустили закрытую веб-версию для нагрузочных тестов.
Разработка архитектуры Mini App (MVP)
Перенесли технологии в нативную среду ВКонтакте. Для пользователя сложная «магия» под капотом упакована в простой и привычный интерфейс.
- Разработали frontend мини-приложения на React.
- Реализовали механику «умной» примерки: выбор категории (верх/низ), смена вещей в пару тапов, мгновенное наложение на фото.
- Настроили систему фильтров для быстрого поиска по каталогу.
Создание инструментов для бизнеса
Чтобы проект жил, бренды должны легко добавлять в него свои коллекции. Мы автоматизировали этот процесс, минимизировав ручной труд.
- Разработали удобную админ-панель для управления товарами.
- Внедрили функцию автоматического импорта товаров по кнопке (парсинг фидов).
- Настроили инструменты модерации и редактирования каталога.
Виральность и безопасность
Технология работает на охваты: мы интегрировали примерку внутри социальной сети ВКонтакте, чтобы пользователи сами рекламировали сервис.
- Реализовали шеринг результатов: сгенерированный образ можно в один клик опубликовать на стене или в историях.
- Внедрили инструменты удаления пользовательских данных для соответствия требованиям безопасности.
Масштабирование и развитие (Enhancement)
После запуска MVP мы начали углублять функциональность для крупных партнеров и улучшать UX.
- Разработали «Бренд-зоны» — эксклюзивные пространства для конкретных магазинов внутри приложения.
- Добавили возможность смены пола для примерки (мужские и женские коллекции).
- Интегрировали Яндекс.Метрику и сквозную аналитику для отслеживания бизнес-показателей.
Виртуальная примерочная ВКонтакте стала первым в России жизнеспособным продуктом в области VTO. Не демо, не исследование, не PoC — именно продукт.
Он дал пользователям новый инструмент выбора, брендам — новый канал взаимодействия, а рынку — подтверждение, что качественный VTO может работать массово, если его построить правильно.
Итоги первых месяцев:
Но главное — изменение поведения пользователей.
Житель Екатеринбурга за две минуты перебирает пять пар джинсов. Девушка из Новосибирска примеряет худи московского бренда, не выходя из дома. Мама подбирает подарок дочери и впервые попадает в размер с первой попытки.
Каждая такая генерация — не реклама, а реальный опыт взаимодействия с брендом.
проекта