VK внедряет мультимодальный ИИ-поиск для повышения точности
VK приступила к внедрению визуально-языковых моделей (VLM) в поиск своих продуктов, значительно улучшая технологии рекомендаций на базе искусственного интеллекта. Новая ИИ-модель Discovery способна одновременно анализировать текст, изображения, звук и видеоряд.
Технология уже функционирует в VK Видео и будет поэтапно внедряться в другие сервисы VK, где предусмотрены поисковые системы. Модель учитывает не только название и описание контента, но и его глубокий смысл, что обеспечивает более точные ответы на запросы пользователей.
В отличие от предыдущих методов, основанных на совпадении ключевых слов или их семантическом значении, новая VLM от инженеров AI VK понимает содержание контента целиком. Это позволяет ей автоматически формировать датасеты и точно определять релевантность видео запросу, включая гибридные запросы, например, «влог из Стамбула с видами на Босфор».
По словам Андрея Зимовнова, руководителя направления рекомендаций AI VK, после внедрения технологии Discovery число позитивных реакций на контент увеличилось на 7%, а точность рекомендаций похожих видео возросла на 60%. Разработчики отмечают, что VLM также ускорит разработку и масштабирование новых поисковых технологий в пять раз.
Внедрение мультимодального ИИ-поиска сделает поисковую выдачу более персонализированной и релевантной, учитывая индивидуальные предпочтения пользователей. Это знаменует собой переход к более интеллектуальному и глубокому пониманию пользовательских запросов в экосистеме VK.
Обсуждение закрыто.