Лента новостей
Ambassadori Island может изменить расстановку сил на рынке недвижимости Батуми
ARTPLAY запускает конкурс скульпторов для интерактивной выставки на террасе центра
«Опора России» просит Путина защитить единство рынка от региональных запретов вейпов
«Вертолеты России» представили импортозамещенный Ми-171А3 на ЭКСПО в Харбине
Технологии
ИИ-технологии «VK Видео» улучшили субтитры на 25%
Технологии искусственного интеллекта позволили сервису «VK Видео» улучшить точность анализа и расшифровки речи на 25 %. Для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте внедрены новые алгоритмы ИИ.
Нейросети не стоят на месте, а активно осваивают речь человека. Среди тысяч новых слов ИИ уже хорошо понимают мемы и акронимы, знакомы с именами собственными и профессиональными терминами. Скоро ИИ научится разделять на отдельные реплики речь разных спикеров, и это тоже поможет сделать субтитры еще понятнее.
За последний месяц на 28 % расширилась доля пользователей платформы «VK Видео», применяющих функцию субтитров в веб-версии. Сейчас субтитры включают 11 % от всей аудитории сервиса. В числе тех, кому технология реально помогает – люди с нарушениями слуха. Кроме того, бывают ситуации, когда приходится смотреть видео без звука.
Формируются субтитры автоматически благодаря работе ML-моделей. Они создают текст, расставляют знаки препинания и синхронизируют его с видео. Аудиопоток проходит несколько стадий обработки для улучшения точности. Сначала распознается речь и переводится в текст с предварительным очищением контента от посторонних шумов. Затем модели пунктуации и денормализации набор распознанных слов приводят в порядок, получая читабельный текст. И в конце производится его синхронизация с аудиодорожкой. Все это делает субтитры любительских и профессиональных видео удобными и понятными.
Источник: CNews