Лента новостей
В Москве растет число компаний в индустрии дизайна
Россия и Африка стремятся к партнёрству в стратегически важных сферах
Акция «Ночь театров» пройдет в Москве в конце марта
Более 10 тысяч москвичей подали заявки на вступление в волонтерский корпус 80-летия Победы
Открылся прием заявок на участие в Московской неделе интерьера и дизайна
Фестивали, экскурсии и карта цветения: что можно найти в весеннем разделе Russpass
Технологии
ИИ-технологии «VK Видео» улучшили субтитры на 25%

Технологии искусственного интеллекта позволили сервису «VK Видео» улучшить точность анализа и расшифровки речи на 25 %. Для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте внедрены новые алгоритмы ИИ.
Нейросети не стоят на месте, а активно осваивают речь человека. Среди тысяч новых слов ИИ уже хорошо понимают мемы и акронимы, знакомы с именами собственными и профессиональными терминами. Скоро ИИ научится разделять на отдельные реплики речь разных спикеров, и это тоже поможет сделать субтитры еще понятнее.
За последний месяц на 28 % расширилась доля пользователей платформы «VK Видео», применяющих функцию субтитров в веб-версии. Сейчас субтитры включают 11 % от всей аудитории сервиса. В числе тех, кому технология реально помогает – люди с нарушениями слуха. Кроме того, бывают ситуации, когда приходится смотреть видео без звука.
Формируются субтитры автоматически благодаря работе ML-моделей. Они создают текст, расставляют знаки препинания и синхронизируют его с видео. Аудиопоток проходит несколько стадий обработки для улучшения точности. Сначала распознается речь и переводится в текст с предварительным очищением контента от посторонних шумов. Затем модели пунктуации и денормализации набор распознанных слов приводят в порядок, получая читабельный текст. И в конце производится его синхронизация с аудиодорожкой. Все это делает субтитры любительских и профессиональных видео удобными и понятными.
Источник: CNews