Интернет-магазин MagazinWeb

VLC Media Player демонстрирует генерацию субтитров на базе искусственного интеллекта и функцию перевода на выставке CES 2025

Функция автоматической генерации субтитров VLC будет работать на основе моделей с открытым исходным кодом и локальных моделей ИИ.

VLC Media Player Showcases AI-Powered Subtitle Generation, Translation Feature at CES 2025

VideoLAN заявила, что функция субтитров будет поддерживать более 100 языки Реклама <стр>VLC media player, проект с открытым исходным кодом, разработанный VideoLAN, получает новую функцию искусственного интеллекта (ИИ). На недавно завершившейся выставке бытовой электроники (CES 2025) проект продемонстрировал функцию субтитров на основе ИИ, которая может генерировать и показывать субтитры на лету. Функция также поддерживает перевод в реальном времени и может мгновенно генерировать переведенные субтитры на нескольких языках. Функция ИИ медиаплеера будет работать на основе моделей с открытым исходным кодом и локальных больших языковых моделей (LLM) и работать в автономном режиме. Пока неизвестно, когда эта функция будет развернута для пользователей.

VLC получает функцию субтитров, сгенерированных ИИ

В последнее время растет популярность субтитров, генерируемых ИИ. Samsung представила свою новую технологию Vision AI для дисплеев, которые могут генерировать субтитры в режиме реального времени. Ранее Google добавила функцию Expressive Captions на все устройства под управлением Android 14 или более поздней версии в США.

В сообщении на X (ранее известном как Twitter) президент VideoLAN Жан-Батист Кемпф продемонстрировал новую функцию ИИ для медиаплеера VLC и подчеркнул, что генерация и перевод субтитров основаны на локальных и открытых моделях ИИ.

Открытые модели ИИ — это те, которые доступны в открытом доступе и могут использоваться и встраиваться в программное обеспечение без уплаты разработчикам или головной организации каких-либо лицензионных сборов. Некоторые примеры включают Llama 3.1 405B от Meta, Mixtral 8x22B и DeepSeek от Alibaba.

VideoLAN использует такие модели с открытым исходным кодом (команда не раскрывает название модели ИИ) локально, чтобы добавить функцию субтитров, генерируемых ИИ, изначально. Поскольку эта функция встроена в приложение, она может работать локально и без необходимости поддержки облака.

Хотя команда не затрагивала вопрос о том, существенно ли это увеличит основные требования, необходимые для работы медиаплеера VLC, в сообщении она заявила: «Цель — не зависеть от дорогостоящей облачной операции!»

  • OpenAI, возможно, ненадолго добавила новые пользовательские параметры инструкций в ChatGPT
  • Марк Цукерберг предположительно обучал модели ИИ на защищенных авторским правом работах

В частности, VideoLAN продемонстрировала сгенерированные ИИ субтитры на английском языке, Французский, иврит, немецкий и японский языки. Кемпф также заявил, что в конечном итоге функция субтитров VLC, сгенерированная искусственным интеллектом, будет поддерживать более 100 языков. Проект еще не объявил дату выпуска этой функции.