Интернет-магазин MagazinWeb

Стабильность ИИ и выпуск ARM Легкая модель Tex-To-Audio оптимизирована для быстрого поколения на границе

< h2 class = "sdesc" > Новая модель Text-Audio AI, разработанная стабильностью AI и ARM, называется стабильным звуком Open Small. < img src = "https://i.gadgets360cdn.com/large/stable_audio_open_1717659380548.jpg? Downsize=950:*" Alt = "Стабильность и выпуск Arm Lightweight Tex-To-Audio Оптимизирована для Fast On-Device Generation" Teallabilit and "Tex-To-To-Audio. Tex-to-Audio модель оптимизирована для быстрого генерации на грани "ширина =" 950 "высота =" 633 "/> < p class = 'Подпись' > Стабильность AI говорит, что модель текста к Аудио может работать локально на смартфоне

Реклама < P >Стабильность AI разработала новую модель Text-Audio Generation Artificial Intelligence (AI) в партнерстве с ARM. Объявленная в среду, новая модель получила название Stable Audio Open Small, и, как говорят, генерирует короткие аудио -образцы с использованием текстовых подсказок. Лондонская фирма ИИ заявила, что модель легкая и оптимизирована, чтобы полностью работать на процессорах ARM. Говорят, что он имеет время быстрого поколения, что делает его полезным для массовых вариантов использования. Аудио-модель с открытым исходным кодом доступна для загрузки с GitHub и обнимающего лица.

< H2 ID = "Стабильность-AI-RELEASES-Stable-Audio-Open-Small" > Стабильность AI выпускает стабильный звук Open Open Small < P > В новостной фирме. Это дистиллированная версия стабильной Audio Open Model, которая была выпущена в июне 2024 года и может генерировать до 47 секунд звука. Меньшая модель текста к Аудио была разработана с акцентом на более высокую скорость генерации и меньший размер.

< p >Стабильный аудио Open Small – это модель параметров 341 миллиона, которая может генерировать до 11 секунд звука. Компания утверждает, что может генерировать образец аудио менее чем за восемь секунд, работая на местном уровне на смартфоне. Интересно, что AI и ARM стабильности объявили о сотрудничестве с генеративным созданием звука на мобильном конгрессе мира (MWC) 2025.

Приходя к архитектуре и обучению, стабильный звук Open Small – это скрытая диффузионная модель, основанная на архитектуре трансформатора. Он обучен набору данных из 4,86,492 аудиозаписей. Компания заявила, что все аудиофайлы лицензированы. Для кондиционирования текста использовалась общедоступная предварительно обученная модель T5. Фирма AI использовала алгоритм состязательного релятивистского контрастительного (дуга) в фазе после обучения, чтобы улучшить приверженность быстрого приверженности и увеличить скорость вывода.

~ 60 > В соответствии с компанией, эта модель текста к Аудио подходит для создания барабанных петлей, фолевых, приборов и атмосферов. Из-за его небольшого размера его можно развернуть на смартфонах с двигателем, а также на краевых устройствах. Модель также можно использовать в сценариях, где имеют значение генерации и отзывчивости в реальном времени.

< ul > < li > Samsung Galaxy Watch, Galaxy Buds 3 Series, чтобы скоро получить интеграцию Gemini

< li > Поиск Google может отказаться от кнопки «Я чувствую себя счастливчиком» для «режима искусственного интеллекта»

< P > Стабильные звуки Open Open Small Веса модели могут быть загружены в список обнимающих лиц фирмы AI, а базу кода можно найти в списке Github. Модель AI доступна для коммерческого и некоммерческого использования в соответствии с разрешающей стабильностью AI Community License.