Интернет-магазин MagazinWeb

Модели Xiaomi Mimo AI запущены с эффективными рассуждениями, небольшой размер

< h2 class = "sdesc" > xiaomi сказал, что серия MIMO моделей AI оптимизирует возможности рассуждения в относительно небольшом размере. < img src = "https://i.gadgets360cdn.com/large/artificial_intelligence1_unsplash_markus_winkler_1735197211993.jpg? lownsize Модели Mimo AI, запущенные с эффективными рассуждениями, небольшой размер "ширина =" 950 "высота =" 633 "/> < p class = 'Подпись' > ~ xiaomi-база проходит предварительную обучение на 25 триллиона токена

Реклама < P >Xiaomi во вторник выпустила модель искусственного интеллекта (ИИ) с открытым исходным кодом. Семейство моделей рассуждений, получившее название Mimo, внедряет оптимизацию способностей рассуждения в относительно меньшем размере параметров. Это также первая модель рассуждений с открытым исходным кодом технологического гиганта, и она конкурирует с китайскими моделями, такими как DeepSeek R1 и QWEN Alibaba QWQ-32B, и глобальные модели рассуждений, включая флэш-мышление Gemini 2.0 Google и Google. Семейство MIMO включает в себя четыре различных моделя, каждая из которых с уникальными вариантами использования.

< H2 ID = "Xiaomi-S-Mimo-reasoning-ai-model-is-here" > xiaomi’s mimo systering ai модель, чтобы конкурировать с Deepseek R1

С серией моделей искусственного интеллекта MIMO исследователи Xiaomi стремились решить проблему размера в рассуждениях моделей искусственного интеллекта. Модели рассуждений (по крайней мере, те, которые могут быть измерены) имеют около 24 миллиардов или более параметров. Большой размер сохраняется для достижения равномерных и одновременных улучшений как в кодировании, так и математических возможностях крупных языковых моделей, что-то, что считается трудным для достижения с меньшими моделями.

~ 60 > для сравнения, MIMO имеет семь миллиардов параметров, а Xiaomi утверждает, что его производительность совпадает с Openai’s O1-Mini и Outperformes с моделями 32. Исследователи утверждали, что базовая модель AI была предварительно обучена на 25 триллиона токена. Кроме того, предварительное обучение MIMO включало трехэтапную стратегию смеси данных.

< P > на основе внутреннего тестирования, исследователи Xiaomi утверждают, что оценки MIMO-7B-базы 75,2 на тесте с большим жестким (BBH) для расчетов. Обучение на основе нулевого усиления (RL) MIMO-7B-RL-Zero преуспевает в математике и связанных с кодированиях задач, а также баллов 55,4 на тесте AIME, опережая O1-Mini на 4,7 балла.

< ul > < li > Новые модели искусственного интеллекта Openai теперь могут «думать с изображениями»

< li > OpenAI выпускает модели искусственного интеллекта GPT-4.1 серии GPT-4.1 в API

< P > Поскольку MIMO-это модель AI с открытым исходным кодом, ее можно загрузить из списка Xiaomi на GitHub и обнимающееся лицо. Технический документ подробно описывает архитектуру модели, а также процессы предварительного обучения и после тренировки. Это текстовая модель и не имеет мультимодальных возможностей. Подобно большинству выпусков с открытым исходным кодом, подробности о наборе данных модели не известны.