Gemini 1.5 Flash-8B — экспериментальная версия Gemini 1.5 Flash, впервые выпущенная в прошлом месяце.
Реклама
Gemini 1.5 Flash-8B, новейшая модель в семействе моделей искусственного интеллекта (ИИ) Gemini, теперь доступна для использования в производстве. В четверг Google объявила о доступности модели, подчеркнув, что это уменьшенная и более быстрая версия Gemini 1.5 Flash, представленная на Google I/O. Благодаря своей скорости, она обеспечивает низкую задержку вывода и более эффективную генерацию выходных данных. Что еще более важно, технологический гигант заявил, что модель искусственного интеллекта Flash-8B имеет «самую низкую стоимость на интеллект среди всех моделей Gemini».
Gemini 1.5 Flash-8B теперь доступна в целом
В сообщении в блоге разработчиков базирующийся в Маунтин-Вью технологический гигант подробно описал новую модель ИИ. Gemini 1.5 Flash-8B была создана на основе модели Gemini 1.5 Flash AI, которая была ориентирована на более быструю обработку и более эффективную генерацию выходных данных. Теперь компания утверждает, что Google DeepMind разработала эту еще более компактную и быструю версию модели ИИ за последние несколько месяцев.
Несмотря на то, что это меньшая модель, технологический гигант утверждает, что она «почти соответствует» производительности модели 1.5 Flash по нескольким показателям. Некоторые из них включают чат, транскрипцию и длинный контекстный языковой перевод.
Одним из основных преимуществ модели ИИ является ее ценовая эффективность. Google заявила, что Gemini 1.5 Flash-8B предложит самую низкую цену на токены в семействе Gemini. Разработчикам придется платить 0,15 долл. США (примерно 12,5 рупий) за миллион выходных токенов, 0,0375 долл. США (примерно 3 рупии) за миллион входных токенов и 0,01 долл. США (примерно 0,8 рупии) за миллион токенов в кэшированных подсказках.
- Gemini Live Now работает на хинди и еще восьми региональных языках
- Google для Индии 2024: представлены новые функции ИИ, оплаты и здравоохранения
Кроме того, Google удваивает лимиты скорости 1,5 Модель Flash-8B AI. Теперь разработчики могут отправлять до 4000 запросов в минуту (RPM) при использовании этой модели. Объясняя решение, технологический гигант заявил, что модель подходит для простых, объемных задач. Разработчики, желающие опробовать модель, могут сделать это через Google AI Studio и Gemini API бесплатно.