Molmo AI: мультимодальная модель ИИ на открытом языке SOTA 

Molmo Семейство открытых моделей языка зрения, разработанное Институтом искусственного интеллекта Аллена. OpenSource

MolmoAI основан на Qwen2

Molmo AI Free NoLogin онлайн

Если вы столкнулись с ошибкой, пожалуйста, выберите другой

Имиджевый чатбот с Molmo-7B

Чатбот для работы с изображениями с помощью MolmoE-1B

Визуальная модель языка - Molmo

ColPali - это новый подход к мультимодальному поиску документов, который призван заменить существующие ретриверы документов, часто опирающиеся на шаг OCR, сквозным мультимодальным подходом.

Molmo :Открытые веса и открытые данные
для современных мультимодальных моделей

Molmo - это новая мультимодальная модель ИИ с открытым исходным кодом, разработанная Институтом искусственного интеллекта Аллена (Ai2). Анонсированная 25 сентября 2024 года, она призвана обеспечить высокую производительность при сохранении значительно меньшего размера модели по сравнению с другими ведущими системами ИИ, такими как GPT-4o от OpenAI и Gemini 1.5 Pro от Google. Существует три версии модели ИИ Molmo:

  • MolmoE-1B: Модель смеси экспертов с 1 миллиардом активных параметров.
  • Molmo-7B-O: Самая доступная версия с 7 миллиардами параметров.
  • Molmo-72B: Самая высокопроизводительная версия с 72 миллиардами параметров

MolmoE-1B: Модель смеси экспертов с 1 миллиардом активных параметров.

Molmo-7B-O: Самая доступная версия с 7 миллиардами параметров.

Molmo-72B: Самая высокопроизводительная версия с 72 миллиардами параметров

Сравнение открытости VLM ИИ Molmo превосходит GPT-4o, Gemini 1.5 Pro и Claude 3.5

Мы характеризуем открытость ВЛМ по двум признакам (открытые веса, открытые данные и
код) для трех компонентов модели (VLM и двух его предварительно обученных компонентов, основы LLM и кодировщика зрения). Помимо открытых и закрытых данных, мы используем метку "дистиллированный" для обозначения того, что данные, использованные для обучения VLM, включают изображения и текст, сгенерированные другим, собственным VLM, что означает, что модель не может быть воспроизведена без зависимости от собственного VLM.

Что люди говорят о PixelDance в социальных сетях

Часто задаваемые вопросы о компании Molmo

Molmo - это мультимодальная модель искусственного интеллекта с открытым исходным кодом, разработанная Институтом искусственного интеллекта Аллена (Ai2), которая превосходит Ллама 3.2 и доступна под лицензией Apache 2.0.

Molmo превосходит Ллама 3.2 и отличается большей эффективностью и более простой архитектурой, которая, предположительно, совместима с флэш-вниманием.

Все модели Molmo выпускаются под лицензией Apache 2.0 и доступны на сайте Hugging Face.

Molmo выпускается в четырех основных вариантах: MolmoE-1B (модель смеси экспертов), Molmo-7B-O, Molmo-7B-D и Molmo-72B. Версия 72B основана на Qwen2-72B и использует OpenAI CLIP в качестве основы зрения.

Компания Molmo уделяет особое внимание качеству данных, а не их количеству, используя речевые описания изображений для высококачественных обучающих данных из набора данных PixMo.

Molmo может понимать пользовательские интерфейсы и указывать на то, что видит. Он отлично справляется с одновременной обработкой текста и изображений, позволяя пользователям задавать вопросы по изображениям для решения таких задач, как идентификация объектов или подсчет предметов в сцене.

Molmo был оценен на 11 академических эталонах и 325 231 парном сравнении с человеком, что продемонстрировало его производительность и предпочтения пользователей.

Да, вы можете испытать веселые и мощные модели, такие как: Диффузоры Image Outpaint , Ллама3.2 , Qwen2.5

Опыт Лучшая модель искусственного интеллекта бесплатно онлайн в 8PixLabs

Больше сообщений о моделях искусственного интеллекта за последнее время