Molmo AI: SOTA Multimodal Open Language AI Model 

Molmo Family otevřených modelů vizuálního jazyka vyvinutých Allen Institute for AI. OpenSource

MolmoAI je založen na Qwen2

Molmo AI Bez přihlášení online

Pokud jste narazili na chybu, vyberte prosím jinou

Obrázek Chatbot s Molmo-7B

Image Chatbot s MolmoE-1B

Vizuální jazykový model – Molmo

ColPali dolaďovací generátor dotazů ColPali je velmi vzrušující nový přístup k multimodálnímu vyhledávání dokumentů, jehož cílem je nahradit stávající nástroje pro vyhledávání dokumentů, které často spoléhají na OCR krok, komplexním multimodálním přístupem.

Molmo: Otevřené váhy a otevřená data
pro nejmodernější multimodální modely

Molmo je nově vydaný open-source multimodální model umělé inteligence vyvinutý Allen Institute for Artificial Intelligence (Ai2). Ohlášena 25. září 2024 a jejím cílem je poskytovat vysoce výkonné funkce při zachování výrazně menší velikosti modelu ve srovnání s jinými předními systémy umělé inteligence, jako je GPT-4o od OpenAI a Gemini 1.5 Pro od Googlu. existují tři verze modelu Molmo ai:

  • MolmoE-1B: Model směsi expertů s 1 miliardou aktivních parametrů.
  • Molmo-7B-O: Nejdostupnější verze se 7 miliardami parametrů.
  • Molmo-72B: Nejvýkonnější verze se 72 miliardami parametrů

MolmoE-1B: Model směsi expertů s 1 miliardou aktivních parametrů.

Molmo-7B-O: Nejdostupnější verze se 7 miliardami parametrů.

Molmo-72B: Nejvýkonnější verze se 72 miliardami parametrů

Porovnání otevřenosti VLM Molmo AI překonává GPT-4o, Gemini 1.5 Pro a Claude 3.5

Otevřenost VLM charakterizujeme na základě dvou atributů (otevřené váhy, otevřená data a
kód) ve třech modelových komponentách (VLM a jeho dvě předem připravené komponenty, páteř LLM a kodér vidění). Kromě otevřeného vs.

Co lidé mluví o PixelDance na sociálních sítích

Často kladené otázky o Molmo

Molmo je open-source multimodální model umělé inteligence vyvinutý Allen Institute for Artificial Intelligence (Ai2), který překonává Lama 3.2 a je k dispozici pod licencí Apache 2.0.

Molmo překonává Lama 3.2 a je navržen tak, aby byl efektivnější s jednodušší architekturou, která je pravděpodobně kompatibilní s pozorností flash.

Všechny modely Molmo jsou vydány pod licencí Apache 2.0 a jsou dostupné na Hugging Face.

Molmo se dodává ve čtyřech hlavních variantách: MolmoE-1B (směs expertního modelu), Molmo-7B-O, Molmo-7B-D a Molmo-72B. Verze 72B je založena na Qwen2-72B a používá OpenAI CLIP jako páteř vidění.

Molmo se zaměřuje spíše na kvalitu dat než na kvantitu a používá popisy obrázků založené na řeči pro vysoce kvalitní trénovací data z datové sady PixMo.

Molmo dokáže porozumět uživatelskému rozhraní a ukázat na to, co vidí. Vyniká v současném zpracování textu i obrázků a umožňuje uživatelům klást otázky týkající se obrázků pro úkoly, jako je identifikace objektů nebo počítání položek ve scéně.

Molmo byl hodnocen na 11 akademických benchmarkech a prostřednictvím 325 231 lidských párových porovnání, což prokázalo jeho výkon a uživatelské preference.

Ano, můžete zažít zábavné a výkonné modely jako: Výkres obrazu difuzory , Lama3.2 , Qwen2.5

Zažijte nejlepší model umělé inteligence online zdarma 8PixLabs

více AI Model Post Nedávno