मोल्मो एआई: एसओटीए मल्टीमॉडल ओपन लैंग्वेज एआई मॉडल

मोल्मो एलन इंस्टीट्यूट फॉर एआई द्वारा विकसित ओपन विज़न-लैंग्वेज मॉडल का परिवार। ओपन सोर्स

मोल्मोएआई किस पर आधारित है? क्वेन2

मोल्मो एआई निःशुल्क नोलॉगिन ऑनलाइन

यदि आपको कोई त्रुटि आई है, तो कृपया कोई अन्य चुनें

छवि चैटबॉट
छवि चैटबॉट
दृश्य भाषा मॉडल
दस्तावेज़ पुनर्प्राप्ति

मोल्मो-7बी के साथ इमेज चैटबॉट

MolmoE-1B के साथ इमेज चैटबॉट

दृश्य भाषा मॉडल – मोल्मो

ColPali फाइन-ट्यूनिंग क्वेरी जेनरेटर ColPali मल्टीमॉडल दस्तावेज़ पुनर्प्राप्ति के लिए एक बहुत ही रोमांचक नया दृष्टिकोण है जिसका उद्देश्य मौजूदा दस्तावेज़ पुनर्प्राप्तिकर्ताओं को प्रतिस्थापित करना है जो अक्सर एंड-टू-एंड मल्टीमॉडल दृष्टिकोण के साथ OCR चरण पर निर्भर करते हैं।

मोल्मो : खुला वजन और खुला डेटा
अत्याधुनिक मल्टीमॉडल मॉडल के लिए

मोल्मो एक नया रिलीज़ किया गया ओपन-सोर्स मल्टीमॉडल AI मॉडल है जिसे एलन इंस्टीट्यूट फॉर आर्टिफिशियल इंटेलिजेंस (Ai2) द्वारा विकसित किया गया है। 25 सितंबर, 2024 को घोषित, इसका उद्देश्य अन्य प्रमुख AI सिस्टम, जैसे कि OpenAI के GPT-4o और Google के Gemini 1.5 Pro की तुलना में काफी छोटे मॉडल आकार को बनाए रखते हुए उच्च-प्रदर्शन क्षमताएँ प्रदान करना है। मोल्मो AI मॉडल के तीन संस्करण हैं:

मोल्मोई-1बी: 1 अरब सक्रिय मापदंडों के साथ विशेषज्ञ मॉडल का मिश्रण।
मोल्मो-7बी-ओ: 7 अरब मापदंडों के साथ सबसे सुलभ संस्करण.
मोल्मो-72बी: 72 बिलियन पैरामीटर्स के साथ शीर्ष प्रदर्शन करने वाला संस्करण

मोल्मोई-1बी: 1 अरब सक्रिय मापदंडों के साथ विशेषज्ञ मॉडल का मिश्रण।

मोल्मो-7बी-ओ: 7 अरब मापदंडों के साथ सबसे सुलभ संस्करण.

मोल्मो-72बी: 72 बिलियन पैरामीटर्स के साथ शीर्ष प्रदर्शन करने वाला संस्करण

वीएलएम ओपननेस तुलना मोल्मो एआई जीपीटी-4o, जेमिनी 1.5 प्रो और क्लाउड 3.5 से बेहतर प्रदर्शन कर रहा है

हम दो विशेषताओं (खुले भार, खुला डेटा और) के आधार पर वीएलएम की खुलेपन की विशेषता बताते हैं
तीन मॉडल घटकों (वीएलएम और इसके दो पूर्व-प्रशिक्षित घटक, एलएलएम बैकबोन और विज़न एनकोडर) में कोड) को शामिल किया गया है। खुले बनाम बंद के अलावा, हम यह इंगित करने के लिए "डिस्टिल्ड" लेबल का उपयोग करते हैं कि वीएलएम को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा में एक अलग, मालिकाना वीएलएम द्वारा उत्पन्न छवियां और पाठ शामिल हैं, जिसका अर्थ है कि मॉडल को मालिकाना वीएलएम पर निर्भरता के बिना पुन: प्रस्तुत नहीं किया जा सकता है।

सोशल मीडिया में लोग पिक्सेलडांस के बारे में क्या चर्चा कर रहे हैं

मोल्मो द्वारा @allen_ai – ओपन सोर्स SoTA मल्टीमॉडल (विज़न) लैंग्वेज मॉडल, क्लाउड 3.5 सॉनेट, GPT4V को पछाड़ता हुआ और GPT4o के बराबर 🔥

उन्होंने चार मॉडल चेकप्वाइंट जारी किये:

1. मोल्मोई-1बी, 1बी (सक्रिय) 7बी (कुल) के साथ विशेषज्ञों के मॉडल का मिश्रण
2. मोल्मो-7बी-ओ, सबसे खुला 7बी मॉडल
3.… pic.twitter.com/9hpARh0GYT
- वैभव (वीबी) श्रीवास्तव (@reach_vb) 25 सितंबर, 2024

मिलिए MOLMO से 🔥🔥

अत्याधुनिक मल्टीमॉडल एआई जो ओपन-सोर्स, शक्तिशाली और सभी के लिए निःशुल्क है।

वस्तुओं का पता लगाने के लिए मोल्मो मॉडल का उपयोग करने वाले रोबोट का यह अद्भुत डेमो देखें।

वेबसाइट पर इमेज टू टेक्स्ट और टेक्स्ट टू इमेज वाले मॉडल को आज़माने के लिए उनके पास एक निःशुल्क होस्टेड वर्शन है। मैं… pic.twitter.com/Qx7hp1rtcb
— प्रशांत (@Prashant_1722) 27 सितंबर, 2024

कल @allen_ai माल्मो जारी किया - खुले अत्याधुनिक मल्टीमॉडल एआई मॉडलों का एक परिवार

पॉइंटिंग छवि पिक्सेल पर आधारित एक प्राकृतिक व्याख्या प्रदान करता है

जब आप माल्मो से वस्तुओं का पता लगाने या गिनने के लिए कहेंगे, तो यह पता लगाई गई वस्तुओं को बिंदुओं से चिह्नित करेगा

जोड़ना: https://t.co/LsUsZ2ghNT pic.twitter.com/d3ETnAS670
— स्काल्स्कीपी (@skalskip92) 26 सितंबर, 2024

मोल्मो द्वारा @allen_ai – एक SOTA मल्टीमॉडल मॉडल

🤗खुले मॉडल और आंशिक रूप से खुला डेटा
🤏7B और 72B मॉडल आकार (+7B MoE 1B सक्रिय पैरामीटर के साथ)
🤯GPT-4V, फ्लैश, आदि से ऊपर के बेंचमार्क
🗣️72B की मानवीय प्राथमिकता शीर्ष API मॉडल के बराबर
🧠PixMo, कैप्शनिंग के लिए एक उच्च गुणवत्ता वाला डेटासेट… pic.twitter.com/faqvCkAmsb
- उमर संसेविएरो (@osanseviero) 25 सितंबर, 2024

कोशिश करें @allen_aiअब ओपन ग्रिड पर मोल्मो वीएलएम! मोल्मो जैसे वीएलएम रोबोट को अर्थ संबंधी ज्ञान की एक समृद्ध परत प्रदान करते हैं - जिससे वे उपयोगकर्ता के प्रश्नों का उत्तर दे सकते हैं और जटिल वातावरण को आसानी से समझ सकते हैं। आज ही ग्रिड पर अत्याधुनिक एआई मॉडल के साथ स्वायत्त एआई समाधानों को स्केल करें! https://t.co/q9szAT1PiG pic.twitter.com/XuyYpMhQ8D
— स्केल्ड फाउंडेशन्स (@ScaFoAI) 27 सितंबर, 2024

लामा 3.2 कल का सबसे दिलचस्प मल्टीमॉडल रिलीज़ नहीं हो सकता था। 🤔 मोल्मो से @allen_ai लामा 3.2 से बेहतर प्रदर्शन करता है, अपाचे 2.0 के तहत और यूरोपीय संघ में उपलब्ध है, अपना डेटा जारी करेगा, कस्टम ईएलओ इवैल्यूएशन बनाएगा, और एमएलएएमए 3.2 की तुलना में सरल आर्किटेक्चर होगा जो संभवतः… pic.twitter.com/du63zXjQcN
- फिलिप श्मिड (@_philschmid) 26 सितंबर, 2024

मोल्मो के बारे में अक्सर पूछे जाने वाले प्रश्न

मोल्मो एक ओपन-सोर्स मल्टीमॉडल एआई मॉडल है जिसे एलन इंस्टीट्यूट फॉर आर्टिफिशियल इंटेलिजेंस (Ai2) द्वारा विकसित किया गया है जो बेहतर प्रदर्शन करता है लामा 3.2 और यह अपाचे 2.0 लाइसेंस के अंतर्गत उपलब्ध है।

मोल्मो ने बेहतर प्रदर्शन किया लामा 3.2 और इसे सरल आर्किटेक्चर के साथ अधिक कुशल बनाने के लिए डिज़ाइन किया गया है जो संभवतः फ्लैश अटेंशन के साथ संगत है।

सभी मोल्मो मॉडल अपाचे 2.0 लाइसेंस के तहत जारी किए गए हैं और हगिंग फेस पर उपलब्ध हैं।

मोल्मो चार मुख्य प्रकारों में आता है: मोल्मोई-1बी (विशेषज्ञ मॉडल का मिश्रण), मोल्मो-7बी-ओ, मोल्मो-7बी-डी, और मोल्मो-72बी। 72बी संस्करण क्वेन2-72बी पर आधारित है और ओपनएआई क्लिप को अपने विज़न बैकबोन के रूप में उपयोग करता है।

मोल्मो, डेटा की मात्रा के बजाय गुणवत्ता पर ध्यान केंद्रित करता है, तथा पिक्समो डेटासेट से उच्च गुणवत्ता वाले प्रशिक्षण डेटा के लिए वाक्-आधारित छवि विवरण का उपयोग करता है।

मोल्मो यूजर इंटरफेस को समझ सकता है और जो देखता है उस पर इशारा कर सकता है। यह टेक्स्ट और इमेज दोनों को एक साथ प्रोसेस करने में माहिर है, जिससे यूजर ऑब्जेक्ट की पहचान या किसी सीन में आइटम गिनने जैसे कामों के लिए इमेज के बारे में सवाल पूछ सकते हैं।

मोल्मो का मूल्यांकन 11 शैक्षणिक मानदंडों और 325,231 मानव युग्म तुलनाओं के माध्यम से किया गया, जिससे इसके प्रदर्शन और उपयोगकर्ता वरीयता का प्रदर्शन हुआ।

हां, आप मजेदार और शक्तिशाली मॉडल का अनुभव कर सकते हैं जैसे: डिफ्यूज़र छवि आउटपेंट , लामा3.2 , क्वेन2.5

सर्वश्रेष्ठ AI मॉडल का निःशुल्क ऑनलाइन अनुभव लें 8पिक्सलैब्स

हाल ही में अधिक AI मॉडल पोस्ट