ما هو نموذج LLM?
التعريف والنظرة العامة
نموذج الذكاء الاصطناعي هو برنامج تم تدريبه على مجموعة من البيانات للتعرف على أنماط معينة أو اتخاذ قرارات معينة دون تدخل بشري آخر.
النماذج اللغوية الكبيرة، والمعروفة أيضًا باسم الماجستير في القانونهي نماذج تعلم عميق كبيرة جداً تم تدريبها مسبقاً على كميات هائلة من البيانات.
المحول الأساسي هو عبارة عن مجموعة من الشبكات العصبية التي تتكون من مشفر وفك تشفير مع قدرات انتباه ذاتية. تقوم أداة التشفير وفك التشفير باستخراج المعاني من تسلسل النص وفهم العلاقات بين الكلمات والعبارات فيه.
ما هو النموذج الأفضل بالنسبة لك؟
تتطور نماذج الذكاء الاصطناعي الكبيرة بسرعة كبيرة. تقدم الشركات والمؤسسات البحثية المختلفة إنجازات بحثية جديدة يومياً، إلى جانب نماذج لغوية كبيرة جديدة.
لذلك، لا يمكننا أن نخبرك بشكل قاطع أيهما أفضل.
ومع ذلك، هناك شركات ونماذج من الدرجة الأولى، مثل OpenAI. توجد الآن مجموعة من المعايير وأسئلة الاختبار لتقييم النماذج.
يمكنك الرجوع إلى سوبر كلواي لعرض نتائج النموذج في المهام المختلفة واختيار ما يناسبك منها. كما يمكنك متابعة آخر الأخبار لمعرفة المزيد عن قدرة نموذج LLM.
هونيوان-لارج من تينسنت
مقدمة النموذج
في 5 نوفمبر تينسنت يطلق نموذج لغة هونيوان الكبير مفتوح المصدر للغة هونيوان-الكبير بإجمالي 398 مليار معلمة، مما يجعله الأكبر في الصناعة، مع 52 مليار معلمة تفعيل.
تُظهر نتائج التقييم العام أن نموذج هونيوان الكبير الخاص بشركة تينسنت يتصدر بشكل شامل في مختلف المشاريع.
المزايا التقنية
- بيانات تركيبية عالية الجودة: من خلال تعزيز التدريب بالبيانات التركيبية, هونيوان-كبير تعلم تمثيلات أكثر ثراءً، والتعامل مع المدخلات ذات السياق الطويل، والتعميم بشكل أفضل على البيانات غير المرئية.
- ضغط ذاكرة التخزين المؤقت KV: يستخدم استراتيجيات الانتباه إلى الاستعلامات المجمعة (GQA) والانتباه عبر الطبقات (CLA) لتقليل استخدام الذاكرة والنفقات الحسابية الزائدة في ذاكرات التخزين المؤقت KV بشكل كبير، مما يحسن إنتاجية الاستدلال.
- تحجيم معدل التعلم الخاص بالخبراء: تعيين معدلات تعلم مختلفة لخبراء مختلفين لضمان أن يتعلم كل نموذج فرعي بفعالية من البيانات ويساهم في الأداء الكلي.
- إمكانية معالجة السياق الطويل: يدعم النموذج المُدرَّب مسبقًا تسلسلات نصية تصل إلى 256 كيلو، ويدعم نموذج Instruct ما يصل إلى 128 كيلو، مما يعزز بشكل كبير القدرة على التعامل مع المهام ذات السياق الطويل.
- المقارنة المعيارية الشاملة: إجراء تجارب واسعة النطاق عبر مختلف اللغات والمهام للتحقق من الفعالية العملية وسلامة نظام هونيوان-لارج.
إطار الاستدلال وإطار التدريب
يقدم هذا الإصدار مفتوح المصدر خيارين للواجهة الخلفية الاستدلالية مصممين خصيصًا لـ طراز هونيوان-كبير:: الشعبية واجهة خلفية vLLM و TensorRT-LLM الواجهة الخلفية. يتضمن كلا الحلين تحسينات لتحسين الأداء.
يتوافق نموذج هونيوان-لارج المفتوح المصدر بشكل كامل مع تنسيق عناق الوجه، مما يتيح للباحثين والمطورين إجراء ضبط دقيق للنموذج باستخدام إطار عمل hf-deepspeed. بالإضافة إلى ذلك، نحن ندعم تسريع التدريب من خلال استخدام الانتباه السريع.
كيفية زيادة استخدام هذا النموذج
هذا نموذج مفتوح المصدر. يمكنك العثور على "tencent-hunyuan" على جيثبحيث يقدمون إرشادات مفصلة وأدلة استخدام. يمكنك مواصلة استكشافها والبحث فيها لخلق المزيد من الاحتمالات.
طلقة القمر(كيمي) بواسطة Moonshot AI
مقدمة موجزة
Moonshot هو نموذج لغوي واسع النطاق طورته شركة Dark Side of the Moon. فيما يلي نظرة عامة على ميزاته:
- طفرة تكنولوجية: حققت شركة Moonshot تقدماً ملحوظاً في معالجة النصوص الطويلة، حيث يدعم منتجها المساعد الذكي "كيميشات" ما يصل إلى مليوني حرف صيني في إدخال السياق بدون فقدان.
- الهندسة المعمارية النموذجية: من خلال استخدام بنية شبكة مبتكرة وتحسينات هندسية مبتكرة، فإنها تحقق اهتمامًا بعيد المدى دون الاعتماد على حلول "مختصرة" مثل النوافذ المنزلقة أو تقليل العينات أو النماذج الأصغر التي غالبًا ما تقلل من الأداء. يتيح ذلك فهمًا شاملاً للنصوص الطويلة جدًا حتى مع وجود مئات المليارات من المعلمات.
- التطبيق الموجه نحو التطبيق: تهدف Moonshot، التي تم تطويرها مع التركيز على التطبيق العملي، إلى أن تصبح أداة يومية لا غنى عنها للمستخدمين، وتتطور بناءً على ملاحظات المستخدمين الحقيقية لتوليد قيمة ملموسة.
الميزات الرئيسية
- القدرة على معالجة النصوص الطويلة: قادر على التعامل مع النصوص الشاملة مثل الروايات أو التقارير المالية الكاملة، مما يوفر للمستخدمين رؤى متعمقة وشاملة وملخصات للوثائق الطويلة.
- الاندماج متعدد الوسائط: دمج طرائق متعددة، والجمع بين النص وبيانات الصور لتعزيز قدرات التحليل والتوليد.
- قدرة عالية على فهم اللغة وتوليدها: إظهار أداء ممتاز متعدد اللغات، وتفسير مدخلات المستخدم بدقة وتوليد استجابات عالية الجودة ومتماسكة ومناسبة من الناحية الدلالية.
- قابلية التوسع المرنة: يوفر قابلية توسع قوية، مما يسمح بالتخصيص والتحسين بناءً على سيناريوهات واحتياجات التطبيقات المختلفة، مما يوفر للمطورين والمؤسسات مرونة واستقلالية كبيرة.
طرق الاستخدام
- تكامل واجهة برمجة التطبيقات (API): يمكن للمستخدمين التسجيل للحصول على حساب على المنصة الرسمية للجانب المظلم من القمر، والتقدم بطلب للحصول على مفتاح واجهة برمجة التطبيقات، ثم دمج إمكانيات Moonshot في تطبيقاتهم باستخدام واجهة برمجة التطبيقات مع لغات البرمجة المتوافقة.
- استخدام المنتجات والأدوات الرسمية: الاستخدام المباشر لمنتج "كيميشات"، وهو منتج المساعد الذكي القائم على نموذج "مون شوت"، أو الاستفادة من الأدوات والمنصات المرتبطة به التي يقدمها الجانب المظلم من القمر.
- التكامل مع الأطر والأدوات الأخرى: يمكن دمج Moonshot مع أطر عمل تطوير الذكاء الاصطناعي الشائعة مثل LangChain لبناء تطبيقات نماذج لغوية أكثر قوة.
GLM-4-Plus من zhipu.ai
مقدمة موجزة
إن GLM-4-Plus، الذي طورته شركة Zhipu AI، هو أحدث تكرار لنموذج أساس GLM المطور ذاتيًا بالكامل، مع تحسينات كبيرة في فهم اللغة واتباع التعليمات ومعالجة النصوص الطويلة.
الميزات والمزايا الرئيسية
- الفهم اللغوي القوي: تتفوق GLM-4-Plus، المُدرّبة على مجموعات بيانات واسعة النطاق وخوارزميات مُحسّنة، في التعامل مع الدلالات المعقدة، وتفسير معنى وسياق النصوص المختلفة بدقة.
- معالجة النصوص الطويلة المتميزة: بفضل آلية الذاكرة المبتكرة وتقنية المعالجة المجزأة، يمكن لـ GLM-4-Plus التعامل بفعالية مع النصوص الطويلة التي تصل إلى 128 ألف رمز، مما يجعله على درجة عالية من الكفاءة في معالجة البيانات واستخراج المعلومات.
- قدرات الاستدلال المعززة: يدمج سياسة التحسين الأمثل للسياسة المتقاربة (PPO) للحفاظ على الاستقرار والكفاءة أثناء استكشاف الحلول المثلى، مما يحسن أداء النموذج بشكل كبير في مهام التفكير المعقدة مثل الرياضيات والبرمجة.
- دقة عالية في متابعة التعليمات: يفهم بدقة تعليمات المستخدم ويلتزم بها، ويقوم بتوليد نص عالي الجودة ومتوافق مع التوقعات بناءً على متطلبات المستخدم.
تعليمات الاستخدام
- تسجيل حساب والحصول على مفتاح API: أولاً، قم بتسجيل حساب على الموقع الرسمي لـ Zhipu واحصل على مفتاح واجهة برمجة التطبيقات.
- مراجعة الوثائق الرسمية: راجع الوثائق الرسمية لسلسلة GLM-4 للاطلاع على المعلمات التفصيلية وتعليمات الاستخدام.
SenseChat 5.5 من SenceTime
مقدمة موجزة
إن SenseChat 5.5، الذي طورته شركة SenseTime، هو الإصدار 5.5 من نموذجها اللغوي الكبير، الذي يعتمد على InternLM-123b، وهو أحد أقدم النماذج اللغوية الكبيرة في الصين المبني على تريليونات من المعلمات ويتم تحديثه باستمرار.
الميزات والمزايا الرئيسية
- أداء شامل وقوي: يُصنف باستمرار ضمن المستوى الأول في مجموعة متنوعة من مهام التقييم، ويتفوق في الكفاءات الأساسية في العلوم الإنسانية والعلوم بالإضافة إلى المهام "الصعبة" المتقدمة. يُظهر أداءً متفوقًا في فهم اللغة والأمان في العلوم الإنسانية، ويتفوق في المنطق والترميز في العلوم.
- تطبيقات الحافة الفعالة: أصدرت شركة SenseTime إصدار SenseChat Lite-5.5، الذي يقلل من وقت التحميل الأولي إلى 0.19 ثانية فقط، وهو ما يمثل تحسنًا بمقدار 401 تيرابايت في الثانية مقارنةً بالإصدار SenseChat Lite-5.0 الذي تم إصداره في أبريل، مع سرعة استدلال تصل إلى 90.2 حرفًا في الثانية وتكلفة سنوية لكل جهاز تصل إلى 9.9 يوان.
- قدرات لغوية استثنائية: باعتباره تطبيقًا للغة الطبيعية، فهو يتعامل بفعالية مع بيانات نصية واسعة النطاق، ويُظهر حوارًا قويًا باللغة الطبيعية، وقدرات منطقية على التفكير المنطقي، ومعرفة واسعة، وتحديثات متكررة. وهو يدعم اللغة الصينية المبسطة والصينية التقليدية والإنجليزية ولغات البرمجة الشائعة.
منتجات الاستخدام والتطبيق
- الاستخدام المباشر: يمكن للمستخدمين التسجيل على [موقع SenseTime] للوصول إلى SenseChat من خلال الويب أو تطبيق الهاتف المحمول والتفاعل مع النموذج.
- تكامل واجهة برمجة التطبيقات (API): يوفر SenseTime إمكانية الوصول إلى واجهة برمجة التطبيقات (API) للشركات والمطورين، مما يتيح لهم دمج SenseChat 5.5 في منتجاتهم أو تطبيقاتهم.
Qwen2.5-72B-تعليمات فريق Qwen، علي بابا كلاود
التعريف بالنموذج الاستقرائي
Qwen2.5 هي أحدث سلسلة من نماذج Qwen اللغوية الكبيرة. لـ كوين2.5، أصدر الفريق عددًا من النماذج اللغوية الأساسية والنماذج اللغوية المضبوطة بالتعليمات التي تتراوح بين 0.5 إلى 72 مليار معلمة.
الميزات الرئيسية
- نماذج لغوية كثيفة وسهلة الاستخدام وفك الترميز فقط، متوفرة في 0.5B, 1.5B, 3B, 7B, 14B, 32Bو 72B الأحجام، والمتغيرات الأساسية والتعليمات.
- تم التدريب المسبق على أحدث مجموعة بيانات واسعة النطاق لدينا، والتي تشمل ما يصل إلى 18T الرموز المميزة.
- تحسينات كبيرة في اتباع التعليمات، وإنشاء نصوص طويلة (أكثر من 8 آلاف رمز)، وفهم البيانات المهيكلة (مثل الجداول)، وإنشاء مخرجات مهيكلة، خاصةً JSON.
- أكثر مرونة مع تنوع مطالبات النظام، مما يعزز تنفيذ لعب الأدوار وتهيئة الظروف لروبوتات الدردشة الآلية.
- يدعم طول السياق ما يصل إلى 128K الرموز ويمكنها توليد ما يصل إلى 8K الرموز المميزة.
- دعم متعدد اللغات لأكثر من 29 لغات، بما في ذلك الصينية والإنجليزية والفرنسية والفرنسية والإسبانية والبرتغالية والألمانية والإيطالية والروسية والروسية واليابانية والكورية والفيتنامية والتايلاندية والعربية وغيرها.
كيف تبدأ بسرعة؟
يمكنك العثور على دروس تعليمية لاستخدام النماذج الكبيرة على Github و Hugging face. بناءً على هذه الدروس، يمكنك تشغيل النموذج بفعالية وتحقيق وظائفك وأفكارك.
دوباو-برو من فريق دوباو، بايت دانس
مقدمة موجزة
دوباو برو هو نموذج لغوي كبير تم تطويره بشكل مستقل من قبل ByteDance، وتم إصداره رسميًا في 15 مايو 2024. في منصة تقييم Flageval للنماذج الكبيرة، احتل نموذج Doubao-pro المرتبة الثانية بين النماذج المغلقة المصدر بدرجة 75.96.
- الإصدارات: يتضمن Doubao-pro إصدارات ذات نوافذ سياق 4k و 32k و 128k، كل منها يدعم أطوال سياقات مختلفة للاستدلال والضبط الدقيق.
- تحسين الأداء: وفقًا للاختبار الداخلي لشركة ByteDance، حققت Doubao-pro-4k درجة إجمالية قدرها 76.8 عبر 11 معيارًا عامًا متوافقًا مع معايير الصناعة.
الميزات والمزايا الرئيسية
- قدرات شاملة قوية: يتفوق دوباو برو في الرياضيات وتطبيق المعرفة وحل المشكلات عبر التقييمات الموضوعية والذاتية.
- مجموعة واسعة من التطبيقات: يحتل مساعد دوباو للذكاء الاصطناعي "دوباو" المرتبة الأولى في التنزيلات بين تطبيقات شركة AIGC على متجر تطبيقات أبل وأسواق تطبيقات أندرويد الرئيسية.
- فعالية التكلفة العالية: تبلغ تكلفة مدخلات الاستدلال في Doubao-pro-32k 0.0008 يوان فقط لكل ألف رمز. على سبيل المثال، معالجة النسخة الصينية من هاري بوتر (2.74 مليون حرف) تكلف 1.5 يوان فقط.
- فهم اللغة المتميزة وتوليدها: يستوعب برنامج Doubao-pro مدخلات اللغة الطبيعية المتنوعة بدقة ويولد استجابات عالية الجودة ومتماسكة ومنطقية، ويلبي احتياجات المستخدم في الأسئلة والأجوبة البسيطة وإنشاء النصوص المعقدة والتفسيرات في المجالات المتخصصة.
- سرعة الاستدلال الفعالة: مع التدريب المكثف على البيانات وتحسينها، يوفر Doubao-pro ميزة سرعة الاستدلال، مما يسمح بأوقات استجابة سريعة وتجربة مستخدم محسنة، خاصة عند التعامل مع كميات كبيرة من النصوص أو المهام المعقدة.
طرق الاستخدام
- من خلال محرك البركان: استخدم دوباو برو عن طريق استدعاء واجهة برمجة التطبيقات الخاصة بالنموذج، مع توفر نماذج شفرات برمجية في الوثائق الرسمية لمحرك البركان.
- لمنتجات محددة: يتوفر Doubao-pro لسوق المؤسسات من خلال محرك Volcano Engine، مما يسمح للشركات بدمجه في منتجاتها أو خدماتها. يمكنك أيضًا تجربة نموذج دوباو من خلال تطبيق دوباو.
360 جي بي تي 2 برو من 360
مقدمة موجزة
- اسم الموديل: 360GPT2-Pro هو جزء من سلسلة طراز 360 Zhibrain الكبيرة التي طورتها 360.
- الأساس التقني: بالاستفادة من 20 عاماً من البيانات الأمنية، و10 سنوات من الخبرة في مجال الذكاء الاصطناعي، وخبرة 80 خبيراً في مجال الذكاء الاصطناعي و100 خبير أمني، استخدم 360 360 5,000 وحدة معالجة رسومات على مدار 200 يوم لتدريب نموذج Zhibrain وتحسينه، حيث يعد 360GPT2-Pro أحد إصداراته المتقدمة.
الميزات والمزايا الرئيسية
- توليد لغة قوية: يتفوق في مهام توليد اللغة، خاصة في العلوم الإنسانية، من خلال إنشاء محتوى عالي الجودة ومبدع ومتماسك منطقيًا، مثل القصص وكتابة النصوص.
- الفهم والتطبيق المعرفي القوي للمعرفة: مجهزة بقاعدة معرفية واسعة، فهي تفسر المعلومات وتطبقها بدقة للإجابة عن الأسئلة وحل المشاكل بفعالية.
- التوليد المحسّن القائم على الاسترجاع: الكفاءة في التوليد المعزز للاسترجاع، خاصةً بالنسبة للغة الصينية، مما يمكّن النموذج من توليد استجابات تتماشى مع احتياجات المستخدم وبيانات العالم الحقيقي، مما يقلل من احتمالية الهلوسة.
- ميزات الأمان المحسّنة: بالاستفادة من خبرة 360GPT2-Pro العريقة في مجال الأمن، يوفر 360GPT2-Pro مستوى من الأمان والموثوقية، ويعالج مختلف المخاطر الأمنية بفعالية.
طرق الاستخدام والمنتجات ذات الصلة
- بحث 360AI: يدمج 360GPT2-Pro مع وظيفة البحث لتزويد المستخدمين بتجربة بحث أكثر شمولاً وعمقاً.
- متصفح 360AI: يدمج 360GPT2-Pro في متصفح 360AI، مما يسمح للمستخدمين بالتفاعل مع النموذج عبر واجهات محددة أو من خلال الإدخال الصوتي للحصول على المعلومات والاقتراحات.
خطوة-2-16 ألف من ستيب فن
مقدمة موجزة
- المطور: أصدرت ستيب ستار النسخة الرسمية من نموذج اللغة STEP-2 تريليون معيار لغة STEP-2 في عام 2024، حيث تشير الخطوة 2-16k إلى متغيرها الذي يدعم نافذة سياق 16k.
- الهندسة المعمارية النموذجية: مبنية على بنية MoE (مزيج من الخبراء) المبتكرة، والتي تنشط ديناميكيًا نماذج خبراء مختلفة بناءً على المهام وتوزيع البيانات، مما يعزز الأداء والكفاءة على حد سواء.
- مقياس المعلمات: من خلال تريليون معلمة، يلتقط النموذج معرفة لغوية واسعة ومعلومات دلالية، ويعرض قدرات قوية في مختلف مهام معالجة اللغة الطبيعية.
الميزات والمزايا الرئيسية
- قوة فهم اللغة وتوليدها: يفسر النص المدخل بدقة ويولد استجابات طبيعية عالية الجودة، ويدعم مهام مثل الإجابة عن الأسئلة، وتوليد المحتوى، والتبادل التحادثي بدقة وقيمة.
- التغطية المعرفية متعددة المجالات: يشمل النموذج، الذي تم تدريبه على مجموعات بيانات ضخمة، معرفة واسعة في مجالات مثل الرياضيات والمنطق والبرمجة والمعرفة والكتابة الإبداعية، مما يجعله متعدد الاستخدامات للاستجابات والتطبيقات متعددة المجالات.
- إمكانية معالجة التسلسل الطويل: يتفوق النموذج في التعامل مع التسلسلات النصية الطويلة، مما يسهل فهم ومعالجة المقالات المطولة والمستندات المعقدة.
- أداء قريب من GPT-4: يُظهر هذا النموذج، الذي يحقق أداءً قريبًا من مستوى GPT-4 في مهام لغوية متعددة، قدرات معالجة لغوية شاملة عالية المستوى.
الاستخدام والتطبيقات
توفر منصة StepStar منصة مفتوحة للمؤسسات والمطورين للتقدم بطلب للوصول إلى نموذج خطوة-2-16 ألف.
يمكن للمستخدمين دمج النموذج في التطبيقات أو مشاريع التطوير من خلال مكالمات واجهة برمجة التطبيقات، باستخدام الوثائق وأدوات التطوير التي توفرها المنصة لتنفيذ وظائف معالجة اللغة الطبيعية المختلفة.
DeepSeek-V2.5 من Deepseek
مقدمة موجزة
DeepSeek-V2.5، الذي طوره فريق DeepSeek، هو نموذج لغوي قوي مفتوح المصدر يدمج قدرات DeepSeek-V2-Chat و DeepSeek-Coder-V2-Instruct، وهو يمثل تتويجًا للتطورات السابقة للنموذج. التفاصيل الرئيسية هي كما يلي:
- تاريخ التنمية: في سبتمبر 2024، أصدروا رسمياً الإصدار DeepSeek-V2.5، الذي يجمع بين إمكانيات الدردشة والترميز. يعمل هذا الإصدار على تحسين كل من إتقان اللغة العامة ووظائف البرمجة.
- الطبيعة المفتوحة المصدر: تماشياً مع الالتزام بالتطوير المفتوح المصدر، أصبح DeepSeek-V2.5 متاحاً الآن على Hugging Face، مما يسمح للمطورين بتعديل النموذج وتحسينه حسب الحاجة.
الميزات والمزايا الرئيسية
- القدرات اللغوية والترميز معاً: يحتفظ DeepSeek-V2.5 بالقدرات التخاطبية لنموذج الدردشة ونقاط القوة البرمجية لنموذج المبرمج، مما يجعله حلاً "متعدد الإمكانات" حقيقيًا قادرًا على التعامل مع المحادثات اليومية واتباع التعليمات المعقدة وتوليد التعليمات البرمجية وإكمالها.
- محاذاة التفضيلات البشرية: تم ضبط النموذج بشكل دقيق ليتماشى مع التفضيلات البشرية، وقد تم تحسينه من أجل جودة الكتابة والالتزام بالتعليمات، حيث يعمل بشكل طبيعي وذكي أكثر عبر مهام متعددة لفهم احتياجات المستخدم وتلبيتها بشكل أفضل.
- الأداء المتميز: DeepSeek-V2.5 يتفوق على الإصدارات السابقة في العديد من المعايير، ويحقق أفضل النتائج في معايير البرمجة مثل humaneval python ومقياس البرمجة المباشر، مما يُظهر قوته في الالتزام بالتعليمات وتوليد الأكواد.
- دعم السياق الموسع: مع حد أقصى لطول السياق يبلغ 128 ألف رمز من الرموز، يتعامل DeepSeek-V2.5 بفعالية مع النصوص الطويلة والحوارات متعددة الأدوار.
- فعالية التكلفة العالية: مقارنة بنماذج المصادر المغلقة من الدرجة الأولى مثل كلود 3.5 سوناتة كلود 3.5 و GPT-4o، DeepSeek-V2.5، GPT-4o، DeepSeek-V2.5 ميزة كبيرة من حيث التكلفة.
طرق الاستخدام
- عبر منصة الويب: الوصول إلى DeepSeek-V2.5 من خلال منصات الويب مثل ملعب DeepSeek-V2.5 الخاص بشركة SiliconCloud.
- عبر واجهة برمجة التطبيقات: يمكن للمستخدمين إنشاء حساب للحصول على مفتاح واجهة برمجة التطبيقات، ثم دمج DeepSeek-V2.5 في أنظمتهم من خلال واجهة برمجة التطبيقات للتطوير والتطبيقات الثانوية.
- النشر المحلي: يتطلب 8 وحدات معالجة رسومية بسعة 80 جيجابايت لكل منها، باستخدام محولات Hugging Face للاستدلال. ارجع إلى الوثائق ونموذج الكود لمعرفة الخطوات المحددة.
- ضمن منتجات محددة:
- المؤشر: يسمح محرر أكواد الذكاء الاصطناعي هذا، الذي يعتمد على VSCode، للمستخدمين بتهيئة نموذج DeepSeek-V2.5، والاتصال بواجهة برمجة التطبيقات الخاصة بـ SiliconCloud لتوليد الأكواد على الصفحة عبر اختصارات، مما يعزز كفاءة الترميز.
- أدوات أو منصات تطوير أخرى: يمكن نظريًا لأي أداة أو منصة تطوير تدعم واجهات برمجة تطبيقات نماذج اللغة الخارجية أن تدمج DeepSeek-V2.5 من خلال الحصول على مفتاح واجهة برمجة التطبيقات، مما يتيح إمكانية إنشاء اللغة وكتابة التعليمات البرمجية.
عرض إرني-4.0-تيربو-8ك-بايدو
مقدمة موجزة
عرض إرني-4.0-تيربو-8ك-تيربو-8ك-بريفيو هي جزء من سلسلة ERNIE 4.0 Turbo من Baidu، والتي تم إصدارها رسميًا في 28 يونيو 2024، وتم فتحها بالكامل لعملاء المؤسسات في 5 يوليو 2024.
الميزات والمزايا الرئيسية
- تحسين الأداء: كنسخة مطورة من ERNIE 4.0، يعمل هذا النموذج على توسيع طول مدخلات السياق من ألفي رمز إلى 8 آلاف رمز، مما يمكّنه من التعامل مع مجموعات بيانات أكبر، وقراءة المزيد من المستندات أو عناوين URL، وأداء أفضل في المهام التي تتضمن نصوصًا طويلة.
- تخفيض التكلفة: إن تكاليف المدخلات والمخرجات من ERNIE 4.0-turbo-8k-preview منخفضة تصل إلى 0.03 يوان صيني لكل 1000 توكن و0.06 يوان صيني لكل 1000 توكن، وهو ما يمثل انخفاضًا في السعر بمقدار 70% عن الإصدار العام من ERNIE 4.0.
- التحسين التقني: يحقق هذا النموذج، المعزز بتقنية التوربو، تحسينات مزدوجة في سرعة التدريب والأداء، مما يسمح بتدريب ونشر النموذج بشكل أسرع.
- تطبيق واسع النطاق: نظرًا لمزايا أدائه وتكلفته، فإن هذا النموذج قابل للتطبيق على نطاق واسع في مجالات مثل خدمة العملاء الذكية والمساعدين الافتراضيين والتعليم والترفيه، مما يوفر تجربة محادثة سلسة وطبيعية. كما أن قدرات التوليد القوية التي يتمتع بها تجعله مناسبًا للغاية لإنشاء المحتوى وتحليل البيانات.
الاستخدام
يتوفر ERNIE 4.0-turbo-8k-preview بشكل أساسي لعملاء المؤسسات، الذين يمكنهم الوصول إليه عبر منصة Qianfan الكبيرة من بايدو على سحابة بايدو الذكية.
أفضل 10 نماذج للذكاء الاصطناعي ابتكرتها شركة صينية
Model | المطور | Key feature &Strength | How to use |
هونيوان-كبير | تينسنت | Open source, 398 billion parameters | Download the model |
Moonshot(kimi) | Moonshot AI | Long-Text Processing Ability,High Language Understanding | API, official App and tools |
GLM-4-Plus | zhipu.ai | language comprehension, instruction-following, and long-text processing. | API |
SenseChat 5.5 | SenceTime | Powerful Comprehensive Performance,Exceptional Language Capabilities | Sensetime webiste, API |
Qwen2.5-72B | Alibaba Cloud | Context length supports up to 128K, Multilingual support for over 29 languages | Download model, official website |
Doubao-pro | ByteDance | Strong Comprehensive Abilities,high cost-effectiveness,chatbot, | Daobao App,API |
360gpt2-pro | 360 | Enhanced Security Features,Strong Language Generation | Lobechat, 360AI browser |
Step-2-16k | stepfun | trillion-parameter language model,Multi-domain Knowledge Coverage,Performance Close to GPT-4 | API |
DeepSeek-V2.5 | deepseek | Combined Language and Coding Abilities,Human Preference Alignment | Web platform,API,local deployment |
Ernie-4.0-turbo-8k | Baidu | Wide Application,cost reduction, | Only enterprise clients |