Bezplatný test Qwen2.5 online lepší než Llama3.1 a GPT4o

Obsah

Stažení Tongyi Qianqian Qwen přesáhlo 40 milionů a „vytvořilo“ více než 50 000 dětských modelů.

Žádné BS, nechte nejprve otestovat Qwen zde：

Cloud computing „jarní festival gala“ byla zahájena konference Yunqi, velký model Tongyi Qwen znovu explodoval celou scénu!
Moudré věci hlášené 19. září v Hangzhou, dnes Ali Cloud uvedl na svět nejsilnější open source velký model Qwen2.5-72B, výkonnostní „cross-measure“ za Llama3.1-405B, a poté na trůn globálního open source velkého modelu.
Následuje shrnutí výsledků práce na tomto projektu

Qwen2.5-72B překonává Llama-405B v mnoha směrodatných testech.

Ve stejné době byla poté otevřena velká řada modelů Qwen2.5, včetně: jazykového modelu Qwen2.5, vizuálního jazykového modelu Qwen2-VL-72B, programovacího modelu Qwen2.5-Coder a matematického modelu Qwen2.5-Math atd., s kumulativním celkem více než 100 na pultech prodejců GPT4 a některé z nich zaznamenaly nový svět.
„Je to bláznivý čtvrtek“, „Epic Product“ …… Během několika hodin od svého vydání spustil Qwen2.5 šílené diskuze na sociálních sítích doma i v zahraničí a vývojáři z celého světa se připojili k testovacímu týmu.

▲Qwen2.5 je žhavé téma na sociálních sítích doma i v zahraničí.

Qwen2.5-Math například kombinuje vizuální rozpoznávání s Qwen2.5-Math. Když vložíte snímek obrazovky geometricky podobné otázky s více možnostmi, Qwen2.5-Math rychle rozpozná význam otázky a dá správné řešení a odpověď „B“, což je přesné a rychlé. Přesnost a rychlost jsou úžasné.
Toto je poprvé, co vidím Qwen2.5-Math na webu.

▲Qwen2.5-Math Trial

Za pouhý jeden a půl roku od dubna 2023 se Qwen rozrostla v modelingovou skupinu světové třídy, která je hned za Llamou.
Podle nejnovějších údajů zveřejněných Zhou Jingrenem, CTO AliCloud, k polovině září 2024, kumulativní počet stažení open source modelů Tongyi Qwen přesáhl 40 milionů a bylo odvozeno více než 50 000 velkých modelů.

▲ Velké modely odvozené z řady Qwen přes 50 000

Jaká jsou konkrétní vylepšení výkonu Qwen 2.5? Jaké jsou hlavní přednosti 100 nových modelů s otevřeným zdrojovým kódem? Qwen2.5 je první svého druhu na světě a je první svého druhu v Číně.
Adresa blogu: https://qwenlm.github.io/blog/qwen2.5/
Adresa projektu: https://huggingface.co/spaces/Qwen/Qwen2.5

▲Oficiální blog vydává Aliyun Qwen 2.5 Model Clusters

01. Opět na prvním místě globálního seznamu, Qwen2.5 cross-volume Catching up with Llama3.1-405B

Pojďme se podívat na výkon Qwen2.5 konkrétně.
Model Qwen2.5 podporuje délku kontextu až 128 kB, dokáže generovat obsah až 8 kB a podporuje více než 29 jazyků, což znamená, že uživatelům může pomoci napsat články o 10 000 slovech.
Nejen, že na základě předtrénování dat 18T tokenů má Qwen2.5 více než 18% celkové zlepšení výkonu ve srovnání s Qwen2, s více znalostmi a silnějšími programovacími a matematickými dovednostmi.

▲CTO AliCloud Zhou Jingren vysvětluje Qwen2.5

Uvádí se, že vlajkový model, model Qwen2.5-72B, dosáhl skóre až 86,8, 88,2 a 83,1 v benchmarku MMLU-rudex (který zkoumá obecné znalosti), benchmarku MBPP (který zkoumá schopnost kódování) a benchmarku MATH (který zkoumá matematické schopnosti).
Qwen2.5 se svými 72 miliardami parametrů dokonce „řádově“ překonává Llama3.1-405B se svými 405 miliardami parametrů.
Llama3.1-405B byla vydána společností Meta v červenci 2024 a ve více než 150 srovnávacích testovacích sadách se vyrovnala nebo dokonce překonala tehdejší SOTA (nejlepší v oboru) model GPT-4o, což vyvolalo tvrzení, že „nejsilnější open-source model je nejsilnější model“.
Qwen2.5-72B-Instruct, následná verze Qwen2.5, překonala Llama3.1-405B v MMLU-redux, MATH, MBPP, LiveCodeBench, Arena-Hard, AlignBench, MT-Bench, MultiPL-E a dalších autoritativních hodnoceních. 405B.
obrázky

▲ Situace hodnocení modelu Qwen2.5-72B

Qwen2.5 je opět světově nejsilnější model s otevřeným zdrojovým kódem, který přispívá k průmyslovému trendu „otevřený zdroj před uzavřeným zdrojem“.
Toto je AliCloud, který navazuje na open source sérii Tongyi Qianqian Qwen2 v červnu tohoto roku, dohání tehdy nejsilnější open source model Llama3-70B a poté spustil sérii open source verzí.
V komunitě vývojářů AI se stalo známým rytmem, že každý nový král, který se objeví, je brzy překonán novou verzí Tongyi.
Po otevření Qwen2.5 večer 18. září bylo mnoho vývojářů tak nadšených, že nespali a zkusili to jako první.
Nejsem si jistý, jestli to zvládnu.

▲Vývojáři doma i v zahraničí horlivě diskutují o Qwen2.5

02.Největší modelingová komunita v historii světa
Nejdůležitější je dobře rozumět tomu, co se ve světě děje a jak to funguje.

Qwen2.5 open source modelovací komunita je největší, jaká kdy byla.
Zhou Jingren, technický ředitel společnosti AliCloud, na konferenci Yunqi oznámil, že řada Qwen2.5 obsahuje na pultech více než 100 modelů s otevřeným zdrojovým kódem, které se plně přizpůsobí potřebám vývojářů a malých a středních podniků v různých scénářích.
Reaguje tak na výzvy mnoha vývojářů, kteří již dlouhou dobu „naléhali“ na hlavních sociálních sítích.

▲Vývojáři doma i v zahraničí požadují více Qwen2.5

1, jazykový model: od 0,5B do 72B sedm velikostí, od koncových po scénáře průmyslové úrovně plné pokrytí
Qwen2.5 open-sources sedm velikostních jazykových modelů, včetně 0,5B, 1,5B, 3B, 7B, 14B, 32B a 72B, z nichž všechny dosáhly výsledků SOTA v odpovídajících stopách.
obrázky

▲Qwen2.5 pro více velikostí splňuje potřeby různých scénářů

Vzhledem ke svým pokročilým schopnostem zpracování přirozeného jazyka (NLP) a porozumění kódování je Qwen2.5 Alibaba Cloud navržen tak, aby zvládl širokou škálu aplikací. Zde jsou některé konkrétní scénáře, kde lze Qwen2.5 použít:

Rozšířený zákaznický servis: Qwen2.5 lze použít v chatbotech pro více lidských interakcí, efektivně odpovídat na dotazy zákazníků a poskytovat řešení.
Tvorba obsahu: Model může pomoci při generování článků, příspěvků na sociálních sítích a dalšího písemného obsahu, čímž šetří čas tvůrcům obsahu.
Pomoc s programováním: Díky své specializované řadě Qwen2.5-Coder může vývojářům pomoci navrhováním úryvků kódu, nápovědou k ladění a automatizací určitých úloh kódování.
Vzdělávání a učení: Qwen2.5 lze použít k vývoji vzdělávacích nástrojů, jako jsou interaktivní výukové platformy, které poskytují vysvětlení, odpovídají na otázky studentů a dokonce i hodnotí úkoly.
Překladatelské služby: Vzhledem ke své znalosti více jazyků může poskytovat překladatelské služby v reálném čase a překlenout tak jazykovou mezeru v mezinárodní komunikaci.
Výzkum a vývoj: Ve výzkumu může Qwen2.5 zpracovávat velké množství textových dat, aby pomohla objevit vzorce, sumarizovat zjištění a generovat zprávy.
Právní pomoc: Model může číst právní dokumenty, extrahovat relevantní informace a dokonce navrhovat základní právní dokumenty, což šetří čas právníkům.
Podpora zdravotnictví: Qwen2.5 lze použít k zodpovězení běžných zdravotních otázek, poskytování lékařských informací a pomoci při správě dat pacientů.
Marketing a reklama: Může pomoci vytvářet personalizovaný marketingový obsah, texty reklam a kampaně na sociálních sítích, které cílí na konkrétní publikum.
Analýza dat: Qwen2.5 dokáže zpracovávat a analyzovat velké soubory dat, aby poskytla přehled a pomohla činit rozhodnutí na základě dat.
Automatické hlášení: Model může generovat zprávy zpracováním dat a informací v různých oblastech, což je užitečné zejména ve finanční a obchodní analýze.
Vývoj hry: Qwen2.5 může pomoci při vytváření interaktivních dialogů a příběhů pro postavy z videoher, aby se zvýšilo zapojení hráčů.
Virtuální asistentka: Pohání virtuální asistenty, kteří mohou spravovat plány, nastavovat připomenutí a poskytovat personalizované rady.
Elektronický obchod: Qwen2.5 může pomoci generovat popisy produktů, zpracovávat dotazy zákazníků a vytvářet personalizované nákupní zážitky.
Podpora více jazyků: Lze jej použít v globálních aplikacích, které vyžadují vícejazyčnou interakci, jako je mezinárodní zákaznický servis nebo lokalizace obsahu.

Tyto verze pomáhají vývojářům vyvážit možnosti modelu a náklady a přizpůsobit se různým scénářům. Například 3B je zlatá velikost pro přizpůsobení mobilním telefonům a dalším koncovým zařízením, 32B je nejvíce očekávaná vývojáři jako „král nákladově efektivních“ a 72B je král výkonnosti scénářů průmyslové úrovně a vědeckého výzkumu.
Adresa blogu: https://qwenlm.github.io/zh/blog/qwen2.5-llm/
2、Multimodální model: vizuální model rozumí 20 minutám videa, audio-lingvální model podporuje 8 jazyků
Qwen2-VL-72B, vysoce očekávaný rozsáhlý model vizuálního jazyka, je dnes oficiálně open-source.
Qwen2-VL dokáže rozpoznat obrázky s různým rozlišením a poměrem stran, rozumí dlouhým videím delším než 20 minut, má schopnost regulovat vizuální inteligenci mobilních telefonů a zařízení a překonává úroveň vizuálního porozumění GPT-4o.

▲Rozsáhlý model vizuálního jazyka Qwen2-VL-72B s otevřeným zdrojovým kódem

Qwen2-VL-72B se stal nejlépe hodnoceným open source modelem vizuálního porozumění v globálním autoritativním hodnocení LMSYS Chatbot Arena Leaderboard.

Qwen2-VL-72B je nejlépe hodnocený open source model vizuálního porozumění.

Rozsáhlý audio jazykový model Qwen2-Audio je model s otevřeným zdrojovým kódem, který dokáže porozumět lidskému hlasu, hudbě a přirozenému zvuku, podporuje hlasový chat, analýzu zvukových zpráv a podporuje více než 8 jazyků a dialektů a je globálním lídrem v indexu hodnocení hlavního proudu.
Adresa blogu: http://qwenlm.github.io/blog/qwen2-vl/
3, speciální model: debut nejpokročilejšího open source matematického modelu, který dohání GPT-4o
Qwen2.5-Coder pro programování a Qwen2.5-Math pro matematiku byly také oznámeny jako open source na této Cloud Habitat Conference.
Mezi nimi je Qwen2.5-Math dosud nejpokročilejší open source matematická modelová řada, tentokrát open source 1.5B, 7B, 72B tři velikosti a matematický model odměn Qwen2.5-Math-RM.

▲Qwen2.5-Math open source

Vlajkový model Qwen2-Math-72B-Instruct překonává proprietární modely jako GPT-4o a Claude 3.5 v navazujících úlohách souvisejících s matematikou.
Qwen2.5-Coder, který byl trénován na až 5,5T tokenech dat souvisejících s programováním, byl ve stejný den otevřen jako open source ve verzích 1.5B a 7B a v budoucnu bude open source ve verzi 32B.

▲Open source Qwen2.5-Coder

Adresa blogu:
https://qwenlm.github.io/zh/blog/qwen2.5-math/
https://qwenlm.github.io/zh/blog/qwen2.5-coder/
Kromě toho stojí za zmínku, že Qwen-Max, vlajkový model Tongyiqianqian, byl plně upgradován, blíží se nebo dokonce překonává GPT-4o ve více než deseti směrodatných benchmarcích, jako je MMLU-Pro, MATH atd., a je online na oficiálních stránkách Tongyiqianqian a Tongyi APP. Uživatelé mohou také volat rozhraní API Qwen-Max prostřednictvím platformy AliCloud Hundred Refinement Platform.
obrázky

▲Qwen-Max realizuje komplexní upgrade

Od uvedení první generace velkého modelu Tongyi Qianqian v dubnu 2023 umožnil AliCloud čínským podnikům používat tento velký model za nízkou cenu, což vedlo k tomu, že dnešní řada Qwen2.5 je „stále užitečnější“.
Modely řady Qwen2.5 pokrývají základní verzi, verzi podle příkazů a kvantitativní verzi, která je iterována ve scénářích reálného světa.

03. Stažení Qwen přesáhlo 40 milionů! Narodilo se více než 50 000 „miminek“.

Po roce a půl rychlého vývoje se Tongyi Qwen stala světovou modelovou skupinou, která je hned za Llamou.
Zhou Jingren oznámil dvě sady nejnovějších údajů, které to mají potvrdit:
Za prvé, počet stažení modelů, k začátku září 2024 kumulativní počet stažení modelů s otevřeným zdrojovým kódem Tongyi Qianwen přesáhl 40 milionů, což je výsledek hlasování vývojářů a malých a středních podniků nohama;
Druhým je počet odvozených modelů, k začátku září celkový počet původních a odvozených modelů Tongyi přesáhl 50 000, druhý za Llamou.

▲Tongyi Thousand Questions open source model kumulativních stažení přesáhl 40 milionů

Doposud se „10 000 modelů se stejným zdrojem“ stalo významným trendem ve vývoji velkého čínského modelářského průmyslu.
jaký je koncept? Čínský open source je na prvním místě na světě nejen z hlediska výkonu, ale také z hlediska ekologické expanze. Open source komunity, ekologičtí partneři a vývojáři doma i v zahraničí se stali „vodou z kohoutku“ Tongyi Chienqin, který se stal prvním velkým modelem přijatým mnoha podniky a také nejdéle používaným velkým modelem.
Již v srpnu 2023 Aliyun zpřístupnil model Tongyi Qwen se 7 miliardami parametrů pro bezplatnou komercializaci a pak letošní Qwen1.5, Qwen2, Qwen2.5 vydal jeden po druhém, takže vývojáři mohou rychle používat nejpokročilejší model ve stejnou dobu, získat větší prostor pro kontrolu a ladění, čímž se stal preferovanou volbou více podniků.
Na začátku července inženýři z Hugging Face, největší světové komunity s otevřeným zdrojovým kódem, tweetovali, aby potvrdili, že Tongyi je nejvíce srolovaný velký model v Číně. A prostřednictvím AliCloud obsloužil Tongyi Big Model více než 300 000 zákazníků v různých odvětvích. V právě uplynulém druhém čtvrtletí roku 2024 (odpovídajícímu 1. čtvrtletí fiskálního roku Alibaba 2025) dosáhly tržby společnosti Aliyun z produktů souvisejících s AI trojciferný růst.

▲Tongyi Big Model obsluhuje více než 300 000 zákazníků

Co udělal Aliyun správně?
Podle mého názoru, na rozdíl od zahraničních velkých výrobců Microsoft a ChatGPT silné vazby, Amazon AWS konvergence třístranného modelu k provedení základní infrastruktury, Aliyun integroval výhody těchto dvou, na začátku se rozhodl pro služby infrastruktury AI a vlastní výzkum velkého modelu obousměrně.
Ali Cloud, který se zaměřuje na modely vlastního výzkumu, je jediným cloudovým gigantem v Číně, který má o modelovém open source a otevřenosti pevně jasno a nešetřil úsilím vynaložením obrovských investic do průlomových modelů, ekologické kompatibility, vývojářských služeb atd., aby se velké modely Tongyi krok za krokem dostaly do klíčového kruhu světové konkurence AI.

04. Závěr: Všechny modely mají stejný původ Industry Watershed Moment

Open source modely dohánějí nebo dokonce dohánějí uzavřené modely. Od Llama-405B od Meta v červenci po Qwen2.5-72B od AliCloud dnes, krajina „všech modelů ze stejného zdroje“ se formuje. Jeden a půl roku nárůst velkého modelu Tongyi Qianqi umožnil mnoha průmyslovým odvětvím a podnikům realizovat levnější přistání v měřítku AI a průmysl vstupuje do nového zlomového okamžiku.

FAQ

Otázka: Jaké různé velikosti modelů jsou dostupné pro Qwen2.5? Odpověď: Qwen2.5 nabízí řadu modelů od 0,5B do 72B parametrů, které poskytují možnosti pro různé aplikace a požadavky.
Otázka: Jak Qwen2.5 podporuje programovací úlohy? Odpověď: Qwen2.5 zahrnuje specializovanou řadu nazvanou Qwen2.5-Coder, navrženou tak, aby zlepšila generování kódu, odvození a ladění s podporou až 128 000 tokenů.
Otázka: Jaká jsou tréninková data pro Qwen2.5? Odpověď: Qwen2.5 je předtrénován na rozsáhlém datovém souboru pokrývajícím až 18 bilionů tokenů, což zajišťuje široké porozumění jazyku.
Otázka: Je Qwen2.5 vhodný pro použití ve vzdělávání? Odpověď: Ano, schopnosti Qwen2.5 v oblasti zpracování přirozeného jazyka jej činí vhodným pro vzdělávací nástroje, včetně interaktivních výukových platforem.
Otázka: Jak si Qwen2.5 vede v benchmarcích ve srovnání s jinými modely? Odpověď: Qwen2.5 je v současné době na třetím místě v multimodálních benchmarkech a v několika oblastech překonává modely jako Llama3.1.
Otázka: Jaké jazyky Qwen2.5 podporuje? Odpověď: Qwen2.5 podporuje více jazyků, mimo jiné Python, Java a C++.
Otázka: Může Qwen2.5 generovat kód ve více programovacích jazycích? Odpověď: Ano, Qwen2.5-Coder je schopen generovat kód v různých programovacích jazycích, aby vyhovoval potřebám různých vývojářů.
Otázka: Jak Qwen2.5 zpracovává dlouhé kontexty? Odpověď: Qwen2.5 podporuje délky kontextu až 32 kB, což je výhodné pro zlepšení přesnosti dokončování kódu a odvození.
Otázka: Je Qwen2.5 open source? Odpověď: Zatímco verze Qwen2.5 s otevřeným zdrojovým kódem ještě nebyla vydána, podrobná dokumentace a příklady jsou k dispozici na platformách, jako je GitHub.
Otázka: Jaké jsou některé scénáře aplikací v reálném světě pro Qwen2.5? Odpověď: Qwen2.5 lze využít v chatbotech zákaznických služeb, vytváření obsahu, pomoci s programováním, vzdělávání, překladatelských službách, právní pomoci, zdravotní podpoře, marketingu, analýze dat, automatizovaných zprávách, vývoji her, virtuálních asistentech, elektronickém obchodování a vícejazyčné podpoře v různých odvětvích.