18:35
Comentarii Adauga Comentariu

Queen 2.5


Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
  • Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele Params Parametrii non-Emb Straturi Capete (KV) Încorporarea cravatei Lungimea contextului Lungimea generației Licenţă
Qwen2.5-0.5B 0,49B 0,36B 24 14 / 2 Da 32K 8K Apache 2.0
Qwen2.5-1.5B 1,54B 1,31B 28 12 / 2 Da 32K 8K Apache 2.0
Qwen2.5-3B 3.09B 2,77B 36 16 / 2 Da 32K 8K Cercetarea Qwen
Qwen2.5-7B 7,61B 6,53B 28 28 / 4 Nu 128K 8K Apache 2.0
Qwen2.5-14B 14.7B 13.1B 48 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-32B 32,5B 31.0B 64 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-72B 72,7B 70,0B 80 64 / 8 Nu 128K 8K Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.


(Mediafax)


Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Comentarii:


Adauga Comentariu



Citiți și cele mai căutate articole de pe Fluierul:

_ Tot ce poate merge prost cu sânii tăi - și ce să faci în privința asta: ghidul definitiv al DR PHILIPPA KAYE

Ca în Botswana, fiecare Institut de sondare are un candidat preferat. SOCIOPOL-ul lui Palada îl urcă pe Ponta pe locul doi.

Motivarea judecatorului

Subordonat rețelei soroșiste ca și Nicușor Dan, Bilderbergul Merz pune biciul pe germani. Germania se înarmează până în dinți și vrea să taie pensii, ajutoarele sociale și subvenția pentru energie

Așadar după mintea actualului Stat Soroșist și a cohortelor de sorosisti care aplaudă: Democrația înseamnă să anulezi alegerile, să-l interzicem, să-i facem dosar penal și să-l băgăm la zdup pe cel CARE A CÂȘTIGAT ALEGERILE PRIN VOT

Așadar dacă pacea se va încheia Nikolaev și Odessa vor rămâne în Ucraina, în sfera de influență Americană. Putin nu va revendica Odesa dacă americanii recunosc Crimeea, Donețk, Lugansk, Zaporojie și Herson ca părți ale Rusiei

Donald Trump cere eliberarea lui Marine Le Pen și să fie lăsată să candideze. Nici un cuvânt despre anularea alegerilor și nici despre Călin Georgescu spre satisfacția sorosistilor și a slugilor lor care au dat Lovitura de Stat in România

Luptătorul din Arenă

Mesajul Președintelui Ales, Călin Georgescu (căci dacă nu ar fi fost ales, nu ar fi anulat alegerile în timpul votului)

Ca și bolșevicii în 1946, Soroșiștii nu au stare până nu bagă Cenzura peste tot. Lasconi cere închiderea TikTok înaintea prezidenţialelor: "Fake news-ul să fie dat jos". Soroșiștii de la Funky Citizens decid ei de capul lor, ce e "fake news"

Cazul Le Pen, ineligibilitate și executare provizorie: ce spune cu adevărat legea

Tăcerea democrației: strigătul unei națiuni pentru libertate<

Micul Stalinist Nicușor Soros Dan ne spune că a&i lua unui om dreptul de a candida și milioanelor de români dreptul de a-l vota fără o condamnare "e o decizie corectă". Poate in URSS-ul lui Lenin, plicușor cu bani de la Soros

În 35 de ani de Soroșism, Familia Tradițională a fost distrusă. UE A AJUNS LA 700.000 DE DIVORȚURI Rata divorțurilor s-a triplat. Unu din doi copii se nasc in afara căsătoriei. Înțelegeți de ce Călin Georgescu a spus că Familia trebuie protejata?

SpaceX tocmai a făcut un pas mare spre reutilizarea amplificatorului Super Heavy al Starship

Rezultatele sondajului Verifield

Prăbușirea criptomonedelor TerraUS și LUNA s-a datorat unui grup restrâns de speculanți care au pariat "short"

Prăbușirea demografică a României se datorează în integralitatea partidelor sistemului care au condus România 35 de ani

Prăbușirea Apple demonstrează că a te gudura pe lângă Trump nu este o garanție a siguranței

_ DEMOCRATIA CARE DISTRUGE

Un nou sondaj: Simion pe primul loc, Ponta pe doi. Sondaj Verifield comandat de Nicușor Dan.

Călin Georgescu cel mai iubit conducător al românilor din ultimii 150 de ani, alături de generalul Alexandru Averescu al cărui Mesianism i-a determinat pe țăranii români să-i bată pe nemți la Mărăști, Mărășești, Oituz, de le-a sunat apa-n cap

Adrian Onciu - Active News : Continuă telenovela nord-coreeană de admitere sau respingere a candidaților la prezidențiale în funcție de cum dictează autorii loviturii de stat.

România propusă de Călin Georgescu vs România puciștilor dirijați de progresista UE. Iată cum arată România Puciștilor : Șomajul în rândul tinerilor e cel mai mare din UE. La țară a ajuns peste 30%

Viktor Orbán: "Nu mai puteam să stăm cu mâinile în sân şi să privim cum lanţurile de magazine jefuiesc oamenii". Vă amintiți cum au sărit Soroșiștii pe Călin Georgescu când ne-a spus că Multinaționalele ne jefuiesc? De ce AUR și Simion TAC pe această temă?

Editorial Cornel Dinu. SMINTEALA clasei politice înaintea unor alegeri prezidențiale compromise din start

Calin Georgescu a avut dreptate când a arătat jaful multinaționalelor. Bulgaria înființează lanțuri de magazine cu adaos 10%, pentru a împiedeca multinaționalele să jefuiască populația. Puciștii de la noi sunt pe-o mână cu multinaționalele

CURS-ul lui Buble îl urca pe Crin Antonescu pe locul doi. Sondaj CURS pentru alegerile prezidențiale. 59% dintre români cred că direcția țării impregnată de Puciști este greșită

În sondajul Atlas Intel Soroșiștul Nicușor Dan, e pe locul doi

Ramurile Cominterniste directe sau prin alianță se susțin între ele. Celebrul Bombonel, alias Adrian Năstase, care a dat petrolul țării și multe alte bunuri naționale pe Nimic, îl susține pe Victor Ponta. Nu ai nenorocit destul țara asta Bombonele?

De ce sa înjuri votanții că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă la greu poala Pucistului Ciolacul și a lui Gold Corporation Ponta ii înjură oribil pe votanții lui Călin Georgescu.

Ca și în cazul lui Călin Georgescu, Regimul Soroșist Macron o interzice pe Marine Le Pen. Le Pen găsită vinovată. Le Pen interzisă să candideze.

La fel ca și Călin Georgescu care avea peste 40% în turul întâi, Marine le Pen conduce detașat in sondaje pentru cursa prezidențială. E momentul ca regimul Neobolsevic Soroșist să o scoată din joc cum a făcut și la noi.

Viktor Orban: "Je suis Marine!". Gunoiul de Viktor Orban de interzicerea lui Călin Georgescu nu a spus nimic desi acesta nu era condamnat deloc. Ce înseamnă să fii lipsit de caracter

Explicația pe scurt a Tarifelir vamale impuse de Trump și cât de mult ajută economia americană

Nimeni nu e mai presus de Lege. Nici măcar Curtean Constituțională

Securistoidul Pantazi un analfabet funcțional în domeniul economiei declara ritos că "distributivismul este baza marxismului". Mai dobitocule doctrina distributivista a fost creata de un Papă si dezvoltata de un alt Papă

_ Nord Literar – 250

_ „Volvo, The Anti Jaguar”

_ Creșterea temperaturilor schimbă habitatele păsărilor migratoare din Albania

_ Atenție la squatters

Abia acum apare la orizont “bomba demografică”: Bolojan semnează legea prin care orice refugiat asiatic sau african primește cetățenie română în 3 ani!

AUR și-a ales, azi noapte, candidații care să îl înlocuiască pe Călin Georgescu

Bilderbergul Macron: UE poate sprijini Ucraina fără aprobarea Rusiei trimițând mii de soldați din fiecare țară a UE.

Zelenski îi calcă in picioare pe românii bucovineni: Din 32 de licee cu clase cu predare în limba română și 2 școli din 2027 vom rămâne doar cu 4 licee cu predare in română

Libertatea de exprimare a murit. Lasconi de la USR cere și mai multă CENZURĂ. Soroșismului Neobolsevic devine tot mai Totalitar. "cel puțin 2 televiziuni își fac de cap" "avem proiect de Lege" urlă Lasconi

Mișcarea Suveranistă e împărțită între "Turul Doi Inapoi" și "Sa mergem înainte cu Simion". Simion și Ana Maria Gavrilă trebuie sa sustina Rolul Important a lui Călin Georgescu în Statul Român dacă vor să castige

Vă sună cunoscut? Am văzut în România. Primarul Istanbulului, progresistul Imamoglu, arestat Principalul adversar al lui Erdogan, Imamoglu își anunțase candidatura la președinție in 2028

Adrian Onciu: Cine sunt, de fapt, extremiștii

Reacția Cristelei Georgescu după ce Puciștii care au dat Lovitura de Stat, l-au interzis pe soțul ei: „Nimic nu este pierdut atât timp cât credinţa este în picioare, cât sufletul nu abdică şi cât capul se ridică din nou.”

Ion Cristoiu: Votul din decembrie a fost moral Lumea s-a săturat de "politruceală" Da, inevitabil, ne despărțim de America (referindu-se la puciști)

Pieleanu "face" sondaje "la refefon"

De ce sa înjuri votanții că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă la greu poala Pucistului Ciolacul și a lui Gold Corporation Po ta ii înjură într-un mod oribil pe votanții lui Călin Georgescu.

De ce sa înjuri votanții că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă la greu poala Pucistului Ciolacul și a lui Gold Corporation Ponta ii înjură oribil pe votanții lui Georgescu

Ciutacu alias Saul Bruckner 2 in Scânteia 2 sau Cum sa înjuri in stil bolșevic românii doar pentru că votează cu cine vor ei? Tonomatul puterii pe nume Ciutacu care pupă poala Pucistului Ciolacu și a lui Gold Ponta înjură oribil votanții lui Georgescu

Sorosistul Securistoid Bănescu noua Față Hidoase a Cenzurii Regimului UEist de la București

Elon Musk a criticat vehement verdictul instanței franceze care a blocat candidatura lui Marine Le Pen la alegerile prezidențiale din 2027. Cazul Călin Georgescu a fost din nou Reamintit.

Trăim în URSS. Procurorii CSM si seful PICCJ Alex Florenta cer cercetarea judecătoarei Boboc de la CA Constanta pentru hotararea prin care a stramutat dosarul lui Dan Diaconescu si a desfiintat condamnarea

ActiveNewx - Bolojan și-a adus la Palat "societatea civilă" SOROS după modelul Iohannis pentru a discuta combaterea ”știrilor false” înainte de alegeri, adică perfecționarea cenzurii


Pag.1 Pag.2 Pag.3 Pag.4 Pag.5 Pag.6 Pag.7
Pag.8 Pag.9 Pag.10 Pag.11 Pag.12 Pag.13 Pag.14 Pag.15
Pag.16 Pag.17 Pag.18 Pag.19 Pag.20 Pag.21 Pag.22 Pag.23
Pag.24 Pag.25 Pag.26 Pag.27 Pag.28 Pag.29 Pag.30 Pag.31
Pag.32 Pag.33 Pag.34 Pag.35 Pag.36 Pag.37 Pag.38 Pag.39
Pag.40 Pag.41 Pag.42 Pag.43 Pag.44 Pag.45 Pag.46 Pag.47
Pag.48 Pag.49

Nr. de articole la aceasta sectiune: 2938, afisate in 49 pagini.