18:35
Comentarii Adauga Comentariu

Queen 2.5


Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
  • Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele Params Parametrii non-Emb Straturi Capete (KV) Încorporarea cravatei Lungimea contextului Lungimea generației Licenţă
Qwen2.5-0.5B 0,49B 0,36B 24 14 / 2 Da 32K 8K Apache 2.0
Qwen2.5-1.5B 1,54B 1,31B 28 12 / 2 Da 32K 8K Apache 2.0
Qwen2.5-3B 3.09B 2,77B 36 16 / 2 Da 32K 8K Cercetarea Qwen
Qwen2.5-7B 7,61B 6,53B 28 28 / 4 Nu 128K 8K Apache 2.0
Qwen2.5-14B 14.7B 13.1B 48 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-32B 32,5B 31.0B 64 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-72B 72,7B 70,0B 80 64 / 8 Nu 128K 8K Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.


(Mediafax)


Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Comentarii:


Adauga Comentariu



Citiți și cele mai căutate articole de pe Fluierul:

_ Cine este soția lui Dave Myers, Liliana Orzac? Faceți cunoștință cu femeia „remarcabilă” care l-a susținut pe starul Hairy Biker în călătoria sa „teribilă” împotriva cancerului

_ ‘Mai impostor ca Basescu nu e nimeni’. Călin Georgescu a stârnit un scandal uriaş. Gigi Becali şi-a ieşit din minţi

_ Aeroportul din Doncaster este programat să revină la 16 luni după ce a fost închis, deoarece consiliul lansează un plan de salvare, care ridică speranța unor zboruri directe către Cracovia, Tenerife și Palma

_ Rep. Mast scrie VA în numele veteranilor care spun că își pierd accesul la medici (video)

_ Naiba că trebuie să împarți o casă cu fostul tău soț - și cele șase reguli de aur pentru a te asigura că nu vei termina să-l ucizi!

_ Miniștrii Muncii să reprime afacerile care „profită” din serviciile de îngrijire socială pentru copii

_ Fotograful ale cărui fotografii din noaptea regelui Frederik și Genoveva Casanova la Madrid au zguduit monarhia daneză dezvăluie noi detalii despre seară

_ Descinderi în București: Cămătari flancați de mii de euro și arme periculoase, săltați de mascați

_ Am vrut să mor după ce am jucat în cel mai bolnav reality show din lume - am petrecut 15 luni în izolare, fără mâncare sau haine, în timp ce producătorii mă transmiteau în secret la milioane

_ De ce nu ar trebui să-ți hrănești câinele cu resturile din cina de Crăciun

_ Minister of Labor: All pension recalculation decisions must be sent by next month

_ Ilie Bolojan explică de ce vrea să reducă la jumătate ministerele: Partidele și-au plantat oameni

_ Soția lui Jermaine Jenas, Ellie, apare în public fără verigheta, deoarece ea spune că ultimele luni au fost „incredibil de dificile” de când a demis scandalul de sex al starului BBC.

_ COMENTARIU POSTA ZILNIC: Reeves convinge Marea Britanie in recesiune

_ Kelemen Hunor: Dezmembrarea Ucrainei nu e o variantă acceptabilă; trebuie căutată o a treia, a patra cale

_ Fani răi uimiți când Ariana Grande, Cynthia Erivo și Jeff Goldblum fac o apariție surpriză la proiecția filmului din Londra

_ Soțul meu nu știe că dorm cu escorte masculine: La 37 de ani, m-am săturat de căsnicia noastră fără sex. „Hugo” mi-a reamintit cum era să fii femeie...

_ Scena Nașului din viața reală se joacă în Sicilia, când capul de cal tăiat este aruncat pe proprietatea omului de afaceri într-un avertisment înfiorător al mafiei

_ Ucraina trage o rachetă fabricată din SUA în Rusia: al treilea război mondial se teme că Kremlinul amenință „răspunsul nuclear” dacă pe teritoriul său sunt folosite arme occidentale cu rază lungă de acțiune

Sorina Matei despre Lovitura de Stat : Care Putin? Sistemul de la noi se comporta MAI RAU ca Putin

_ Restaurarea moștenirii arheologice a Mexicului la locul care i se cuvine

_ Semn de bunăvoință de la o civilizație extraterestră? O formațiune cosmică misterioasă îi intrigă pe oamenii de știință

_ Piersicile răspândite în America de Nord prin rețelele indigene, datarea cu radiocarbon și spectacolul de analiză a documentelor

_ Pârghie și speculații: Semne ale unei piețe taurine furioase

_ Cătălin Preda şi Constantin Popovici, locul 3 şi locul 9, după prima zi în concursul de sărituri în apă de la mare înălţime

_ Ducesa de Edinburgh taie o felie de tort în timp ce participă la evenimentul de 60 de ani de Wellbeing Of Women's

_ Modi din India îl îndeamnă pe Zelensky la masa de negocieri în prima vizită istorică în Ucraina

_ Arheologii au descoperit că vechii producători de brânzeturi foloseau frunzele copacilor pentru a crește producția de lapte

_ Toate semnele că Barron Trump este pregătit pentru a fi moștenitorul lui Donald și este centrul universului părinților săi

_ Cercetătorii susțin că masca de înmormântare a lui Tutankhamon ar fi fost făcută pentru o femeie, dar există motive de îndoială

_ Doi britanici au murit și un al treilea a fost grav rănit după ce mașina lor s-a izbit de barca cu motor a presupusilor traficanți de droguri care a ieșit dintr-o remorcă pe șoseaua spaniolă.

_ Brazii de Crăciun fără bucurie sunt de furie în acest an - cu crengi metalice și decorațiuni minimaliste

_ Un controversat influencer american riscă închisoarea în Coreea de Sud pentru comportamentul său

_ Se pare că Iranul și-a ales în secret următorul lider suprem. Ali Khamenei intenționează să abdice

_ Poate o ceașcă de ceai de ciocolată să bată cu adevărat o cană de cacao încălzită?

_ Detaliu ciudat descoperit în fotografia făcută de un cuplu în notoriul punct fierbinte Bigfoot

_ Live: Hezbollah spune că a lansat drone de atac asupra țintelor militare din Tel Aviv

_ Greva ATACMS a Ucrainei asupra Rusiei vine după ce Putin a coborât pragul pentru arme nucleare

_ Cititorul pe buze descifrează conversația privată a lui Trump și Joe Rogan la UFC 309: „Nu o voi uita”

_ Harwood-Bellis riscă mânia nunții de la Keane după golul Angliei

_ Kim Jong-Un îndeamnă armata Coreei de Nord să se pregătească de război

_ În momentul în care prietenii prințului Harry din Eton și-au dat seama că Meghan Markle va fi o problemă - în timp ce șopteau că regalul era „nebun” să se întâlnească cu „trezit” spoilsport

_ Polonezul Hubert Hurkacz îi va avea în echipa de antrenori pe Ivan Lendl şi Nicolas Massu Hubert Hurkacz

_ Poluare majoră în New Delhi - Școlile și șantierele eu fost închise

_ Zelenski se va adresa Parlamentului European la 1000 de zile de la invazia Rusiei

Fluierul.ro adreseaza o intrebare CSAT si CCR cei care au girat si au dat o adevarata Lovitura de Stat prin ANULAREA ALEGERILOR PREZIDENTIALE si INLATURAREA de la putere a Presedintelui ce urma sa fie ales. Unde e DOVADA implicarii RUSIEI?

ÎPS Teodosie Mitropolitul Tomisului: "Noi credem că domnul Georgescu este un trimis al lui Dumnezeu”

Gigi Becali despre Puciștii de la Putere care au dat Lovitura de Stat : "La ce au făcut...Peste 6-7 luni o să-i vedem pe ei în cătușe ce au făcut... Iohannis a făcut-o cu ei"

_ Conflict stradal în Gherla, județul Cluj: Intervenție a forțelor speciale

_ Explosion Rocks Portul din Miami

Ce este o Lovitură de Stat? A fost împiedecat Călin Georgescu să devină duminică seara Președintele României, printr-o lovitură de stat?

_ Volkswagen respinge planul sindicatului IG Metall de reducere a costurilor

_ Doi morți după ce un cuțitar din Manhattan a început să înjunghie în groază, atacând la întâmplare trei persoane

_ Martha Stewart stârnește îngrijorare după ce a dezvăluit că folosește același creion de ochi lichid de 20 de ani

_ Studiu. Alge care pot cauza pierderea memoriei, descoperite în fructele de mare

_ A WEEK IN FRANCE: Le Pen's fake jobs trial, Major shifts in sexuality over the last decade, and Notre-Dame

_ Mark Zuckerberg se alătură echipei MAGA? Fondatorul Facebook se întâlnește cu președintele Trump la Mar-a-Lago

_ Teroriștii concertului de la Moscova „au fost torturați de un ofițer rus neo-nazist”: soldatul care a tăiat urechea ucigașului „purta un plasture susținând grupul de extremă dreaptă”

_ Fiul lui Kourtney Kardashian, Mason, în vârstă de 14 ani, se ridică deasupra ei în timpul unui magazin alimentar din LA

_ Traian Băsescu răspunde la atacurile lui Călin Georgescu: 'Este un șarlatan!'


Pag.1 Pag.2 Pag.3 Pag.4 Pag.5 Pag.6 Pag.7
Pag.8 Pag.9 Pag.10 Pag.11 Pag.12 Pag.13 Pag.14 Pag.15
Pag.16 Pag.17 Pag.18 Pag.19 Pag.20 Pag.21 Pag.22 Pag.23
Pag.24 Pag.25 Pag.26 Pag.27 Pag.28 Pag.29 Pag.30 Pag.31
Pag.32 Pag.33 Pag.34 Pag.35 Pag.36 Pag.37 Pag.38 Pag.39
Pag.40 Pag.41 Pag.42 Pag.43 Pag.44 Pag.45 Pag.46 Pag.47
Pag.48 Pag.49 Pag.50 Pag.51 Pag.52 Pag.53 Pag.54 Pag.55
Pag.56 Pag.57 Pag.58 Pag.59 Pag.60 Pag.61 Pag.62 Pag.63
Pag.64 Pag.65 Pag.66 Pag.67

Nr. de articole la aceasta sectiune: 4010, afisate in 67 pagini.