18:35
Comentarii Adauga Comentariu

Queen 2.5


Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen 2.5 - 19 septembrie 2024

Qwen 2.5

Data: 19 septembrie 2024

În acest blog, explorăm detaliile noilor modele de limbaj din seria Qwen2.5 dezvoltate de Alibaba Cloud Dev Team. Echipa a creat o gamă de modele dense numai pentru decodor, șapte dintre ele fiind open-source, variind de la 0,5B la 72B parametri. Cercetările arată un interes semnificativ al utilizatorilor pentru modelele din intervalul de parametri 10-30B pentru utilizare în producție, precum și modelele 3B pentru aplicații mobile. Pentru a răspunde acestor nevoi, echipa are Qwen2.5-3B, Qwen2.5-14B și Qwen2.5-32B cu sursă deschisă. În plus, modele precum Qwen-Plus și Qwen-Turbo sunt disponibile prin serviciile API din Alibaba Cloud Model Studio.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă, Qwen2.5 își extinde ofertele open-source dincolo de cele patru modele Qwen2 (0,5B, 1,5B, 7B și 72B). Acesta adaugă două modele de dimensiuni medii rentabile — Qwen2.5-14B și Qwen2.5-32B — precum și Qwen2.5-3B optimizat pentru mobil. Aceste modele sunt extrem de competitive, Qwen2.5-32B depășind Qwen2-72B și Qwen2.5-14B depășind Qwen2-57B-A14B în evaluări cuprinzătoare.
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ, crescând de la 7 trilioane de jetoane la 18 trilioane de jetoane, sporind profunzimea de antrenament a modelului.
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri. De exemplu, scorurile MMLU pentru Qwen2.5-7B și Qwen2.5-72B au crescut la 74.2 și 86.1, comparativ cu 70.3 și 84.2 pentru modelele Qwen2, cu câștiguri substanțiale observate și în benchmark-uri precum GPQA, MMLU-Pro, MMLU-redux și ARC-c.
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ datorită progreselor în Qwen2.5-Coder. Qwen2.5-72B-Instruct îl depășește pe predecesorul său pe LiveCodeBench, MultiPL-E și MBPP, cu scoruri de 55,5, 75,1 și, respectiv, 88,2, față de 32,2, 69,2 și 80,2 pentru Qwen2-72B-Instruct.
  • Îmbunătățirea matematică: Abilitatea matematică a lui Qwen2.5 a cunoscut, de asemenea, o îmbunătățire rapidă, cu scorurile la benchmarkul MATH crescând de la 52,9 și 69,0 pentru Qwen2-7B/72B-Instruct la 75,5 și 83,1 pentru modelele Qwen2.5.
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane. De exemplu, scorul Arena-Hard pentru Qwen2.5-72B-Instruct a crescut de la 48.1 la 81.2, iar scorul MT-Bench s-a îmbunătățit de la 9.12 la 9.35, comparativ cu Qwen2-72B-Instruct.
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor, generarea de text lung (extinderea de la 1K la peste 8K jetoane), înțelegerea datelor structurate și producerea de rezultate structurate precum JSON. De asemenea, demonstrează o rezistență îmbunătățită la diverse solicitări ale sistemului, îmbunătățind jocul de rol și setarea condițiilor pentru chatbot.

Performanță și comparații

Performanță Qwen2.5-72B

Seturi de date Llama-3-70B Mixtral-8x22B Qwen2-72B Qwen2.5-72B
MMLU 79,5 77,8 84,2 86,1
MATH 42.5 41.7 50.9 62.1
HumanEval 48,2 46,3 64,6 59,1
MBPP 70,4 71,7 76,9 84,7

Concluzie

Modelele Qwen2.5 demonstrează un salt major față de generațiile anterioare și excelează în multiple domenii.

Qwen2.5 vs Qwen2

Seria Qwen2.5 aduce mai multe upgrade-uri cheie în comparație cu seria Qwen2 :

  • Open-source la scară completă: ca răspuns la cererea puternică a utilizatorilor pentru modele din gama 10-30B pentru producție și modele 3B pentru utilizare mobilă...
  • Set de date pre-antrenament mai mare și de calitate mai înaltă: setul de date pre-antrenament s-a extins semnificativ...
  • Îmbunătățirea cunoștințelor: Qwen2.5 demonstrează cunoștințe mai mari în diferite benchmark-uri...
  • Îmbunătățirea codării: capacitățile de codare ale Qwen2.5 s-au îmbunătățit semnificativ...
  • Îmbunătățirea matematică: abilitatea matematică a lui Qwen2.5 a cunoscut o îmbunătățire rapidă...
  • O mai bună aliniere a preferințelor umane: Qwen2.5 generează răspunsuri mai în concordanță cu preferințele umane...
  • Alte îmbunătățiri ale capacității de bază: modelele Qwen2.5 excelează în urmărirea instrucțiunilor...

Card model Qwen2.5

Modele Params Parametrii non-Emb Straturi Capete (KV) Încorporarea cravatei Lungimea contextului Lungimea generației Licenţă
Qwen2.5-0.5B 0,49B 0,36B 24 14 / 2 Da 32K 8K Apache 2.0
Qwen2.5-1.5B 1,54B 1,31B 28 12 / 2 Da 32K 8K Apache 2.0
Qwen2.5-3B 3.09B 2,77B 36 16 / 2 Da 32K 8K Cercetarea Qwen
Qwen2.5-7B 7,61B 6,53B 28 28 / 4 Nu 128K 8K Apache 2.0
Qwen2.5-14B 14.7B 13.1B 48 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-32B 32,5B 31.0B 64 40 / 8 Nu 128K 8K Apache 2.0
Qwen2.5-72B 72,7B 70,0B 80 64 / 8 Nu 128K 8K Qwen

Performanțe Qwen2.5

Performanța modelelor Qwen2.5 este evaluată pe o gamă largă de sarcini, incluzând matematică, codare și multilingvism.

Performanță Qwen2.5-72B

Modelul de bază Qwen2.5-72B iese în evidență prin depășirea semnificativă a altor modele din categoria sa într-un spectru larg de sarcini.

Performanță Qwen2.5-14B/32B

Modelele Qwen2.5-14B și Qwen2.5-32B oferă performanțe robuste în sarcini generale precum MMLU și BBH...

Performanță Qwen2.5-7B

Modelul Qwen2.5-7B depășește atât predecesorii, cât și concurenții săi într-o gamă largă de benchmark-uri.

Concluzii

Modelele Qwen2.5 reprezintă un progres semnificativ, oferind performanțe competitive într-o gamă variată de domenii și fiind optimizate pentru utilizare în aplicații diverse.


(Mediafax)


Linkul direct catre Petitie

CEREM NATIONALIZAREA TUTUROR RESURSELOR NATURALE ALE ROMANIEI ! - Initiativa Legislativa care are nevoie de 500.000 de semnaturi - Semneaza si tu !

Comentarii:


Adauga Comentariu



Citiți și cele mai căutate articole de pe Fluierul:

_ Crima de la Medicină! Andreea ar fi încercat să se apere până în ultima clipă de ucigașul Mirel. Raport șocant al legiștilor

_ Doliu imens la Hollywood: A murit un actor legendar, câștigător de Oscar

_ ANM face anunțul așteptat de toți românii: Ce se întâmplă cu vremea în următoarele două săptămâni

_ Un salt către neutralitatea carbonului: noul catalizator transformă dioxidul de carbon în metanol

_ ARNt ajută unele ARNm să se piardă în traducere

_ AI și algoritmii condiționați de gen creează modele precise pregătite pentru simulare a 600.000 de arbori urbani existenți

_ 'Cea mai bună din lume' Chitară lui Noel Gallagher a fost vândută la licitaţie pentru suma de 226.800 de lire sterline

_ Moment terifiant Proprietarii de pe Sunshine Coast descoperă un piton masiv prins de pisica lor de companie în curtea din spate

_ Dave Myers a murit: Partenerul de dans „Heartbroken” Karen Hauer și Paul Hollywood conduc omagiile aduse îndrăgitului prezentator TV Hairy Bikers după moartea sa la vârsta de 66 de ani

_ Un nou studiu dezvăluie trucul de a-ți face casa să se vândă cu milioane și să fie foarte căutată de cumpărători

_ Fundașul lui Newcastle, Botman, a exclus până la nouă luni

_ Costul ascuns al progresismului, Partea I

_ VIDEO Ambasadorul Israelului în România, mesaj de Învierea Mântuitorului: 'Fie ca lumina care strălucește în Ierusalim să aducă pacea în regiunea noastră'

_ În Namibia s-au încheiat alegerile prezidenţiale, favorită este candidata partidului SWAPO

_ VIDEO Tineri teribiliști, aproape de o tragedie: S-au urcat pe capota unei mașini, iar apoi mașina a făcut accident

_ Premierul britanic, 'șocat și trist' după anunțul Casei Regale / Ce dezvăluiri face despre starea de sănătate a Regelui Charles

_ Nicușor Dan, reacție după ce DNA a început urmărirea penală în cazul său: 'Două lucruri pot să vă spun'

_ Eduard Hellvig profețește despre un pericol uriaș pentru România: Ne putem trezi unde nici cu gândul nu gândim

_ Cine sunt soldații de elită care pot intra oricând în România: Klaus Iohannis le-a dat undă verde/ Video

_ Bogdan Rath, după meciul cu Italia: Am un gust amar, dar avem o evoluţie în creştere

_ Victor Micula, condamnat la 2 ani de închisoare cu executare. Sentiința nu este definitivă, iar fapta se prescrie în august

_ BBC a fost forțată să reprime starurile din Dragon's Den „după ce încalcă regulile” prin introducerea codurilor de reducere pentru a-și biciui produsele după spectacole

_ Inflația SuperCore crește în ianuarie, costurile serviciilor se reaccelerează

_ Vizualizarea creșterii explozive a fraudei bazate pe inteligența artificială

_ Aleksandar Vučić: Primirea Kosovo în Consiliul Europei înseamnă excluderea Serbiei

_ Aproape 100.000 de pacienți vârstnici suportă așteptări de 12 ore pe cărucioarele de urgență, unul care așteaptă cinci zile pentru a fi internat

_ Sunteți un economisitor compulsiv, un splurger sau un jucător de noroc? Descoperiți-vă personalitatea banilor și modul în care schimbarea acesteia vă poate ajuta să vă îmbogățiți

_ Elon Musk ia �n considerare faptul că Joe Biden transformă America �ntr-un �refugiu pentru cei mai răi criminali din lume!�

_ „Haitii va fi foame în curând”, în timp ce jafurile declanșează criza penuriei de alimente și societatea „cufundă în haos” – experții avertizează că „țara se prăbușește” în timp ce bătăușii liderului bandei „Grătar” preiau controlul

_ Vlad Botoș, europarlamentar USR, Dreapta Unită - la Chișinău viitorul comun al României și al Moldovei este în UE

_ „Ghidul audio LGBTQ” al Muzeului din Londra susține în mod greșit că monarhul britanic era „persoană de culoare”

_ Carlo Ancelotti se declară mulțumit de rezultatul meciului Bayern-Real: A fost un rezultat bun

_ Exploatarea dezordinelor pentru a recolta energie termică: potențialitățile magneților 2D pentru aplicații termoelectrice

_ Cetatea dacică Sarmizegetusa Regia, din Munţii Orăştiei, poate fi vizitată acum după programul de vară

_ Odată ce vezi titlurile „Al treilea război mondial”, ai putea la fel de bine să cumperi totul, deoarece de ce nu

_ Omul de știință planetar propune o teorie alternativă pentru ceea ce se află sub suprafețele lui Uranus și Neptun

_ Tocmai în: Joe Biden solicită 24 de miliarde de dolari în plus pentru un pachet de ajutor pentru Ucraina

_ Piersicile răspândite în America de Nord prin rețelele indigene, datarea cu radiocarbon și spectacolul de analiză a documentelor

_ În ultimii ani au existat 30 de tentative de obținere prin fraudă a cetățeniei RM, inclusiv de către 2 magnați ruși

_ Români și moldoveni sclavi în Spania. Poliția a destructura o rețea criminală din provincia Sevilla și a eliberat 21 de victime

_ Este timpul să anulăm America: Conferința RePlatform Freedom Economy vine la Las Vegas �n perioada 8-10 martie � Obțineți bilete acum!

_ Un deputat USR reclamă dezinteresul Ministerului Educaţiei în cazul reintegrării mamelor minore în învăţământ

_ Prințul Harry se va întoarce în Marea Britanie fără soția Meghan pentru evenimentul Invictus Games pentru prima dată de când Kate a dezvăluit că este supusă unui tratament pentru cancer - dar va face duke o vizită la cumnata sa cândva dragă?

_ „Niciun membru senior al familiei regale” nu se va alătura Prințului Harry la evenimentul Invictus din Marea Britanie, la care va participa și fără Meghan înainte ca cuplul să se angajeze în primul lor turneu regal neoficial în Nigeria.

_ Forțele Speciale din Rusia își pun toată speranța într-un băiat de 16 ani. Se apropie sfârșitul lui Kadîrov?

_ Oamenii de știință dezvăluie modul în care SID-1 recunoaște dsARN și inițiază interferența sistemică de ARN

_ Procesul penal al lui Donald Trump. Kremlinul şi Budapesta îl sprijină pe Trump, iar alţi aliaţi respectă procesul juridic din SUA

_ Bakkt crește cu 90% din raportul că compania Socal Media a lui Trump va cumpăra locul de tranzacționare criptografică

_ China launches first probe to collect samples from far side of Moon

_ Cea mai veche instalație de captare a peștilor din America Centrală descoperită în zonele joase Maya

_ Acesta este nenorocitul de însoțitor de bord: Stewardesa de moment amuzant se răstoarnă la produsele Duty Free la Roma

_ LIAM FOX: Vorbitorul a creat un precedent teribil... Trebuie să răspundem la întrebarea nu dacă, ci cum l-a presurizat Keir Starmer

_ Războiul din Ucraina. Rachetele ruseşti au ucis 20 de persoane în Odesa, Zelenski promite represalii

_ More than 6,300 Ukrainian citizens enter Romania on Sunday

_ Nu există doi viermi la fel: un nou studiu confirmă că chiar și cele mai simple organisme marine tind să fie individualiste

_ Inside the harrowing real-life story behind Under The Bridge: New Hulu series reveals how bullied Reena Virk, 14, was brutally murdered by gang of teens who lured her to a party with promises of friendship

_ VIDEO Ilie Bolojan, anunț tranșant: Epoca Iohannis în PNL s-a încheiat! Deciziile nu vor mai fi luate din exterior

_ Mâncărurile pe bază de carne, leguminoase sau orez tind să aibă o amprentă mai mare de biodiversitate, arată studiul

_ Emoțiile determină comportamentul de donație în proiecte de ameliorare a bolii pe o platformă de strângere de fonduri: Studiu

_ În Brazilia, speră să folosească inteligența artificială pentru a salva animalele sălbatice de soarta uciderii rutiere


Pag.1 Pag.2 Pag.3 Pag.4 Pag.5 Pag.6 Pag.7
Pag.8 Pag.9 Pag.10 Pag.11 Pag.12 Pag.13 Pag.14 Pag.15
Pag.16 Pag.17 Pag.18 Pag.19 Pag.20 Pag.21 Pag.22 Pag.23
Pag.24 Pag.25 Pag.26 Pag.27 Pag.28 Pag.29 Pag.30 Pag.31
Pag.32 Pag.33 Pag.34 Pag.35 Pag.36 Pag.37 Pag.38 Pag.39
Pag.40 Pag.41 Pag.42 Pag.43 Pag.44 Pag.45 Pag.46 Pag.47
Pag.48 Pag.49 Pag.50 Pag.51 Pag.52 Pag.53 Pag.54 Pag.55
Pag.56 Pag.57 Pag.58 Pag.59 Pag.60 Pag.61 Pag.62 Pag.63
Pag.64 Pag.65 Pag.66 Pag.67 Pag.68 Pag.69 Pag.70 Pag.71
Pag.72 Pag.73 Pag.74 Pag.75 Pag.76 Pag.77 Pag.78 Pag.79
Pag.80 Pag.81 Pag.82 Pag.83 Pag.84 Pag.85 Pag.86 Pag.87
Pag.88 Pag.89 Pag.90 Pag.91

Nr. de articole la aceasta sectiune: 5453, afisate in 91 pagini.