Aħbarijiet - Tħallix il-Ħżin Issir il-Konġestjoni Ewlenija fit-Taħriġ tal-Mudell

Ingħad li l-kumpaniji tat-teknoloġija jew qed iħabbtu wiċċhom ma' GPUs jew qegħdin fi triqithom biex jakkwistawhom. F'April, il-Kap Eżekuttiv ta 'Tesla Elon Musk xtara 10,000 GPU u ddikjara li l-kumpanija se tkompli tixtri kwantità kbira ta' GPUs mingħand NVIDIA. Min-naħa tal-intrapriża, il-persunal tal-IT qed jimbotta wkoll ħafna biex jiżgura li l-GPUs jiġu utilizzati kontinwament biex jimmassimizzaw ir-ritorn fuq l-investiment. Madankollu, xi kumpaniji jistgħu jsibu li filwaqt li n-numru ta 'GPUs jiżdied, l-idleness tal-GPU isir aktar sever.

Jekk l-istorja għallmitna xi ħaġa dwar il-kompjuters ta 'prestazzjoni għolja (HPC), huwa li l-ħażna u n-netwerking m'għandhomx jiġu sagrifikati għad-detriment li niffukaw wisq fuq il-komputazzjoni. Jekk il-ħażna ma tistax tittrasferixxi d-dejta b'mod effiċjenti lill-unitajiet tal-kompjuters, anki jekk għandek l-aktar GPUs fid-dinja, mhux se tikseb l-aħjar effiċjenza.

Skont Mike Matchett, analista fi Small World Big Data, mudelli iżgħar jistgħu jiġu esegwiti fil-memorja (RAM), li jippermettu aktar fokus fuq il-komputazzjoni. Madankollu, mudelli akbar bħal ChatGPT b'biljuni ta 'nodi ma jistgħux jinħażnu fil-memorja minħabba l-ispiża għolja.

"Ma tistax twaħħal biljuni ta 'nodi fil-memorja, għalhekk il-ħażna ssir saħansitra aktar importanti," tgħid Matchett. Sfortunatament, il-ħażna tad-dejta ħafna drabi tiġi injorata matul il-proċess tal-ippjanar.

B'mod ġenerali, irrispettivament mill-każ ta 'użu, hemm erba' punti komuni fil-proċess ta 'taħriġ mudell:

1. Taħriġ Mudell
2. Applikazzjoni għall-Inferenza
3. Ħażna tad-Data
4. Kompjuter Aċċellerat

Meta jinħolqu u jiġu skjerati mudelli, il-biċċa l-kbira tar-rekwiżiti jipprijoritizzaw ambjenti ta' prova ta' kunċett ta' malajr (POC) jew ta' ttestjar biex jinbeda taħriġ tal-mudelli, bil-ħtiġijiet ta' ħażna tad-dejta ma jingħatawx l-aqwa konsiderazzjoni.

Madankollu, l-isfida tinsab fil-fatt li t-taħriġ jew l-iskjerament tal-inferenza jistgħu jdumu għal xhur jew saħansitra snin. Ħafna kumpaniji jkabbru malajr id-daqsijiet tal-mudelli tagħhom matul dan iż-żmien, u l-infrastruttura trid tespandi biex takkomoda l-mudelli u s-settijiet tad-dejta li qed jikbru.

Ir-riċerka minn Google dwar miljuni ta' xogħol ta' taħriġ ML turi li medja ta' 30% tal-ħin tat-taħriġ jintefaq fuq il-pipeline tad-dejta tal-input. Filwaqt li r-riċerka tal-passat iffokat fuq l-ottimizzazzjoni tal-GPUs biex iħaffef it-taħriġ, għad fadal ħafna sfidi fl-ottimizzazzjoni ta 'diversi partijiet tal-pipeline tad-dejta. Meta jkollok qawwa komputazzjonali sinifikanti, il-konġestjoni reali ssir kemm tista 'tdaħħal id-dejta malajr fil-komputazzjonijiet biex tikseb riżultati.

Speċifikament, l-isfidi fil-ħażna u l-ġestjoni tad-dejta jeħtieġu ppjanar għat-tkabbir tad-dejta, li jippermettilek li kontinwament estratti l-valur tad-dejta hekk kif timxi 'l quddiem, partikolarment meta tidħol f'każijiet ta' użu aktar avvanzati bħal tagħlim fil-fond u netwerks newrali, li jqiegħdu talbiet ogħla fuq ħażna f'termini ta 'kapaċità, prestazzjoni, u skalabbiltà.

B'mod partikolari:

Skalabbiltà
It-tagħlim bil-magni jeħtieġ li jimmaniġġja ammonti kbar ta 'dejta, u hekk kif il-volum tad-dejta jiżdied, il-preċiżjoni tal-mudelli titjieb ukoll. Dan ifisser li n-negozji jridu jiġbru u jaħżnu aktar data kuljum. Meta l-ħażna ma tistax tiskala, il-piżijiet tax-xogħol intensivi fid-dejta joħolqu ostakli, jillimitaw il-prestazzjoni u jirriżultaw f'ħin inattiv tal-GPU għali.

Flessibilità
Appoġġ flessibbli għal protokolli multipli (inklużi NFS, SMB, HTTP, FTP, HDFS, u S3) huwa meħtieġ biex jissodisfa l-ħtiġijiet ta 'sistemi differenti, aktar milli jkun limitat għal tip wieħed ta' ambjent.

Latency
Il-latenza tal-I/O hija kritika għall-bini u l-użu ta' mudelli hekk kif id-dejta tinqara u tinqara mill-ġdid diversi drabi. It-tnaqqis tal-latenza tal-I/O jista 'jqassar il-ħin tat-taħriġ tal-mudelli b'jiem jew xhur. Żvilupp aktar mgħaġġel tal-mudelli jittraduċi direttament għal vantaġġi kummerċjali akbar.

Throughput
It-throughput tas-sistemi tal-ħażna huwa kruċjali għal taħriġ effiċjenti tal-mudelli. Il-proċessi ta’ taħriġ jinvolvu ammonti kbar ta’ data, tipikament f’terabytes fis-siegħa.

Aċċess Parallel
Biex jinkiseb throughput għoli, mudelli ta 'taħriġ jaqsmu l-attivitajiet f'kompiti paralleli multipli. Dan spiss ifisser li l-algoritmi tat-tagħlim tal-magni jaċċessaw l-istess fajls minn proċessi multipli (potenzjalment fuq servers fiżiċi multipli) simultanjament. Is-sistema tal-ħażna għandha timmaniġġja talbiet konkorrenti mingħajr ma tikkomprometti l-prestazzjoni.

Bil-kapaċitajiet pendenti tiegħu f'latenza baxxa, throughput għoli, u I/O paralleli fuq skala kbira, Dell PowerScale huwa komplement tal-ħażna ideali għall-kompjuters aċċelerati bil-GPU. PowerScale inaqqas b'mod effettiv il-ħin meħtieġ għal mudelli ta' analiżi li jħarrġu u jittestjaw settijiet ta' dejta b'ħafna terabyte. Fil-ħażna PowerScale all-flash, il-bandwidth jiżdied bi 18-il darba, u jelimina l-konġestjonijiet I/O, u jista 'jiġi miżjud ma' clusters Isilon eżistenti biex jaċċellera u jinfetaħ il-valur ta 'ammonti kbar ta' dejta mhux strutturata.

Barra minn hekk, il-kapaċitajiet ta 'aċċess multi-protokoll ta' PowerScale jipprovdu flessibilità illimitata għat-tħaddim ta 'tagħbija tax-xogħol, li jippermettu li d-dejta tinħażen bl-użu ta' protokoll wieħed u tiġi aċċessata permezz ta' ieħor. Speċifikament, il-karatteristiċi qawwija, il-flessibilità, l-iskalabbiltà, u l-funzjonalità ta’ grad intrapriża tal-pjattaforma PowerScale jgħinu biex jindirizzaw l-isfidi li ġejjin:

- Tħaffef l-innovazzjoni sa 2.7 darbiet, tnaqqas iċ-ċiklu tat-taħriġ tal-mudell.

- Elimina l-konġestjonijiet I/O u tipprovdi taħriġ u validazzjoni tal-mudelli aktar mgħaġġla, preċiżjoni mtejba tal-mudell, produttività mtejba tax-xjenza tad-dejta, u qligħ massimizzat fuq investimenti tal-kompjuters billi tisfrutta karatteristiċi ta 'grad ta' intrapriża, prestazzjoni għolja, konkorrenza u skalabbiltà. Ittejjeb il-preċiżjoni tal-mudell b'settijiet ta' dejta aktar profondi u b'riżoluzzjoni ogħla billi tisfrutta sa 119 PB ta' kapaċità ta' ħażna effettiva f'raggruppament wieħed.

- Ikseb skjerament fuq skala billi tibda komputazzjoni u ħażna żgħira u li tiskala b'mod indipendenti, u tipprovdi għażliet robusti ta' protezzjoni tad-dejta u sigurtà.

- Ittejjeb il-produttività tax-xjenza tad-dejta b'analiżi fil-post u soluzzjonijiet validati minn qabel għal skjeramenti aktar mgħaġġla u b'riskju baxx.

- Lieva ta' disinji ppruvati bbażati fuq l-aqwa teknoloġiji, inklużi l-aċċelerazzjoni tal-GPU NVIDIA u arkitetturi ta' referenza b'sistemi NVIDIA DGX. Il-prestazzjoni għolja u l-konkorrenza ta 'PowerScale jissodisfaw ir-rekwiżiti tal-prestazzjoni tal-ħażna f'kull stadju tat-tagħlim tal-magni, mill-akkwist u l-preparazzjoni tad-dejta għal taħriġ u inferenza tal-mudell. Flimkien mas-sistema operattiva OneFS, in-nodi kollha jistgħu joperaw bla xkiel fl-istess cluster immexxi minn OneFS, b'karatteristiċi fil-livell tal-intrapriża bħall-ġestjoni tal-prestazzjoni, il-ġestjoni tad-dejta, is-sigurtà u l-protezzjoni tad-dejta, li jippermettu tlestija aktar mgħaġġla tat-taħriġ tal-mudell u l-validazzjoni għan-negozji.

Ħin tal-post: Lulju-03-2023