Data Center / Storage — December 16, 2024 at 1:13 pm

Pregătirea infrastructurii IT pentru sarcini AI

by

Pe măsură ce inteligența artificială (AI) remodelează economia globală și stimulează progrese extraordinare în diverse industrii, cererea pentru infrastructuri IT adaptabile crește exponențial. Vertiv explorează cum arhitectura centrelor de date și infrastructura critică trebuie să evolueze pentru a răspunde cerințelor AI, punând accent pe inovații și provocări care modelează viitorul.

1-handDatele sunt adesea comparate cu petrolul datorită potențialului lor transformator. Însă, la fel ca petrolul brut, datele necesită rafinare. Inteligența artificială este cheia care descătușează acest potențial, promițând să revoluționeze industriile și economiile globale. Potrivit McKinsey & Company, AI generativă ar putea adăuga anual până la 4,4 trilioane USD economiei globale, inclusiv 100 miliarde USD în telecomunicații, 130 miliarde USD în media și 460 miliarde USD în tehnologie avansată. În afara câștigurilor economice, AI promite descoperiri majore în medicină și în lupta împotriva schimbărilor climatice.

Totuși, pentru a valorifica pe deplin potențialul AI, este nevoie de un ecosistem robust. Centrele de date și infrastructura digitală critică trebuie să suporte transformări semnificative pentru a gestiona sustenabil sarcinile AI.

Infrastructura digitală critică care susține AI

Conform tendințelor actuale, 19% din consumul de energie al centrelor de date va fi asociat cu AI până în 2028. Ce înseamnă acest lucru pentru arhitectură, consumul energetic și răcire?

2-with-racksDeși nu domină titlurile de ziar, ascensiunea rapidă a AI perturbă deja arhitectura IT și infrastructura digitală critică a centrelor de date. Dar ceea ce vedem acum este doar începutul. Cerințele generate de AI creează blocaje în dimensiunea cipurilor, greutatea rack-urilor și consumul de energie și răcire. Se estimează că cheltuielile pentru infrastructura digitală critică destinată AI generative vor depăși 18 miliarde USD în 2024 și vor crește la peste 48 miliarde USD până în 2027.

„Când a fost introdusă metafora că datele sunt noul petrol, aceasta nu era complet exactă. Acum avem un instrument incredibil în AI, care poate exploata datele și dezvălui valoarea lor ascunsă. Dar acest lucru implică și necesitatea de a fi pregătiți pentru schimbările profunde ale infrastructurii care susțin AI”Stephen Liang, Director Tehnologic și Vicepreședinte Executiv, Vertiv

Ascensiunea AI va transforma centrele de date, necesitând o planificare atentă pentru a anticipa și aborda provocările emergente. Organizațiile care adoptă AI trebuie să colaboreze cu experți și să se pregătească pentru această evoluție.

Eficiența: o necesitate, nu o soluție

Un element esențial pentru AI sunt microprocesoarele. Cipurile utilizate pentru antrenarea modelelor AI consumă multă energie și generează căldură.

GPU-urile sunt cipurile preferate pentru sarcinile AI, oferind o eficiență de 100 de ori mai mare decât CPU-urile pentru sarcini de calcul paralele. Totuși, cerințele de calcul cresc exponențial, depășind ritmul îmbunătățirilor în eficiența cipurilor. Deși GPU-urile oferă mai multă putere de calcul pentru aceeași energie consumată, cerințele totale de energie vor continua să crească.

Cu toate acestea, dacă tendința actuală continuă, modelele care îmbunătățesc AI generativă vor deveni din ce în ce mai mari. Competiția dintre principalii jucători din industrie, precum OpenAI, Anthropic, Google și Meta, este alimentată de utilizarea unor modele tot mai ample, ceea ce duce la dublarea necesarului de calcul al acestor modele la fiecare șase luni.

Anticiparea viitorului infrastructurii IT

Conform paradoxului lui Jevons, o creștere a eficienței unei resurse determină, de fapt, o creștere a consumului acesteia, mai degrabă decât o reducere. Având în vedere numeroșii factori care par să alimenteze atât cererea pentru AI, cât și utilizarea unor modele mai mari, este greu de imaginat cum îmbunătățirile eficienței cipurilor sau modelelor ar putea compensa pe deplin numeroasele evoluții cu consum intens de resurse din domeniul AI. Cu alte cuvinte, viitorul ar putea deveni mai eficient, dar capacitatea de încărcare a infrastructurii IT va continua să crească pe parcursul acestui deceniu, în ciuda acestor câștiguri de eficiență.

Jucătorul american de baseball și filosof amator Yogi Berra spunea cândva: „Este greu să faci predicții, mai ales despre viitor,” o afirmație care se potrivește perfect evoluției infrastructurii necesare pentru AI.

Concret, următoarele tendințe necesită atenție:

Creșterea capacității: Rack-urile, PDUs, UPS-urile și echipamentele electrice vor necesita extindere.
Dimensiuni mai mari: Blocurile de 3 MW de azi ar putea deveni blocuri de 20 MW mâine.
Răcire hibridă și lichidă: Soluțiile trebuie să gestioneze sarcinile termice mari ale GPU-urilor.
Profiluri de încărcare neconvenționale: AI este asociată cu sarcini electrice care pot varia brusc, de la 10% în regim de repaus la 150% supraîncărcare, într-o fracțiune de secundă.
Actualizări ale infrastructurii: Sistemele existente trebuie modernizate pentru noile cerințe.

„Cred că arhitectura se va schimba profund, iar succesul depinde de anticiparea acestor schimbări. De exemplu, este esențial să ne întrebăm: «Cum planificăm pentru rack-uri de 250 kW sau mai mari?» Modul actual de operare nu mai este viabil, așa că este momentul să ne gândim la schimbare” – Gregory Ratcliff, Director de Inovare, Vertiv

Schimbări majore în infrastructura IT: arhitectură, energie și răcire

Peisajul infrastructurii IT suferă o transformare rapidă, determinată de evoluția arhitecturii GPU-urilor, rack-urilor și rafturilor. Aceste schimbări accelerează progresele în tehnologiile de alimentare cu energie și răcire.

Ascensiunea AI crește semnificativ densitățile rack-urilor, de la 30kW la 300-600kW pe termen scurt, cu proiecții de 1MW sau mai mult până în 2030. Deși progresele tehnologice și cerințele AI generează unele incertitudini, trendul este clar: infrastructura trebuie să evolueze pentru a răspunde acestor cerințe în creștere. După cum afirmă Peter Panfil, Vicepreședinte Global Power, Vertiv: „Lucrurile se schimbă mai repede acum decât oricând în ultimii 30 de ani. Pentru a gestiona această schimbare, trebuie să lucrăm împreună ca industrie pentru a stabili bune practici și designuri de referință. Este esențial să fim pregătiți pentru schimbările care deja au loc.”

Solutiile de răcire trebuie și ele să se adapteze. Deși răcirea pe bază de aer domină în prezent, cerințele tot mai mari de putere ale AI vor necesita răcire hibridă și pe bază de lichid. Până la sfârșitul deceniului, centrele de date vor depinde de răcirea liquid-to-chip, răcirea prin imersie și răcirea pe bază de aer pentru căldura reziduală. Steve Madara, Vicepreședinte Global Cooling, Vertiv, subliniază considerații esențiale: „Ascensiunea răcirii pe bază de lichid ar trebui să ridice câteva întrebări importante pentru cei care administrează centre de date. De exemplu, ‘Cum mă asigur că circuitul de lichid este stabil? Cum mă asigur că este redundant? Cum introduc un rack în sistem? Cum scot un rack din sistem?’ Acestea sunt toate lucruri la care oamenii trebuie să se gândească în contextul schimbărilor care vin.”

Managementul energiei reprezintă o altă provocare. Sarcinile AI prezintă încărcături pulsante, ceea ce duce la vârfuri în consumul curentului electric. În plus, se preconizează că consumul de energie al centrelor de date din SUA va crește cu o rată anuală compusă de 15% până în 2030, centrele de date reprezentând 8% din cererea totală de energie, față de 3% astăzi. Stephen Liang, Director Tehnologic și Vicepreședinte Executiv, Vertiv, subliniază importanța eficienței: „Unul dintre rolurile noastre astăzi este să facem energia disponibilă și să ne asigurăm că este folosită mai eficient în centrele de date. Trebuie să te asiguri că folosești energia pe care o ai într-un mod eficient.”

Modelarea viitorului

Deși detaliile tehnologice exacte rămân incerte, tendințele sunt clare: densități mai mari, metode de răcire inovatoare și provocări crescute în gestionarea energiei. Industria trebuie să acționeze rapid pentru a dezvolta soluții precum distribuție electrică de înaltă densitate, răcire lichidă avansată și gestionare optimizată a sarcinilor pentru centrele de date ale viitorului.