KGHM

Nowa technologia chłodzenia wielkich centrów danych

Nowa technologia chłodzenia wielkich centrów danych

Duże centrum danych może pochłaniać tyle prądu co całe miasto i zużywać miliony litrów wody dziennie tylko po to, by nie przegrzały się procesory trenujące modele sztucznej inteligencji. Ale Nvidia właśnie rzuciła na stół rozwiązanie, które na pierwszy rzut oka wydaje się absurdalne: chce chłodzić najmocniejsze superkomputery świata… gorącą wodą. I w tym szaleństwie naprawdę jest metoda – zaznaczył serwis Businessinsider.com.pl.

Nowe rozwiązanie może pozwolić sztucznej inteligencji rozwijać się dalej, jednocześnie dramatycznie chroniąc cenne zasoby słodkiej wody. Jeżeli sprawdzi się w praktyce, będzie to konkretna zmiana paradygmatu, która dotknie każdego z nas - wskazano.
 
Nvidia porzuca tradycyjne chłodzenie powietrzem lub bardzo zimną wodą na rzecz systemu direct-to-chip, czyli bezpośredniego chłodzenia cieczą. Na powierzchni najgorętszych elementów serwerów, czyli procesorów i kart graficznych, montowane są specjalne zimne płyty wykonane z metalu, wyposażone w wewnętrzne kanały. Przez te kanały przepływa płyn chłodzący, który natychmiast odbiera ciepło wytwarzane przez chipy. W odróżnieniu od starszych rozwiązań hybrydowych, w których część komponentów nadal chłodzono powietrzem, Nvidia projektuje systemy, w których praktycznie wszystkie elementy generujące ciepło są objęte obiegiem cieczy – czytamy.

Temperatura płynu na wejściu do serwera wynosi do 45 st. C, a po odebraniu ciepła wzrasta do około 55 st. C. Skład płynu to mieszanka w proporcji około 75 proc. wody i 25 procent glikolu propylenowego, co zapewnia odpowiednie właściwości przewodzenia ciepła oraz ochronę przed korozją i zamarzaniem. Ciepło odebrane przez płyn nie jest jednak marnowane w tradycyjny sposób. Zamiast tego trafia do zewnętrznych suchych chłodnic, nazywanych dry coolerami. Są to duże radiatory, w których płyn oddaje ciepło otaczającemu powietrzu bez konieczności jego parowania – wyjaśniono.

To rozwiązanie zostało zintegrowane z najnowszymi platformami Nvidii. Systemy oparte na architekturze Blackwell, takie jak GB200 NVL72, już korzystają z chłodzenia cieczą. Jeszcze dalej idzie generacja Rubin, w której Nvidia planuje wprowadzić pełne chłodzenie cieczą bez żadnych wentylatorów wewnątrz serwerów. Całość wspierana jest przez referencyjny projekt DSX, który stanowi kompletny zbiór wytycznych dotyczących projektowania, budowy i eksploatacji dużych fabryk sztucznej inteligencji z uwzględnieniem tej technologii chłodzenia – czytamy dalej.

Tymczasem tradycyjne centra danych od lat stanowią jeden z największych, choć często niedostrzeganych konsumentów słodkiej wody na świecie. Średnie centrum może zużywać od 11 do 19 mln l wody dziennie, co odpowiada zapotrzebowaniu małego lub średniego miasta – wskazano w informacji.

Firmy takie jak Google, Microsoft czy Meta raportują w ostatnich latach znaczący wzrost zużycia wody w swoich centrach danych, często o kilkadziesiąt procent rok do roku. Prognozy wskazują, że do 2030 r. globalny ślad wodny centrów danych obsługujących sztuczną inteligencję może odpowiadać rocznemu zapotrzebowaniu wody dla ponad miliarda ludzi. Do tego dochodzi woda zużywana pośrednio przy produkcji energii elektrycznej oraz przy wytwarzaniu samych chipów – zaznaczono.
 
W tradycyjnych systemach chłodzenia centrów danych dominowało podejście, w którym woda lub powietrze musiały być bardzo zimne, aby skutecznie odebrać ciepło z procesorów. Wymagało to stosowania energochłonnych agregatów chłodniczych, nazywanych chillerami, które działają na zasadzie sprężania czynnika chłodniczego i zużywają ogromne ilości prądu. Nvidia całkowicie odwraca tę logikę, podnosząc temperaturę płynu chłodzącego do poziomu 45 stopni Celsjusza na wejściu do serwera. Okazuje się, że wyższa temperatura płynu nie tylko nie przeszkadza w skutecznym chłodzeniu chipów, ale wręcz znacząco poprawia ogólną efektywność energetyczną całego obiektu – podkreślono.

Klucz tkwi w zasadach termodynamiki. Im wyższa jest temperatura płynu na początku procesu, tym łatwiej jest oddać odebrane ciepło do otoczenia bez dodatkowej interwencji mechanicznej. Przy 45 st. C płyn może skutecznie oddawać ciepło do zwykłego powietrza atmosferycznego za pomocą suchych chłodnic. Nie trzeba już schładzać wody do bardzo niskich temperatur, co eliminuje lub mocno ogranicza pracę sprężarek. Te urządzenia są jednymi z największych pożeraczy energii w tradycyjnych centrach danych i mogą odpowiadać za znaczną część kosztów operacyjnych - wskazano.

Dodatkowym atutem jest prosta zasada fizyczna dotycząca różnicy temperatur. Podniesienie temperatury zadanej w układzie chłodzenia o każdy jeden stopień Celsjusza pozwala zaoszczędzić około 3 do 4 proc. energii zużywanej na chłodzenie. W skali dużego centrum danych, którego moc chłodnicza sięga dziesiątków megawatów, takie oszczędności szybko przekładają się na miliony dolarów rocznie - podano.
 
Co więcej, chłodzenie w klasycznych rozwiązaniach pochłaniało nawet trzydzieści do czterdziestu procent całego zużycia energii obiektu. Przejście na wyższą temperaturę płynu pozwala tę wartość znacząco obniżyć i skierować większą część dostępnej mocy bezpośrednio do obliczeń zamiast na walkę z ciepłem – wyjasniono.

W praktyce oznacza to, że w wielu regionach świata centra danych oparte na rozwiązaniu Nvidii mogą działać bez chillerów przez większość roku. Sucha chłodnica wystarczy, aby utrzymać odpowiednią temperaturę płynu, a cały system staje się prostszy, tańszy w eksploatacji i mniej awaryjny. Ciepło odebrane z chipów nie jest marnowane, lecz może być w przyszłości odzyskane na przykład do ogrzewania pobliskich budynków. W ten sposób wyższa temperatura płynu nie tylko zmniejsza zapotrzebowanie na energię, ale również otwiera drzwi do bardziej zrównoważonego wykorzystania ciepła odpadowego - wskazano.
 
W klasycznych centrach danych wentylatory odgrywały kluczową rolę w odprowadzaniu ciepła. Poruszały ogromne ilości powietrza, które przepływało przez serwery i zabierało nadmiar ciepła z procesorów oraz innych podzespołów. Niestety, takie rozwiązanie ma poważne wady. Wentylatory zużywają znaczną ilość energii elektrycznej, generują wysoki poziom hałasu, często przekraczający 85 dB, i wymuszają specyficzną organizację przestrzeni w serwerowni. Serwery muszą być ustawione w taki sposób, aby tworzyły tak zwane zimne i gorące korytarze, co ogranicza gęstość upakowania sprzętu i zwiększa powierzchnię zajmowaną przez infrastrukturę – napisano.

Nvidia w swoich najnowszych rozwiązaniach całkowicie rezygnuje z tego podejścia. W generacji Rubin planowane jest pełne, stuprocentowe chłodzenie cieczą, w którym nie ma żadnych wentylatorów ani wewnątrz serwerów, ani w wielu elementach infrastruktury wspomagającej. Zamiast dmuchać powietrzem, ciepło jest odbierane bezpośrednio przez płyn krążący w zimnych płytach zamontowanych na chipach. Płyn ten ma około 1000 razy lepszą zdolność przewodzenia i magazynowania ciepła niż powietrze. Dzięki temu ta sama ilość ciepła może być odprowadzona przy znacznie mniejszej objętości medium i przy znacznie niższym zużyciu energii - podkreślono.

Brak wentylatorów przekłada się na kilka istotnych korzyści praktycznych. Po pierwsze, więcej dostępnej mocy elektrycznej może zostać przeznaczone bezpośrednio na obliczenia zamiast na napędzanie wentylatorów. Po drugie, serwery można ustawiać znacznie gęściej, bez konieczności zachowania szerokich korytarzy powietrznych. W efekcie na tej samej powierzchni fizycznej mieści się więcej mocy obliczeniowej, co jest szczególnie ważne przy rosnącej gęstości racków sięgającej nawet 120 do 135 kW na szafę. Po trzecie, poziom hałasu w obiekcie spada dramatycznie, co poprawia warunki pracy personelu i zmniejsza wymagania dotyczące izolacji akustycznej budynku – zaznaczono .
 
Dodatkowo uproszczenie infrastruktury mechanicznej oznacza mniejszą liczbę ruchomych części, co przekłada się na niższą awaryjność i mniejsze koszty utrzymania. Zamiast skomplikowanych systemów wentylacji i klimatyzacji precyzyjnej, centrum danych może polegać na prostszych obiegach cieczy i zewnętrznych suchych chłodnicach – wskazano.

Cały obiekt staje się bardziej kompaktowy, łatwiejszy w projektowaniu i tańszy w budowie oraz eksploatacji. W ten sposób usunięcie wentylatorów nie jest jedynie techniczną zmianą, lecz elementem szerszej strategii, która pozwala centrum danych osiągać wyższą efektywność przy jednoczesnym zmniejszeniu śladu środowiskowego – podkreślono .
 
W tradycyjnych systemach chłodzenia centrów danych woda często krąży w układach otwartych, w których część cieczy paruje, aby oddać ciepło do atmosfery. Ten proces parowania jest podstawą działania wież chłodniczych i jednocześnie głównym źródłem konsumpcyjnego zużycia wody. Każdego roku miliony galonów wody znikają bezpowrotnie z obiegu i muszą być stale uzupełniane. Nvidia całkowicie odchodzi od tego modelu, stosując wyłącznie zamknięte obiegi cieczy, w których płyn nie ma kontaktu z powietrzem i nie może parować - wyjaśniono.
 
W zamkniętym układzie ten sam płyn chłodzący, mieszanka wody z glikolem propylenowym, krąży w kółko przez cały okres eksploatacji centrum danych. Jest on napełniany jednorazowo podczas uruchamiania obiektu i następnie pozostaje w systemie. Jedyny możliwy ubytek wynika z ewentualnych nieszczelności, które w dobrze zaprojektowanej instalacji są minimalne. Dzięki temu zużycie wody spada praktycznie do zera w normalnych warunkach pracy. W referencyjnym projekcie DSX Nvidia deklaruje, że obiekt może funkcjonować bez jakiegokolwiek uzupełniania wody przez większość czasu, a jedynie w skrajnych sytuacjach klimatycznych, trwających około jednego procenta roku, może być konieczne krótkotrwałe włączenie dodatkowych urządzeń – wskazano dalej.

Taka konstrukcja niesie ze sobą szereg istotnych korzyści. Po pierwsze, centrum danych przestaje konkurować z mieszkańcami i rolnictwem o ograniczone zasoby słodkiej wody. Po drugie, znika konieczność ciągłego uzdatniania i uzupełniania wody, co obniża koszty operacyjne oraz zmniejsza ryzyko problemów związanych z jakością wody, takich jak osadzanie się kamienia czy rozwój mikroorganizmów. Po trzecie, zamknięty obieg jest znacznie bardziej przewidywalny i odporny na zmiany warunków zewnętrznych, ponieważ nie zależy od parowania, które w upalne dni może być mniej efektywne – wskazano. 
 
W połączeniu z wyższą temperaturą płynu i eliminacją wentylatorów zamknięty układ tworzy spójny system, w którym ciepło jest odbierane, transportowane i oddawane w sposób maksymalnie efektywny i oszczędny. Ciepło odpadowe może być w przyszłości łatwo odzyskane i wykorzystane na przykład do ogrzewania budynków lub procesów przemysłowych, zamiast być bezpowrotnie tracone wraz z parującą wodą. W ten sposób Nvidia nie tylko rozwiązuje problem zużycia wody, ale również przekształca centrum danych z dużego konsumenta zasobów w obiekt, który może stać się częścią bardziej zrównoważonego obiegu energetycznego i cieplnego – napisano.
 
Rozwiązanie proponowane przez Nvidię stanowi jeden z najbardziej obiecujących kroków w kierunku zrównoważonego rozwoju infrastruktury sztucznej inteligencji. Dzięki połączeniu wysokotemperaturowego chłodzenia cieczą, zamkniętych obiegów oraz eliminacji wentylatorów firma osiąga dramatyczną redukcję zarówno zużycia energii, jak i wody – podał serwis.
 
W warunkach normalnej pracy obiekt może funkcjonować praktycznie bez poboru świeżej wody na cele chłodzenia, co bezpośrednio odpowiada na jeden z najpoważniejszych zarzutów stawianych centrom danych w erze AI. Jednocześnie niższe zapotrzebowanie na energię elektryczną do chłodzenia zmniejsza pośrednie zużycie wody w elektrowniach, tworząc efekt podwójnej korzyści środowiskowej – podkreślono dalej.

W dłuższej perspektywie takie podejście pozwala na dalszy rozwój mocy obliczeniowej bez proporcjonalnego wzrostu presji na zasoby naturalne. Centra danych mogą być budowane w większej liczbie lokalizacji, również tych o ograniczonym dostępie do wody, ponieważ nie konkurują już z mieszkańcami czy rolnictwem o cenne zasoby. Wyższa efektywność energetyczna i wodna przekłada się również na niższe koszty operacyjne, co może przyspieszyć adopcję technologii przez operatorów i dostawców chmury. W ten sposób rozwój sztucznej inteligencji nie musi oznaczać automatycznego pogłębiania problemów środowiskowych - wskazano.

Oczywiście rozwiązanie Nvidii nie jest całkowicie pozbawione ograniczeń. W bardzo gorących klimatach nadal może być konieczne okresowe wsparcie agregatów chłodniczych, choć tylko przez krótki czas w roku. Skuteczność suchych chłodnic zależy również od warunków atmosferycznych, a pełne korzyści pojawiają się dopiero przy masowym wdrożeniu nowej infrastruktury. Dodatkowo należy pamiętać, że produkcja sprzętu oraz wytwarzanie energii elektrycznej wciąż generują pewien ślad środowiskowy, niezależnie od sposobu chłodzenia serwerów. Mimo to skala poprawy jest na tyle znacząca, że trudno ją porównać z jakimkolwiek wcześniejszym rozwiązaniem stosowanym w branży – wyjaśniono w podsumowaniu.     

Foto: Pixabay.com
Źródło: Businessinsider.com.pl 

Portal internetowy ForumBiznesu.pl

Portal internetowy ForumBiznesu.pl

Portal internetowy ForumBiznesu.pl

Portal internetowy ForumBiznesu.pl

Publish the Menu module to "offcanvas" position. Here you can publish other modules as well.
Learn More.