Некатегоризовано

Pristup optimizaciji svakog sloja infrastrukture

Summary

Čipovi su ključni igrači u oblasti oblačnih tehnologija. Posjeduju milijarde tranzistora koji procesiraju ogromne količine binarnih podataka koji protiču kroz podatkovne centre. Ovaj rad na kraju omogućava da se sve ono što vidite na vašem ekranu, od slanja e-maila do […]

Pristup optimizaciji svakog sloja infrastrukture

Čipovi su ključni igrači u oblasti oblačnih tehnologija. Posjeduju milijarde tranzistora koji procesiraju ogromne količine binarnih podataka koji protiču kroz podatkovne centre. Ovaj rad na kraju omogućava da se sve ono što vidite na vašem ekranu, od slanja e-maila do generisanja slike na Bing-u pomoću jednostavne rečenice, obavi brzo i efikasno.

Kao što izgradnja kuće omogućava da kontrolišete svaki dizajnerski izbor i detalj, tako i Microsoft vidi dodavanje sopstvenih čipova kao način da se obezbijedi da svaki element bude prilagođen namjeni Microsoft oblaka i sistema za veštačku inteligenciju. Čipovi će biti postavljeni na prilagođene server ploče, smještene u posebno prilagođene rackove koji se lako uklapaju u postojeće podatkovne centre. Hardver će blisko sarađivati sa softverom – zajedno su dizajnirani kako bi otključali nove mogućnosti i otvorili prostor za napredak.

Krajnji cilj je Azure hardverski sistem koji nudi maksimalnu fleksibilnost i može biti optimizovan za snagu, performanse, održivost ili cijenu, izjavio je Rani Borkar, korporativni potpredsjednik za Azure hardverske sisteme i infrastrukturu.

„Softver nam je osnovna snaga, ali iskreno, mi smo kompanija koja se bavi sistemima. U Microsoft-u zajedno sa partnerima dizajniramo i optimiziramo hardver i softver tako da jedan plus jedan bude veće od dva“, rekao je Borkar. „Imamo uvid u čitav sistem, a čipovi su samo jedan od sastojaka.“

HARDVERSKA INTEGRACIJA ZAJEDNO SA SOFTVEROM

Na Microsoft Ignite konferenciji, kompanija je takođe najavila opšte dostupnost jednog od tih ključnih sastojaka: Azure Boost, sistem koji ubrzava skladištenje i omogućava bržu mrežnu komunikaciju tako što te procese prebacuje sa host servera na specijalizovani hardver i softver.

Kako bi upotpunili svoje napore u izradi sopstvenog čipa, Microsoft je takođe najavio proširenje partnerstava sa industrijom kako bi pružio više opcija infrastrukture korisnicima. Microsoft je pokrenuo testno okruženje za novu virtualnu mašinu serije NC H100 v5 koja je izgrađena za NVIDIA H100 Tensor Core GPU, kako bi ponudio veću performansu, pouzdanost i efikasnost u razvijanju AI sistema srednjeg dometa i generativne AI inferencije. Takođe, Microsoft će dodati najnoviji NVIDIA H200 Tensor Core GPU u svoj sistem naredne godine kako bi podržao obradu većih modela bez povećanja latencije.

Kompanija je takođe najavila da će dodati AMD MI300X ubrzane VM na Azure. Virtuelne mašine ND MI300 su dizajnirane da ubrzavaju obradu AI radnih opterećenja za obuku AI modela visokog dometa i generativnu inferenciju, a sadrže najnoviju i najmoćniju AMD GPU, AMD Instinct MI300X.

Dodavanjem sopstvenih čipova postojećem okruženju čipova i hardvera industrijskih partnera, Microsoft će biti u mogućnosti da ponudi više opcija u pogledu cijene i performansi korisnicima, izjavila je Borkar.

„Naša opsesija korisnicima znači da pružamo ono što je najbolje za naše korisnike, a to znači da uzimamo ono što je dostupno u okruženju, kao i ono što smo sami razvili“, rekla je ona. „Nastavićemo da sarađujemo sa partnerima kako bismo isporučili korisnicima ono što žele.“

KOEVOLUCIJA HARDVERA I SOFTVERA

Novi Maia 100 AI Akcelerator kompanije Microsoft će pokretati neke od najvećih internih AI radnih opterećenja koja se izvršavaju na Microsoft Azure-u. Pored toga, OpenAI je pružio povratnu informaciju o Azure Maia i duboko je uvidio kako OpenAI radovi funkcionišu na infrastrukturi prilagođenoj za velike jezičke modele. Ovo će pomoći u oblikovanju budućih Microsoftovih dizajna.

„Otkako smo se prvi put udružili sa Microsoftom, sarađivali smo u dizajniranju Azure AI infrastrukture na svakom sloju za naše modele i neophodne trenutne obrade“, rekao je Sam Altman, izvršni direktor kompanije OpenAI. „Bili smo oduševljeni kada nam je Microsoft prvi put podijelio dizajn čipa Maia i zajedno smo ga doradili i testirali sa našim modelima. Azure-ova AI arhitektura, sada optimizovana do silikonskog nivoa sa Maia čipom, otvara mogućnost za treniranje još sposobnijih i jeftinijih modela za naše korisnike.“

Maia 100 AI Akcelerator je takođe dizajniran specifično za Azure hardverski sistem, rekao je Brian Harry, tehnički direktor zadužen za Azure Maia tim. Ta vertikalna integracija – usklađivanje dizajna čipa sa širim AI infrastrukturom koja je dizajnirana za Microsoft-ove radne opterećenja – može donijeti ogromne dobitke u performansama i efikasnosti.

„Azure Maia je specifično dizajnirana za AI i za postizanje apsolutnog maksimuma iskorišćenosti hardvera“, rekao je on.

Nasuprot tome, Cobalt 100 CPU je izgrađen na Arm arhitekturi, vrsti energetski efikasnog dizajna čipa, i optimiziran za veću efikasnost i performanse u ponudi cloud native proizvoda, izjavio je Wes McCullough, korporativni potpredsjednik za razvoj hardverskih proizvoda. Odabir Arm tehnologije je bio ključni element Microsoft-ovog cilja održivosti. Cilj je postići maksimalno iskorišćenje performansi po vatu potrošnje energije u svim podatkovnim centrima, što u osnovi znači da se dobija više računarske snage za svaku jedinicu potrošene energije.

„Arhitektura i implementacija su dizajnirane s naglaskom na energetsku efikasnost“, rekao je on. „Najefikasnije koristimo tranzistore na silikonu. Kada pomnožite te dobitke u efikasnosti na sve naše servere u svim podatkovnim centrima, to se zbirno povećava.“

PRILAGOĐENI HARDVER, OD ČIPA DO PODATKOVNOG CENTRA

Prije 2016. godine, većina slojeva u Microsoft oblaku se kupovala gotova, izjavio je Pat Stemen, menadžer partner programiranja u timu za AHSI. Tada je Microsoft počeo da izrađuje sopstvene servere i rackove, smanjujući troškove i pružajući korisnicima dosljedno iskustvo. Vremenom, čipovi su postali ključna komponenta koja je nedostajala.

Mogućnost izrade sopstvenog čipa omogućava Microsoftu da cilja određene karakteristike i osigura da čipovi optimalno funkcionišu na najvažnijim radnim opterećenjima. Njihov proces testiranja uključuje utvrđivanje na koji način će svaki pojedinačni čip performirati pod različitim frekvencijama, temperaturama i potrošnjom energije kako bi se postigle vrhunske performanse. Osim toga, vrši se testiranje svakog čipa u istim uslovima i konfiguracijama u kojima će se koristiti, bilo da je riječ o pojedinačnom čipu ili cijelom konfiguracijom u podatkovnim centrima.