Tajemnica chińskich superkomputerów
Komputery eksaskalowe to systemy, które byłyby w stanie obliczyć miliard miliardów obliczeń na sekundę. W tej chwili tylko jeden system oficjalnie osiągnął ten cel. Jednak istnieją poszlaki, że Chiny mogły stworzyć taką maszynę, a dokładnie dwie – ale chcą zachować to w tajemnicy.
Gdyby te pogłoski potwierdziły się Chiny umocniłyby swoją supremację superkomputerową nie jednym, ale dwoma eksaskalowymi systemami obliczeniowymi.
Komputery eksaskalowe – Chiny pierwsze?
Obie maszyny zostały ponoć stworzone w National Supercomputing Center w Wuxi w Chinach. Komputery — czyli system Sunway „Oceanlite” i Tianhe-3 — miały podobno osiągnąć szczytową wartość 1,3 eksaflopa. Jeśli to prawda, oznaczałoby to, że po raz pierwszy jeden superkomputer – nie mówiąc już o dwóch – osiągnął próg eksaskalowy.
Podobnie Chiny mogły osiągnąć cel obliczeń eksaskalowych, ale chcą zachować swoje innowacje w tajemnicy ze względu na delikatny klimat geopolityczny. Serwis Next Platform spekuluje również, że kraj chce uniknąć publikowania wyników testów porównawczych — na wypadek, gdyby amerykański superkomputer „Frontier” przewyższył je, gdy zostanie ujawniony w przyszłości. Oczywiście powodem może być to, że może to, że kraj nie osiągnął jeszcze eksaskali.
Te doniesienia, o których mówi się od zeszłej jesieni są godna uwagi nie tylko ze względu na obliczenia. Także na możliwą architekturę i samą skalę nowej maszyny. Stany Zjednoczone i Chiny biorą udział w globalnym wyścigu zbrojeń półprzewodników. To zmienia sposób, w jaki tradycyjnie porównujemy globalną potęgę superkomputerów.
Społeczność superkomputerów od dawna jest przyzwyczajona do publikowania wyników na liście 500 najpotężniejszych systemów na świecie (TOP500), w której te kraje aktywnie walczą o dominację. Jednak w związku z licznymi napięciami i występującymi przeciwnościami, wypaczającymi ducha międzynarodowej rywalizacji możemy oczekiwać, że Chiny będą milczeć w kwestii istotnych postępów systemowych.
Takim niewątpliwie jest fakt kraj przekroczył już barierę eksaskalową (true/LINPACK) w 2021 r. – na więcej niż jednej maszynie.
Oficjalnie amerykański Frontier
59. edycja TOP500 ujawniła, że pierwszą prawdziwą maszyną eksaskalową z wynikiem HPL wynoszącym 1,102 Exaflop/s jest system Frontier, znajdujący się w Oak Ridge National Laboratory (ORNL) w USA. Oparty na najnowszej architekturze HPE Cray EX235a i wyposażony w procesory AMD EPYC 64C 2GHz, system ma łącznie 8 730 112 rdzeni, wydajność energetyczną 52,23 gigaflopsa na wat i opiera się na gigabitowej sieci Ethernet do przesyłania danych.
Niedawny rozwój systemu Frontier pozwolił maszynie przekroczyć barierę 1 egzoflopa. Z dokładnym wynikiem HPL wynoszącym 1,102 Exaflop/s, Frontier jest oficjalnie nie tylko najpotężniejszym superkomputerem, jaki kiedykolwiek istniał, ale także pierwszą prawdziwą maszyną eksaskalową.
Pierwsze miejsce zajmował wcześniej przez dwa lata z rzędu system Fugaku w RIKEN Center for Computational Science (R-CCS) w Kobe w Japonii. Pozostając przy swoim poprzednim benchmarku HPL wynoszącym 442 PFlop/s, Fugaku spadł teraz na 2. pozycję. Biorąc pod uwagę fakt, że teoretyczny szczyt Fugaku znajduje się powyżej bariery 1 eksaflopa, jest powód, aby nazywać ten system również maszyną eksaskalową. Jednak Frontier jest jedynym systemem, który może to wykazać w teście porównawczym HPL.
Pragnący zachować anonimowość autorytet naukowy twierdzi, że chiński LINPACK został uruchomiony w marcu 2021 roku. Powstał na systemie Sunway „Oceanlite”, który jest kontynuacją czwartej maszyny Sunway TaihuLight. Wyniki przyniosły szczytową wydajność 1,3 eksaflopa przy stałej wydajności 1,05 w idealnym 35-megawatowym punkcie mocy.
National Supercomputing Center w Wuxi wykorzystuje 42 miliony rdzeni do trwałych superkomputerów eksaskalowych w pełnoskalowej produkcji symulacji kwantowych. Świat naukowy dowiedział się o tym pod koniec zeszłego roku, z zapowiedzi przed doroczną konferencją superkomputerową (SC21). Kontynuacja TaihuLight jest w stanie przeprowadzić symulację kwantową, która może być zrównoleglona w całej maszynie.
10 tysięcy lat w 300 sekund!
Nie zagłębiając się we wszystkie szczegóły kwantowe, zespół Wuxi, wraz ze współpracownikami z Tsinghua University i Shanghai Research Center for Quantum Sciences, opracował oparty na tensorze symulator losowych obwodów kwantowych. Jest on zoptymalizowany pod kątem gęstości obliczeniowej. Może „zredukować symulację” czasu próbkowania Google Sycamore do 304 sekund z poprzednio deklarowanych 10 000 lat!
Dzięki temu Chiny jako pierwsze państwo na świecie miałyby osiągnąć kamień milowy w zakresie wydajności HPC (High-performance computing – obliczenia o wysokiej wydajności). Ta dziedzina była przedmiotem miliardów dolarów amerykańskich inwestycji w ciągu ostatnich kilku lat. Utrzymanie tego faktu w tajemnicy jest z chińskiego punktu widzenia zasadne. Publiczne ogłoszenie za pośrednictwem listy Top500 zwróciłoby również uwagę na znaczące inwestycje materialne poczynione przez Chiny w rodzime technologie półprzewodników, sieci i oprogramowania.
Posiadanie HPC będącego uzupełnieniem istniejącej infrastruktury obliczeniowej na dużą skalę wśród firm takich jak Alibaba, Baidu, Tencent i innych w Chinach byłoby z jednej strony kolejnym powodem do dumy, z drugiej jednoznacznym dowodem na ich istnienie. Wszystkie te firmy naciskają na tworzenie własnych natywnych procesorów, akceleratorów i ekosystemów oprogramowania. Posiadanie superkomputerowej/badawczej strony rodzimych technologii byłoby kolejnymi oznakami siły.
W tym kontekście Chiny byłyby również w stanie zaprezentować systemy, które mogą obsługiwać zarówno HPC ogólnego przeznaczenia, jak i rozwijającą się sztuczną inteligencję. Kiedy opublikowano by wyniki prac symulacyjnych kwantowych w systemie Sunway, Chiny nie tylko pokazywałyby rzeczywistą, ściśle powiązaną wydajność HPC, ale także, że mogłyby obsługiwać złożone obciążenia o mieszanej precyzji, które są powszechne w sztucznej inteligencji.
Komputery eksaskalowe – nieograniczone możliwości zastosowań
Krótko mówiąc, będzie to reklamować zarówno sztuczną inteligencję, jak i możliwości symulacji. To cenny aspekt dla wszystkich powstających dużych systemów. Wszystko to bez konwencjonalnych procesorów graficznych Nvidia lub AMD, które systemy amerykańskie i europejskie wdrażają na potrzeby sztucznej inteligencji.
Najciekawsze jest to, że zamiast umieszczać na liście Top500, zespoły potwierdziły istnienie systemów poprzez zgłoszenia artykułów do nagrody Gordona Bella. Dla porównania, jest to najbardziej pożądana nagroda w dziedzinie superkomputerów poza najwyższym statusem systemu w Top500. W przypadku zgłoszeń dotyczących systemu Sunway, potwierdziły one, że maszyny istnieją i są w produkcji. A także wykazują wydajność i skalowalność – aczkolwiek z wyselekcjonowanym zestawem aplikacji.
To pokazuje, że Chiny chciały pokazać „rzeczywistą” produkcję i wykorzystanie tych systemów ponad zajmowanie czołowego miejsca na liście Top 500. A także korony pierwszego państwa, które osiągnęło eksaskalę. Zyskują uznanie za zalety techniczne bez umieszczania specyfikacji systemowych dla LINPACK lub bardziej skoncentrowanych na świecie testów porównawczych w HPC. Do takich jak HPCG, Graph500 lub Green500.
Być może jeszcze przez jakiś czas, może lata nie zobaczymy oficjalnych informacji o żadnych innych topowych maszyn dziesięcioklasowych z Chin. Nie dlatego, że ich nie ma, ale dlatego, że Państwo Środka wybierze inne drogi do ich nagłośnienia.
Czytaj także: Czy perowskity zastąpią krzem w fotowoltaice?