Domov Naprej razmišljanje Velike spremembe so končno na obzorju za superračunalnike

Velike spremembe so končno na obzorju za superračunalnike

2024

Video: Фильм 14+ «История первой любви» Смотреть в HD (November 2024)

Če pogledamo nazaj na tokratno konferenco o računalnikih ISC 17 o superračunalnikih, je videti, da bo svet superračunalnikov v naslednjih nekaj letih doživel velike nadgradnje, vendar posodobitev dvakrat letnega seznama Top 500 najhitrejših superračunalnikov na svetu ni bila kaj dosti drugačna od prejšnjo različico.

Najhitrejša računalnika na svetu sta še naprej dva množična kitajska stroja, ki sta že nekaj let na vrhu seznama: računalnik Sunway TaihuLight iz kitajskega nacionalnega centra za superračunalništvo v Wuxiju, z vzdržljivo zmogljivostjo Linpack, več kot 93 petaflopov (93 tisoč trilijonov plavajočih točk operacije na sekundo); in računalnik Tianhe-2 iz kitajskega Nacionalnega računalniškega centra za super računalnike v Guangzhouu z dolgotrajno zmogljivostjo več kot 33, 8 petaflopov. Ti ostajajo najhitrejši stroji z veliko rezervo.

Nova številka tri je sistem Piz Daint iz Švicarskega nacionalnega centra za računalništvo, sistem Cray, ki uporablja Intel Xeoni in Nvidia Tesla P100s, ki je bila pred kratkim nadgrajena, da bi ji Linpack zagotovil zmogljivost 19, 6 petaflopov, kar je dvakrat več kot prejšnji skupni rezultat. To ga je premaknilo s številke osem na seznamu.

S tem se je najboljši ameriški sistem - sistem Titan v Nacionalnem laboratoriju Oak Ridge - spustil na četrto mesto, tako da je to prvič po dvajsetih letih, da ameriški sistem ni med najboljšimi tremi. Preostali del seznama ostaja nespremenjen, saj ZDA še vedno predstavljajo pet od prvih 10, Japonska pa dva.

Tudi če se seznam najhitrejših računalnikov ni kaj dosti spremenil, so drugod velike spremembe. Na seznamu Green 500 najbolj zmogljivih sistemov se je spremenilo devet od prvih desetih. Zgoraj je sistem Tsubame 3.0, spremenjen sistem HPE ICE XA na tokijskem tehnološkem inštitutu, ki temelji na jedru Xeon E5-2680v4 14, medsebojnem povezovanju Omni-Path in Nvidijinem Tesli P100, ki omogoča 14, 1 gigaflops na vat. To je velik skok Nvidijinega DGX Saturn V, ki temelji na platformi podjetja DGX-1 in čipih P100, ki je bila tokrat številka ena na novembrskem seznamu, a tokrat številka deset, z 9, 5 gigaflops / Watt. P100 je v devetih prvih desetih sistemih Green500.

Razbijanje 10 gigaflopov / vata je velika težava, saj pomeni, da bi hipotetični sistem eksaflopov, zgrajen z današnjo tehnologijo, porabil manj kot 100 megavatov (MW). To je še vedno preveč - cilj je 20-30 MW za sistem ekseflopov, kar bodo raziskovalci upali opaziti v naslednjih petih letih - vendar je to velik korak naprej.

Tako kot na seznamu Top 500 je bilo tudi na podobnih seznamih le nekaj manjših sprememb z različnimi merili uspešnosti, kot je primerjalno gradivo High Performance Conjugate Gradients (HPCG), kjer stroji ponavadi vidijo le 1–10 odstotkov svojih teoretičnih vrhunskih zmogljivosti in kjer je vrh sistem - v tem primeru stroj Riken K - še vedno ponuja manj kot 1 petaflop. Na tem seznamu sta se pomerila tako sistem TaihuLight kot Piz Daint. Ko raziskovalci govorijo o stroju exaflop, ponavadi pomenijo referenčno vrednost Linpack, toda HPCG je glede na resnično delovanje morda bolj realističen.

Pojav grafičnega procesorja GPU kot pospeševalec - skoraj vedno z uporabo procesorjev Nvidia GPU, kot je P100 - je bila na teh seznamih v zadnjih letih najbolj vidna sprememba, ki mu je sledila uvedba Intelovega lastnega pospeševalnika, večjedrnega Xeon Phi-ja (vključno z najnovejša različica Knights Landing). Trenutni seznam Top 500 vključuje 91 sistemov, ki uporabljajo pospeševalnike ali koprocesorje, od tega 74 z GPU-ji Nvidia in 17 z Xeon Phi (pri drugih treh uporablja oba); enega z AMD Radeon GPU-jem kot pospeševalnikom in dva, ki uporabljata večjedrni procesor japonskega dobavitelja PEZY Computing. Dodatnih 13 sistemov Xeon Phi (Knights Landing) zdaj uporablja kot glavno procesno enoto.

Toda številne večje spremembe superračunalnikov so še vedno na obzorju, saj začnemo v mislih videti večje sisteme, zasnovane s temi koncepti. En primer je novi MareNostrum 4 v barcelonskem superračunalniškem centru, ki se je na seznam 500 uvrstil na številko 13. Kot doslej je bil nameščen, je to Lenovo sistem, ki temelji na prihajajoči različici Xeon-a Skylake-SP (uradno Xeon Platinum 8160 24 -core procesor). Tu so zanimivi trije novi grozdi "nastajajoče tehnologije", načrtovani v naslednjih nekaj letih, vključno z enim grozdom s procesorji IBM Power 9 in GPU-ji Nvidia, ki so zasnovani tako, da imajo najvišjo zmogljivost obdelave več kot 1, 5 Petaflops; drugi, ki temelji na verziji Xeon Phi-ja Knights Hill; tretji pa temelji na 64-bitnih procesorjih ARMv8, ki jih je zasnoval Fujitsu.

Ti koncepti se uporabljajo v številnih drugih velikih superračunalniških projektih, zlasti v več sponzoriranjih s strani ameriškega ministrstva za energijo v okviru sodelovanja CORAL v Oak Ridge, Argonne in Lawrence Livermore National Labs. Najprej bi moral biti Summit na Oak Ridgeu, ki bo uporabljal procesorje IBM Power 9 in GPU-jev Nvidia Volta in predvidel več kot 150 do 300 končnih petaflopov; Sledila je Sierra v Lawrence Livermoreu, ki bo prinesla več kot 100 najvišjih petaflopov.

Nato bi morali videti superračunalnik Aurora v Nacionalnem laboratoriju Argonne, ki temelji na verziji Xeon Phi-ja Knights Hill in ga je izdelal Cray, ki naj bi dosegel 180 vršnih petaflopov. Sistemi CORAL bi morali biti postavljeni in tek naslednje leto.

Medtem pa tudi kitajske in japonske skupine načrtujejo nadgradnjo, večinoma uporabljajo edinstvene arhitekture. Bilo bi zanimivo gledati.

Še večji premik se zdi le nekoliko bolj oddaljen: premik k strojnemu učenju, običajno na množično vzporednih procesnih enotah znotraj samega procesorja. Medtem ko se številka Linpack nanaša na 64-bitno ali dvojno natančnost, obstajajo razredi aplikacij - vključno z mnogimi aplikacijami, ki temeljijo na globokem nevronskem omrežju -, ki bolje delujejo z izračuni z eno- ali celo napol natančnostjo. To izkoristijo novi procesorji, kot sta nedavna napoved Nvidia Volta V100 in prihajajoča verzija Xeon Phi-ja Knights Mill. Intel je na razstavi dejal, da bo različica, ki naj bi bila v proizvodnji v četrtem četrtletju, imela nove nabore navodil za "računalništvo z nizko natančnostjo", imenovano Quad Fused Multiply Add (QFMA) in Quad Virtual Neural Network Instruction (QVNNI).

Predvidevam, da bi te koncepte lahko uporabili tudi za druge arhitekture, kot so Googlovi TPU-ji ali Intelovi FPGA in čipi Nervana.

Tudi če letos ne bomo videli velikih sprememb, bi naslednje leto morali pričakovati še več. Koncept stroja za izstrelitev (1000 teraflopov) je še vedno na vidiku, čeprav bo verjetno vključeval številne še večje spremembe.