Video: CUBE TWO15 Race (November 2024)
Ko gledam napovedi in postopke prejšnjemesečne konference Supercomputing 15 (SC15) v Austinu, se mi zdi, da čeprav je visokozmogljivo računalništvo morda nekoliko zatišje, je to trg, ki je pripravljen na velike spremembe v letu, pridi.
Če pogledate voditelje na seznamu top500, ki je dvakrat letno na seznamu najhitrejših računalnikov na svetu, je že šestič zapored vodilni Tianhe-2, superračunalnik, ki ga je zgradila kitajska Nacionalna univerza za obrambno tehnologijo. Po seznamu top500 ta stroj zagotavlja 33, 86 petaflop / s (štiričetrdeset izračunov na sekundo) trajne zmogljivosti na Linpack referenčni vrednosti in 54, 9 petaflop / s teoretične najvišje zmogljivosti. Ta temelji na procesorjih Intel Xeon in Xeon Phi.
Drugo mesto še naprej pripada Titanu, sistemu Cray XK7, ki temelji na procesorjih AMD Opteron in GP-jih Nvidia K20x, nameščenih v nacionalnem laboratoriju Oak Ridge, s 17, 59 petaflopov / s stalne učinkovitosti na Linpack referenčni vrednosti.
Dva nova stroja sta dosegla 10. Najboljši računalnik Trinity v Nacionalnem laboratoriju Lawrence Livermore (LLNL) je šesti z 8, 1 petaflopa / s, medtem ko je sistem Hazel-Hen v nemškem Höchstleistungsrechenzentrum Stuttgart (HLRS) prišel na osmo mesto s 5, 6 petaflopa / s. Oba sta Cray XC, ki temeljita na procesorjih Intel Xeon z medsebojnim povezovanjem Aries.
Večje spremembe se zgodijo dlje po seznamu, zlasti ob velikem povečanju števila kitajskih sistemov, ki so narasli na 109 v primerjavi s samo 37 na prejšnjem seznamu. Deloma se zdi, da to prihaja iz več kitajskih sistemov, ki vodijo merila in oddajo rezultate za seznam. Posledično se je število ameriških sistemov zmanjšalo s 231 na 200, kar je najnižje število, odkar se je seznam začel leta 1993; število evropskih sistemov pa se je zmanjšalo s 141 na 108.
Eden od velikih trendov je povečanje števila sistemov, ki uporabljajo pospeševalnike ali koprocesorje, ki so se na trenutnem seznamu dvignili na 104 sistemov, v primerjavi z julijem 90. Večina teh sistemov uporablja Nvidia Tesla GPU, sledijo Intelovi Xeon Phi koprocesorji, nekateri pa uporabljajo kombinacijo. Nvidia je poudarila, da gre za 70 teh sistemov, od tega 23 od 24 novih sistemov na seznamu.
Na razstavi je Nvidia izpostavila rast pospeševalnikov, zlasti število aplikacij, ki so zdaj na voljo, optimizirane za podjetje CUDA arhitekturo. V podjetju pravijo, da je 90 odstotkov prvih 10 visokozmogljivih računalniških aplikacij in 70 odstotkov prvih 50 zdaj pospešenih. Zanimiva je uporaba sistemov, ki izvajajo simulacije vremena, kar je glavna aplikacija za visokozmogljivo računanje, saj vremenske napovedi izdelujejo vse vrste vlad. Cray je že pred tem na švicarskem uradu za meteorologijo (MeteoSwiss) opozoril na uporabo takšnih pospeševalnikov in se pogovarjal o tem, kako sodeluje z švicarskimi raziskovalci pri prepisovanju številnih aplikacij. Nvidia zdaj opozarja na uporabo pospeševalnikov s strani nacionalne uprave za oceano in atmosfero (NOAA) tudi za nekatere vremenske napovedi.
Cray se je med drugimi aplikacijami pogovarjal z naftnimi in plinskimi aplikacijami, na primer z uporabo 3D geofizike za simulacijo rezervoarja, pa tudi s finančnimi storitvami, kot je ocena tveganja. Takšne aplikacije redko sestavljajo najhitrejše sisteme na svetu, vendar so pokazatelj, da visoko zmogljivo računalništvo prevzame širšo vlogo pri večjih podjetniških aplikacijah. Cray je govoril o stalnem napredovanju k izvajanju večjih in podrobnejših modelov v vseh znanstvenih in inženirskih disciplinah ter o kombiniranju tradicionalnih delovnih obremenitev z analitiko.
Zanimala me je tudi napoved Linux Fundacije o novem prizadevanju, imenovanem OpenHPC, namenjenem ustvarjanju bolj odprtih standardov v svetu HPC. Zanimiva je ideja in takšna, za katero se zdi, da se je prijavilo veliko velikih igralcev.
V delu je več novih sistemov. IBM gradi nov stroj, imenovan Summit v Oak Ridge National Laboratories (ORNL), in drugi, imenovan Sierra v Nacionalnem laboratoriju Lawrence Livermore (LLNL), oba temelji na arhitekturnih procesorjih IBM Power, GPU-ji Nvidia Tesla in medsebojnih povezavah Mellanox. Vrh naj bi prinesel od 150 do 300 najvišjih petaflop / s, Sierra pa čez 100 petaflop / s.
Poleg tega Intel in Cray gradijo nov stroj z imenom Aurora, ki temelji na prihajajočih procesorjih Intel Xeon Phi Knights Hill za The Argonne Leadership Computing Facility (del Argonne National Labs), katerega cilj je 150 petaflopov v letu 2018. Vse to so del programa Ministrstva za energijo, imenovanega Collaboration of Oak Ridge, Argonne, in nacionalnih laboratorijev Lawrence Livermore (CORAL), katerega namen je pospešiti razvoj visokozmogljivega računalništva, in zlasti projekta FastForward 2.
Še vedno pa nas čaka dolga pot v smeri "izjemnega računalništva".
Vmes se je pojavilo več napovedi procesorjev, ki lahko pomenijo dobro prihodnost. Zlasti Nvidia je spodbudila uporabo superračunalnikov za hiperrazlične spletne aplikacije, zlasti za strojno učenje. Napovedal je nekaj nekoliko nižjih izdelkov: ploščo Tesla M40 s 3072 jedri CUDA, za katero je dejal, da je sposobna izvajati do 7 enotnih teraflopov / s, namenjenih predvsem usposabljanju "globokega učenja", in M4, nižja napajalna plošča z 1024 jedri in 2, 2 eno natančnimi teraflopi / s, ki jih je mogoče uporabiti za globoko učenje in tudi za obdelavo slik in videa. Poleg tega je podjetje napovedalo nov "hiperskrivni paket" z aplikacijami, usmerjenimi na največja računalniška mesta. Oba nova strojna izdelka temeljita na 28nm procesni tehnologiji in arhitekturi podjetja Maxwell.
Podjetje je že prihodnje leto napovedalo dve nadaljnji arhitekturi, znani kot Pascal, in Volta, ki ji bosta sledila. Intel se je osredotočil na to, kako HPC vpliva na znanost, mene pa je zanimal njegov opis, kako uporablja svoj lastni superračunalnik - trenutno 99. mesto na seznamu 500 najboljših - za pomoč pri oblikovanju lastnih procesorjev. Družba je zlasti povedala, da za načrtovanje fotomask za naslednjo generacijo procesorjev porabi milijon CPU ur.
Velik del Intelove dejavnosti je bil osredotočen na Knights Landing, naslednjo različico čipa Xeon Phi, ki ga je mogoče uporabiti kot pospeševalec, a tudi zagnati; in njegova tkanina Omni-Path. Čeprav Intel zdaj pravi, da bo splošna razpoložljivost v prvi polovici leta 2016, ima nekaj kupcev zgodnji dostop do Knights Landing. Trenutno Cray preizkuša velik sistem Knights Landing v pripravi za izdajo novega superračunalnika Cori za Nacionalni znanstveni računalniški center za raziskave na področju energije (NERSC) in Nacionalnega laboratorija Los Alamos in Nacionalnega laboratorija Sandia prihodnje leto. Bull, enota francoskega sistemskega integratorja Atos, je prejela tudi zgodnje različice Knights Landing za pripravo na sistem Tera 1000, ki ga gradi za francosko komisijo za alternativno energijo in atomsko energijo. Argonne Leadership Computing Facility deluje na sistemu, imenovanem Theta, ki naj bi bil dostavljen prihodnje leto, Sandia National Laboratories pa sodeluje s Penguin Computing za nadgradnjo več sistemov, ki uporabljajo prejšnje generacije soprocesorjev Xeon Phi.
Intel je že pred časom povedal, da bodo na voljo tri različne različice Knights Landing: osnovni gostiteljski procesor (ki se lahko samostojno zažene), gostiteljski procesor z integrirano tkanino Omni-Path in kartica za pospeševanje PCIe. Čip sam bo sestavljen iz 36 ploščic, vsaka z dvema procesorjema jeder (skupaj 72 jeder), štiri vektorske procesne enote (dve na jedro), 1 MB skupne predpomnilnice L2 in predpomnilno sredstvo za vzdrževanje skladnosti; Intel pa je dejal, da bi moral doseči približno trikrat večjo skalarno zmogljivost procesorja Knights Corner, s 3 teraflopov / s dvojno natančnostjo in 6 terapevtskimi vrsticami z eno natančnostjo. Uporablja tudi nov pomnilniški sistem, imenovan MCDRAM, pomnilnik v paketu z več kot 3-kratno razpoložljivo pasovno širino v primerjavi z izhodom na DDR4, kar se zdi, da je v hibridni arhitekturi Memory Cube različica, o kateri sta Intel in Micron govorila. Cray je imel na razstavi prototipni sistem, v katerem je bil zagonski Knights Landing, številni drugi prodajalci pa so prikazovali sisteme, zasnovane za Knights Landing. Tej različici Xeon Phi bo sledila različica z imenom Knights Hill, ki naj bo zgrajena na prihodnjem 10nm postopku.
Poleg tega je Fujitsu malo več spregovoril o svojem projektu Flagship 2020, ki temelji na novem čipu, znanem kot FX100 z 32 jedri. Pričakuje se, da bo to približno štirikratno zmogljivost s plavajočo vejico v primerjavi s trenutnim modelom FX10 in podobno kot Knights Landing bo tudi Fujitsujev FX100 uporabil različico hibridne arhitekture Memory Cube. Poleg tega ima NEC projekt z oznako Aurora (ki ni povezan s projektom CORAL), ki temelji na nadaljevanju čipa SX-ACE, vendar z večjo pasovno širino pomnilnika. Ta je ciljno usmerjena za leto 2017.