HIPERKOMPUTER.pdf

(415 KB) Pobierz
Jak zbudowaæ hiperkomputer
hiper komputer
Thomas Sterling
Symulacje, rozwizywanie najwaýniejszych problemw ludzkoæci
i innych skomplikowanych zadaÄ wymagaj
znacznie szybszych superkomputerw
Zdj«cia: Olivier Laude
Jak zbudowa
27001931.002.png
SUPERKOMPUTERY
NAST¢PNEJ GENERACJI
OBECNE SUPERKOMPUTERY s zbyt wolne w sto-
sunku do potrzeb wsp¸czesnej nauki. Mimo rewolucji w ko-
munikacji i informatyce nie potrafi sprosta wielu wyzwa-
niom, zwizanym z rozwizywaniem zagadnieÄ numerycznych
kluczowych dla zdrowotnoæci, dobrobytu, bezpieczeÄstwa
i rozwoju ludzkoæci. Prze¸om w tak waýnych dziedzinach, jak
klimatologia, medycyna, nauki biologiczne, kontrolowana
synteza termojdrowa, obrona, nanotechnologia, zaawanso-
wana inýynieria i handel, zaleýy od powstania maszyn co naj-
mniej tysic razy szybszych niý najbardziej zaawansowane
wsp¸czesne superkomputery [ ramka na stronie 55 ].
Rozwizanie niebywale z¸oýonych problemw zaleýy od
wiernego, niezawodnego, a cz«sto d¸ugotrwa¸ego symulowa-
nia i modelowania procesw. Przekracza to wyranie moýli-
woæci dost«pnych superkomputerw, ktre s zdolne wyko-
nywa co najwyýej kilka bilionw operacji zmiennoprzecin-
kowych (dzia¸aÄ arytmetycznych) na sekund« (teraflopy). I tak
na przyk¸ad najwi«kszy istniejcy dziæ system potrzebowa¸by
ponad 100 lat, by przeprowadzi pe¸ne obliczenia fa¸dowania
bia¸ka. Aby wykona podobne zadania, naukowcy potrzebuj
hiperkomputerw o szybkoæci petaflopw, czyli realizujcych
przesz¸o biliard operacji zmiennoprzecinkowych na sekund«.
Obecnie najbardziej zaawansowane superkomputery s nie
tylko zbyt wolne, ale takýe za drogie. Trzyteraflopowe (maksy-
malna wydajnoæ) komputery Blue naleýce do systemu za-
rzdzania zasobami broni jdrowej Stanw Zjednoczonych
(ASCI Ð Accelerated Strategic Computer Initiative) kosztowa-
¸y z grubsza po 120 mln dolarw kaýdy. Stosunek ceny do ich
wydajnoæci szczytowej wynosi wi«c 40 dolarw za megaflop
(milion flopw), czyli 10 razy wi«cej niý w najlepszych kom-
puterach osobistych. Ale na tym nie koniec kosztw. Roczne
op¸aty za energi« elektryczn zuýyt przez system mog prze-
kroczy milion dolarw. Utrzymanie hal o duýej kubaturze to
takýe znaczny wydatek. Trudno teý pomin honoraria pro-
gramistw tworzcych z¸oýony kod dla tych maszyn.
Mimo godnej podziwu szybkoæci dzia¸ania moc obliczenio-
wa zaawansowanych systemw nie jest wykorzystywana efek-
tywnie. Ich sprawnoæ jest zdumiewajco niska Ð zazwyczaj
25%, a w niektrych zastosowaniach spada nawet do 1%.
SZYBKI KOMPUTER: system Blue o wydajnoæci trzech teraflopw
Ð jeden z elementw Accelerated Strategic Computer Initiative
zainstalowany w Lawrence Livermore National Laboratory Ð pomaga
utrzymywa w stanie gotowoæci zapasy broni jdrowej.
27001931.003.png
SZYBKIE UKüADY SCALONE: inýynierowie
w zak¸adach TRW Space Park w Redondo
Beach w Kalifornii nak¸adaj na pod¸oýa
krzemowe cienkie warstwy nadprzewodnika,
pos¸ugujc si« technik rozpylania jonowego.
Jest to jeden z etapw wytwarzania
prototypowych procesorw
nadprzewodnikowych.
¸oæci. Podstawowe sk¸adowe HTMT po-
wsta¸y dzi«ki pomocy finansowej NASA,
National Security Agency, National
Science Foundation oraz Defense Ad-
vanced Research Projects Agency; stwo-
rzenie dzia¸ajcego prototypu wymaga
dalszego finansowania przez rzd.
Jak na ironi«, wielki sukces techniki
komputerowej obnaýa jej s¸abe strony.
Pod koniec lat siedemdziesitych wydaj-
noæ komputerw osobistych umoýli-
wia¸a tworzenie jedynie prostych gier
zr«cznoæciowych. îwczesne systemy do
rozwizywania zadaÄ naukowych mia-
¸y wydajnoæ kilkudziesi«ciu megaflo-
pw i kosztowa¸y ponad 40 mln dola-
rw. Dla porwnania: dost«pne dziæ za
mniej niý 2 tys. dolarw komputery oso-
biste maj lepsz wydajnoæ.
Z perspektywy czasu stwierdzamy, ýe
budowanie superkomputerw zwi«kszy-
¸o wydajnoæ przetwarzania dzi«ki za-
stosowaniu zaawansowanych technologii
i architektury dostosowanej do specyficz-
nych zadaÄ. Niestety, efektem ubocznym
sta¸ si« wzrost ceny. Olbrzymie koszty
i d¸ugi czas projektowania sprawi¸y, ýe
odpowiedni segment rynku prawie si«
nie rozwija¸ w przeciwieÄstwie do innych
dzia¸w przemys¸u komputerowego, kt-
re niemal eksplodowa¸y. Koszty windu-
jce ceny ogranicza¸y rynek na super-
komputery, a w konsekwencji inwestycje
w t« technik«, prowadzc do klasycznej
handlowej spirali æmierci.
Mimo prb wprowadzenia rozwizaÄ
alternatywnych Ð w tym indywidualnej
architektury wektorowej komputerw
(pozwala ona efektywnie wykona poje-
dyncze operacje na cigach liczb dzi«ki
potokowemu dost«powi do pami«ci
i arytmetycznych jednostek funkcjonal-
nych) oraz pot«ýnych systemw rwno-
leg¸ych w postaci wielkich macierzy
wsp¸pracujcych mikroprocesorw Ð
koszty nadal by¸y wysokie, a efektywnoæ
w wielu zastosowaniach niska. W cigu
minionych dwchÐtrzech lat wiele ze-
spo¸w zbudowa¸o wysoce rwnoleg¸e
komputery oglnego przeznaczenia, kt-
Hybrydowa technologia wielowtko-
wa (HTMT Ð hybrid technology multith-
readed) to pomys¸ na komputery nowej
klasy o stokrotnie wi«kszych moýliwo-
æciach niý wsp¸czesne zaawansowane
maszyny, bez koniecznoæci podnoszenia
ceny, zwi«kszania zuýycia energii i ga-
barytw. W przysz¸oæci ich rozwj moýe
zaowocowa przekroczeniem biliarda
flopw, a wi«c granicy petaflopa, czyli
szybkoæci tysickrotnie wyýszych niý
obecnie. Interdyscyplinarny zesp¸ opra-
cowa¸ architektur« komputera, ktra ¸-
czy w sobie zaawansowane technologie
przetwarzania, pami«ci oraz komunika-
cji, co pozwala jak najlepiej wykorzysta
ich mocne strony i omin niedoskona-
54 åWIAT NAUKI WRZESIEÁ 2001
27001931.004.png
rych szczytowe szybkoæci przekraczaj
teraflop. Ale ich ma¸a sprawnoæ ozna-
cza, ýe jedynie niewielk cz«æ poten-
cjalnej mocy moýna wykorzysta w rze-
czywistych aplikacjach. W rezultacie
jedynym op¸acalnym rozwizaniem oka-
za¸y si« klastry robocze Ð po¸czone sie-
ci standardowe podsystemy komputero-
we. Ich rozwj nie wymaga wiele pracy
mimo trudnoæci w programowaniu
i opnieÄ w wymianie danych spowodo-
wanych komunikacj.
Badania nad systemami petaflopo-
wymi nowej klasy trwaj od po¸owy lat
dziewi«dziesitych. Inýynierowie pr-
buj pokona ograniczenia szybkoæci,
atakujc problem z wszelkich moýli-
wych stron i korzystajc z przerýnych
dost«pnych technologii. Jeýeli znajd
si« wystarczajce ærodki na prace ba-
dawczo-rozwojowe, trudnoæci uda si«
pokona w cigu 10 lat [ ramka na stro-
nie 56 ]. Chociaý kaýda metoda ma swo-
je plusy i minusy, jedn z najodpowied-
niejszych jest technologia HTMT.
HTMT wykorzystuje bogactwo rýnych
zaawansowanych rozwizaÄ do stworze-
nia jednego elastycznego i zoptymalizo-
wanego systemu. Celem projektu jest
osigni«cie szybkoæci na poziomie peta-
flopw dzi«ki po¸czeniu w dynamiczn
i zdoln do adaptacji architektur« super-
szybkich procesorw, ¸czy komunika-
cyjnych o duýej wydajnoæci, pami«ci o
wielkiej pojemnoæci i innych technolo-
gii, ktre wkrtce powinny osign doj-
rza¸oæ techniczn.
Niezaleýnie od obranej drogi wszyscy
konstruktorzy systemw petaflopowych
musz sprosta trzem wyzwaniom. Po
pierwsze, by osign za¸oýon szczy-
tow moc obliczeniow, trzeba po¸czy
w ca¸oæ zasoby wystarczajce do prze-
twarzania, przechowywania i wymiany
danych, przezwyci«ýajc trudnoæci zwi-
zane z gabarytami, kosztami i zuýyciem
energii. Po drugie, zapewni rozsdn
sprawnoæ dzia¸ania mimo standardo-
wych czynnikw, ktre j ograniczaj:
opnieÄ czasowych w systemie (zw¸o-
ki), rywalizacji o wsplne zasoby, jak
pami« i kana¸y komunikacyjne (kon-
tencji), redukcji zasobw wynikajcej
z koniecznoæci zarzdzania i koordyna-
cji wsp¸bieýnych zadaÄ oraz rwnole-
g¸ych zasobw (narzutu), marnotra-
wienia mocy obliczeniowych wskutek
niewystarczajcej rwnoleg¸oæci lub nie-
rwnomiernego podzia¸u obciýeÄ (za-
blokowania). Po trzecie, naleýy zwi«k-
szy uýytecznoæ systemu Ð parametru,
na ktry sk¸ada si« doæ arbitralna kom-
binacja czynnikw, takich jak uniwer-
salnoæ zastosowaÄ, moýliwoæ progra-
mowania i dost«pnoæ.
Procesory nadprzewodnikowe
W MINIONYM DZIESI¢CIOLECIU logika cy-
frowa by¸a realizowana g¸wnie z wy-
korzystaniem procesorw wytwarzanych
w technologii CMOS (complementary
metal oxide semiconductor). Dzi«ki niej
ograniczano zuýycie energii, zwi«kszano
wydajnoæ, zaæ g«stoæ upakowania mo-
g¸a rosn w tempie wyk¸adniczym. Ale
Podstawowe zadania hiperkomputerw
Wiele problemw naukowych o duýych implikacjach spo¸ecznych i politycznych moýna rozwiza, korzystajc tylko
z komputerw petaflopowych zdolnych wykonywa wi«cej niý biliard operacji zmiennoprzecinkowych na sekund«.
Modelowanie klimatu
Opracowanie prognoz pogody w skali krtko- i d¸ugoterminowej
to dla mieszkaÄcw Ziemi jedna z najwaýniejszych spraw.
Na pocztku komputery petaflopowe pos¸uý do porzdkowania
olbrzymiej iloæci danych z satelitw i wykonywania szczeg¸owych
map. Zgromadzone dane b«dzie moýna wykorzysta do symulacji
i modelowania chaotycznych i wzajemnie zaleýnych sk¸adowych
klimatu, dzi«ki czemu prognozy b«d precyzyjniejsze.
Obrona
Po wprowadzeniu powszechnego zakazu prb z broni jdrow
komputery petaflopowe pos¸uý do symulacji, ktre pozwol
utrzyma w gotowoæci zapasy broni strategicznej. Inne waýne
zadanie to rozszyfrowywanie w czasie rzeczywistym coraz
bardziej skomplikowanych kodw.
Handel i finanse
Analiza pot«ýnych baz danych dotyczcych handlu
i statystyk gospodarczych umoýliwi lepsz analiz« zjawisk
finansowych.
Kontrolowana synteza termojdrowa
Synteza termojdrowa Ð potencjalne lekarstwo na problemy
energetyczne æwiata i metoda nap«dzania statkw kosmicznych
przemierzajcych Uk¸ad S¸oneczny Ð to cigle jeszcze
przysz¸oæ. Komputery petaflopowe mog¸yby pos¸uýy do symulacji
oddzia¸ywaÄ termicznych, elektromagnetycznych i jdrowych
duýej liczby czstek w dynamicznym polu magnetycznym,
co pomog¸oby zaprojektowa reaktor termojdrowy.
Nanotechnologia
Wraz ze zmniejszaniem si« rozmiarw podstawowych elementw
elektronicznych do skali atomowej, w ktrej waýna staje si«
mechanika kwantowa, nie moýna juý d¸uýej pos¸ugiwa si«
uærednionymi wartoæciami parametrw.
Medycyna i nauki biologiczne
Wyrany wzrost mocy obliczeniowej komputerw sta¸by si«
or«ýem w walce z cigle ewoluujcymi chorobami.
Potrzebne s symulacje na poziomie czsteczkowym,
ktre przyæpiesz poszukiwanie nowych lekw i pomog
zrozumie skomplikowane procesy fa¸dowania bia¸ek.
Zaawansowana inýynieria
Moýliwoæ prowadzenia obliczeÄ z duý szybkoæci b«dzie
niezb«dna w przypadku symulowania w¸aæciwoæci nowych
materia¸w i kompozytw w mikroskali. Precyzyjne modelowanie
wykorzystane zostanie takýe do opracowania nowych konstrukcji
lotniczych i innych skomplikowanych systemw.
Rolnictwo
Wyýywienie stale wzrastajcej liczby mieszkaÄcw Ziemi
b«dzie wymaga uprawy genetycznie zmodyfikowanych roælin
i rozwizania æwiatowych problemw ekologicznych.
Superszybkie komputery u¸atwi te zadania.
Astronomia
Aby æciæle modelowa zachowanie si« galaktyki sk¸adajcej si«
ze 100 mld gwiazd, trzeba b«dzie uwzgl«dni ich oddzia¸ywania
z oærodkiem mi«dzygwiazdowym i ci«ýszymi czsteczkami,
wykorzystujc w tym celu superszybkie komputery.
WRZESIEÁ 2001 åWIAT NAUKI 55
27001931.005.png
CMOS to z pewnoæci nie najszybsza ze
znanych dziæ technologii cyfrowych.
Miejsce to zajmuje rozwizanie si«gaj-
ce do zupe¸nie innych podstaw fizycz-
nych Ð logika nadprzewodnikowa.
Istot nadprzewodnictwa odkrytego
na pocztku XX wieku jest zanik oporu,
ktry zwykle towarzyszy przep¸ywowi
prdu elektrycznego. Zjawisko wyst«-
puje w niektrych materia¸ach po sch¸o-
dzeniu ich do wystarczajco niskiej tem-
peratury. W zasadzie prd wzbudzony
w p«tli z nadprzewodnika moýe p¸yn
nieskoÄczenie d¸ugo. Co wi«cej, przy-
rzdy nadprzewodnikowe wykazuj w¸a-
æciwoæci charakterystyczne dla mecha-
niki kwantowej w skali makroskopowej,
w¸aæciwej rozmiarom elementw elek-
tronicznych. Na pocztku lat szeædzie-
sitych naukowcy opracowali nieliniowy
element prze¸czajcy oparty na nad-
przewodnictwie i dzia¸ajcy z niezwy-
k¸ szybkoæci Ð z¸cze Josephsona.
Projekt hiperkomputera HTMT zak¸a-
da wykorzystanie szybkich procesorw
nadprzewodnikowych bazujcych na
z¸czach Josephsona. W technologii
RSFQ (rapid single-flux quantum) ma-
leÄkie nadprzewodzce p«telki przecho-
wuj dane w postaci pojedynczych
kwantw strumienia magnetycznego Ð
ich obecnoæ przejawia si« w postaci
skokowej zmiany nat«ýenia prdu p¸y-
ncego w p«telce. P«tla znana powszech-
nie jako SQUID (superconducting
quantum interference device) to prosty
element Ð opracowany pocztkowo jako
czujnik Ð zbudowany z dwch z¸czy Jo-
sephsona po¸czonych przewodnikiem
i przypominajcy solenoid. Jeýeli w¸-
czone s obydwa z¸cza Josephsona,
prd wzbudzony w p«tli b«dzie w niej
p¸yn¸ bez koÄca. Interesujca w¸aæci-
woæ p«tli SQUID polega na wyst«po-
waniu w niej wyranych stanw. Prd
w p«tli moýe nie p¸yn wcale, moýe
przyjmowa pewn podstawow war-
toæ lub jej dowoln ca¸kowit wielo-
krotnoæ. Inne nat«ýenia prdu nie s
dozwolone. Ta cenna w¸aæciwoæ wyni-
ka z mechaniki kwantowej. Stany 0 i 1,
wymagane przez bramki logiczne,
w technologii RSFQ s reprezentowa-
ne przez dyskretne wartoæci nat«ýenia
Pi« innych sposobw ultraszybkiego przetwarzania
Jednym ze sposobw przekroczenia przez komputery granicy petaflopa (biliarda operacji zmiennoprzecinkowych na sekund«)
jest zastosowanie architektury hybrydowej, ¸czcej kilka zaawansowanych technologii przysz¸oæci (patrz g¸wny tekst) .
Poniýej podajemy kilka innych rozwizaÄ.
NAZWA
METODA
PRZYKüAD
NAJWAûNIEJSZE
ZASTOSOWANIA
1
ARCHITEKTURA
Architektura sprz«tu i oprogramowanie
Projekt Grape
Z¸oýone zagadnienia
SPECJALNA,
odzwierciedlaj struktur« rozwizywanego
(Uniwersytet Tokijski)
wieloobiektowe,
CZYLI MACIERZ
problemu. Przetwarzanie ma charakter
symulacje gromad
SYSTOLICZNA
rwnoleg¸y, z szybkimi potokami danych
gwiazd, bioinformatyka
w celu przyæpieszenia obliczeÄ
2
AUTOMATY
Automat ze skoÄczon liczb stanw
Nigdy nie zrealizowano
Obliczenia zwizane
KOMîRKOWE
zbudowany z wielu stosunkowo prostych
w pe¸ni dzia¸ajcego
z dynamik cieczy,
komrek liczcych, po¸czonych
prototypu
symulacja dyfuzji
w rozbudowan sie dwu- lub
trjwymiarow i sterowanych synchronicznie
zegarem. Zachowanie kaýdej komrki
zaleýy od jej wewn«trznego stanu
i stanw komrek ssiednich
3
ARCHITEKTURA
Dzi«ki umieszczeniu w jednym uk¸adzie
IRAM
Przetwarzanie obrazu,
PIM (PROCESOR
scalonym procesora i pami«ci o znacznej
(University
szyfrowanie danych,
W PAMI¢CI)
pojemnoæci obwody logiczne widz
of California
szybkie przeszukiwanie
jednoczeænie wszystkie bity na wyjæciu
w Berkeley),
baz danych,
pami«ci DRAM. üatwa dost«pnoæ pami«ci
Blue Gene (IBM)
modelowanie
i ma¸e opnienia w transmisji danych
fa¸dowania bia¸ek
zwi«kszaj stopieÄ wykorzystania kaýdego
cyklu na obliczenia
4
BEOWULF,
G«sta macierz tanich procesorw roboczych
Oprogramowanie
Analiza ludzkiego genomu
CZYLI
(kaýdy wyposaýony w prosty system operacyjny) GigAssembler
ARCHITEKTURA
po¸czonych g«st sieci o duýej przepustowoæci (International
KLASTROWA
Human Genome
Sequencing Consortium)
5
PRZETWARZANIE
Spoýytkowanie nie wykorzystanych cykli
SETI@home
Duýe zagadnienia rwnoleg¸e,
ROZPROSZONE,
zegarowych oko¸o 500 mln komputerw
(Serendip Project)
jak symulacje Monte Carlo
CZYLI ARCHITEKTURA
osobistych pod¸czonych do Internetu.
oraz monitorowanie dzia¸ania
MEGAKOMPUTEROWA Wad jest ma¸o wydajna komunikacja
Internetu
56 åWIAT NAUKI WRZESIEÁ 2001
27001931.001.png
Zgłoś jeśli naruszono regulamin