Opteron to seria procesorów serwerowych opracowanych przez AMD.
Od listopada 2009 roku, superkomputer Jaguar – Cray XT5 – działał na procesorach Opteron, zdobywając tytuł najszybszej maszyny na świecie w tamtym czasie.
Procesory jednordzeniowe
Opteron był pierwszym procesorem x86 ósmej generacji, który oparty był na jądrze AMD K8 oraz pierwszym, który wdrożył architekturę AMD64 (wcześniej znaną jako x86-64). Został on zaprezentowany 22 kwietnia 2003 roku, z przeznaczeniem na rynek serwerów oraz klastry obliczeniowe. Architektura Opterona wprowadziła wiele nowości: m.in. każdy procesor dysponuje własnym kontrolerem pamięci, co upraszcza chipsety płyt głównych i zwiększa ich niezawodność. W systemach wieloprocesorowych umożliwia to zwiększenie zarówno dostępnej pamięci, jak i przepustowości w miarę dodawania kolejnych procesorów.
Dzięki nowoczesnym technologiom, takim jak szybka pamięć DDR/DDR2 o niskim poborze mocy oraz sprzętowo wspomagana wirtualizacja (AMD Virtualization), najnowsze procesory AMD Opteron z architekturą Direct Connect umożliwiają lepszą wydajność w odniesieniu do zużywanej energii, oferując wirtualizację dla platformy x86 oraz ułatwiając przejście na systemy wielordzeniowe (planowane na III kwartał 2007 roku).
Do kluczowych cech Opterona należą:
- bezpośrednie wykonywanie kodu 32-bitowych i 16-bitowych aplikacji x86 bez spadków wydajności
- bezpośrednie wykonywanie kodu 64-bitowych aplikacji AMD64 (umożliwiających m.in. dostęp do pamięci RAM o rozmiarze większym niż 4 GiB)
- zintegrowany kontroler pamięci DRAM oraz szybki interfejs HyperTransport do komunikacji pomiędzy procesorami i chipsetem, a także przełącznik krzyżowy na płytce procesora
- wieloprocesorowa architektura NUMA
Pierwsza z wymienionych cech jest ważna, ponieważ w momencie debiutu Opterona, jedynym rywalem zdolnym do wykonywania kodu 32-bitowego x86 był Intel Itanium, który realizował to jedynie w trybie emulacji, co znacząco obniżało wydajność. Druga cecha jest kluczowa dla możliwości bezpośredniego adresowania pamięci RAM o pojemności przekraczającej 4 GiB. Gdy Opteron pojawił się na rynku, istniało już wiele procesorów 64-bitowych od czołowych producentów (np. Sun SPARC, DEC Alpha, HP PA-RISC, IBM POWER, SGI MIPS). Połączenie obu cech dawało Opteronowi przewagę pod względem kosztów oraz łatwości tworzenia 64-bitowego oprogramowania. Ważnym czynnikiem jest także zjawisko tzw. efektu skali, dzięki któremu procesory produkowane w dużych ilościach mogą być tańsze, a różnorodność wersji i osiągane częstotliwości pracy mogą być lepiej dostosowane do procesów technologicznych.
Architektura wieloprocesorowa
W systemach wieloprocesorowych (z więcej niż jednym procesorem Opteron i wspólną pamięcią), procesory te komunikują się poprzez architekturę Direct Connect z wykorzystaniem interfejsu HyperTransport (HT). Każdy procesor Opteron uzyskuje dostęp do pamięci podłączonej zarówno do lokalnego kontrolera pamięci, jak i do zdalnego (umieszczonego w innym procesorze) przez łącze Coherent HyperTransport (cHT). Proces ten jest przez oprogramowanie niewidoczny, a cała pamięć w systemie jest postrzegana jako jeden wspólny zasób. Taki sposób organizacji systemu wieloprocesorowego (NUMA) różni się od popularniejszego rozwiązania przetwarzania symetrycznego (SMP).
Opteron umożliwia tworzenie systemów z maksymalnie 8 procesorami (klasa serwerów midrange). Większe konfiguracje można tworzyć, łącząc systemy za pomocą dodatkowych układów (klasa enterprise). Warto zaznaczyć, że Opteron (podobnie jak wcześniejszy model Athlon MP) ma mechanizmy umożliwiające bezpośrednią współpracę do 14 procesorów w jednym systemie bez wsparcia dodatkowych układów, jednak te możliwości nie są obecnie wykorzystywane z powodu kosztów oraz braku wystarczającej liczby połączeń HT. Kolejna generacja procesorów będzie wyposażona w 4 łącza HT 3.0 (z których każde można podzielić na dwa łącza 8-bitowe), co umożliwi tworzenie efektywnych rozwiązań dla systemów 16-procesorowych.
Dzięki innowacjom wprowadzonym przez AMD, architektura systemów opartych na procesorach Opteron okazała się bardziej skalowalna niż konkurencyjne systemy bazujące na procesorach Intel Xeon. Wynika to z tego, że wraz ze wzrostem liczby procesorów Opteron, zwiększa się dostępna przepustowość pamięci operacyjnej, a zintegrowany kontroler pamięci RAM pozwala na osiągnięcie niższych opóźnień w dostępie do pamięci (nawet w przypadku przesyłu danych przez łącza cHT przy dostępie do zdalnej pamięci). Systemy oparte na Opteronie mają również dedykowane łącza HT do podłączania zewnętrznych urządzeń.
W przeciwieństwie do tego, systemy oparte na procesorach Intel Xeon korzystają z koncepcji wspólnej szyny FSB do komunikacji między procesorami, pamięcią i urządzeniami zewnętrznymi, co staje się wąskim gardłem systemu w miarę zwiększania liczby procesorów lub urządzeń. W najnowszych układach serii 85xx i 5xxx Intel przyjął koncepcję kilku szyn FSB połączonych przełącznikiem, co jest jednak znacznie bardziej złożone w implementacji i w przypadku procesorów wielordzeniowych Intela wciąż prowadzi do obniżenia wydajności całego systemu.
Procesory wielordzeniowe
W maju 2005 roku AMD wprowadziło na rynek pierwsze wielordzeniowe procesory Opteron, które były również pierwszymi wielordzeniowymi procesorami zgodnymi z architekturą x86. Obecnie termin „wielordzeniowe” w odniesieniu do AMD oznacza dwa rdzenie – każdy procesor Opteron składa się z dwóch rdzeni, przełącznika krzyżowego oraz kontrolera pamięci oraz interfejsów HyperTransport. Zintegrowanie dwóch rdzeni na jednym chipie pozwala na podwojenie teoretycznej mocy obliczeniowej procesora, a ponieważ koszt oraz stopień skomplikowania płyty głównej rosną szybko w miarę zwiększania liczby procesorów, takie rozwiązanie umożliwia budowanie bardziej wydajnych systemów przy tej samej cenie płyty głównej.
W wyniku wprowadzenia rozwiązań wielordzeniowych, AMD zmieniło system oznaczania procesorów. Dotychczasowy system składał się z trzech cyfr oraz ewentualnego dodatkowego członu SE/HE, gdzie pierwsza cyfra oznaczała maksymalną liczbę procesorów w systemie, dwie następne opisywały częstotliwość pracy, a oznaczenie literowe odnosiło się do wersji specjalnych z obniżonym lub podwyższonym poborem mocy. Na przykład, Opteron 875 ma dwa rdzenie działające z częstotliwością 2.2 GHz, podczas gdy Opteron 252 ma jedno rdzenie z częstotliwością 2.6 GHz. Procesory te są zgodne z podstawką Socket 940. Seria 1200 to procesory z dwoma rdzeniami do zastosowania w systemach jednoprocesorowych (1P/2C), seria 2200 to procesory dwurdzeniowe do systemów dwuprocesorowych (2P/4C), a seria 8200 to procesory dwurdzeniowe przeznaczone do systemów z czterema lub więcej procesorami (np. 4P/8C lub 8P/16C). Wymienione procesory korzystają z podstawki Socket F (Socket 1207).
Modele procesora
Pierwsza generacja procesorów Opteron posiadała trzycyfrowe oznaczenia modeli, podczas gdy następna generacja korzysta z oznaczeń czterocyfrowych.
Pierwsza cyfra oznacza maksymalną liczbę procesorów, jakie można zastosować w systemie:
- 1 – Przeznaczone do systemów jednoprocesorowych
- 2 – Przeznaczone do systemów dwuprocesorowych
- 8 – Przeznaczone do systemów od czterech do ośmiu procesorów
Kolejna cyfra (niedostępna w wersjach oznaczonych trzema cyframi) opisuje różnice między wersjami procesora, takie jak typ złącza (Socket AM2, Socket F), liczba rdzeni, rodzaj obsługiwanej pamięci RAM (DDR, DDR2) oraz wsparcie dla wirtualizacji. Ostatnie dwie cyfry charakteryzują model procesora pod kątem wydajności, co nie ogranicza się tylko do częstotliwości pracy, ale także obejmuje ilość pamięci cache oraz liczbę zintegrowanych rdzeni.
Dodatkowe oznaczenia w postaci liter HE lub SE wskazują na procesory w wersjach oszczędnych (HE – Highly Efficient, o obniżonym napięciu i częstotliwości) oraz wersje o podwyższonej częstotliwości (SE – Special Edition).
Opteron (130 nm SOI)
SledgeHammer (1yy, 2yy, 8yy)
- Jeden rdzeń
- CPU-Steppings: B3, C0, CG
- Cache L1: 64 + 64 KiB (dane + instrukcje)
- Cache L2: 1024 KiB
- MMX, Extended 3DNow!, SSE, SSE2, AMD64
- Socket 940, 800 MHz HyperTransport
- Wymagana pamięć: buforowana DDR SDRAM
- Funkcje RAS: ECC (RAM, Cache L1/L2), parzystość (Cache L2 instrukcji), Chipkill (RAM)
- Napięcie jądra VCore: 1.50 – 1.55 V
- Częstotliwość pracy jądra: 1400 – 2400 MHz (x40 – x50)
- Dostępne od: 22 kwietnia 2003 [1]
Opteron (90 nm SOI)
Venus (1yy), Troy (2yy), Athens (8yy)
- Jeden lub dwa rdzenie
- CPU-Steppings: E4
- Cache L1: 64 + 64 KiB (dane + instrukcje) dla każdego jądra
- Cache L2: 1024 KiB dla każdego jądra
- MMX, Extended 3DNow!, SSE, SSE2, SSE3, AMD64
- Socket 940, 800 MHz HyperTransport
- Socket 939/Socket 940, 1000 MHz HyperTransport
- Wymagana pamięć: buforowana DDR SDRAM (Socket 940), niebuforowana DDR SDRAM (Socket 939)
- Funkcje RAS: ECC (RAM, Cache L1/L2), parzystość (Cache L2 instrukcji), Chipkill (RAM)
- Napięcie jądra VCore: 1.35 – 1.4 V
- Zabezpieczenie NX-Bit
- Zarządzanie poborem mocy: Optimized Power Management (OPM)
- Częstotliwość pracy jądra: 1600 – 3000 MHz (x42 – x56)
- Dostępne od: 14 lutego 2005
Denmark (1yy), Italy (2yy), Egypt (8yy)
- Jeden lub dwa rdzenie
- CPU-Steppings: E1, E6
- Cache L1: 64 + 64 KiB (dane + instrukcje) dla każdego jądra
- Cache L2: 1024 KiB dla każdego jądra
- MMX, Extended 3DNow!, SSE, SSE2, SSE3, AMD64
- Socket AM2/Socket F, 1000 MHz HyperTransport
- Wymagana pamięć: buforowana DDR2 SDRAM (Socket F), niebuforowana DDR2 SDRAM (Socket AM2)
- Funkcje RAS: ECC (RAM, Cache L1/L2), parzystość (Cache L2 instrukcji), Chipkill (RAM)
- Napięcie jądra VCore: ? – ? V
- Zabezpieczenie NX-Bit
- Zarządzanie poborem mocy: Optimized Power Management (OPM)
- Częstotliwość pracy jądra: ? MHz (xxxx- xxxx)
- Dostępne od:?
Opteron (65 nm SOI)
Budapest (12yy), Barcelona (22yy, 82yy)
- Od dwóch do czterech rdzeni
- CPU-Steppings:?
- Cache L1: 64 + 64 KB (dane + instrukcje) dla każdego jądra
- Cache L2: 512 KB dla każdego jądra
- Cache L3: 2048 KB, dzielona
- MMX, Extended 3DNow!, SSE, SSE2, SSE3, AMD64, SSSE3
- Socket AM2/Socket F, 3200/3600 MHz HyperTransport 3.0
- Wymagana pamięć: buforowana DDR2 SDRAM (Socket F), niebuforowana DDR2 SDRAM (Socket AM2)
- Funkcje RAS: ECC (RAM, Cache L1/L2), parzystość (Cache L2 instrukcji), Chipkill (RAM)
- Napięcie jądra VCore: ? – ? V
- Zabezpieczenie NX-bit
- Zarządzanie poborem mocy: Optimized Power Management (OPM),?
- Częstotliwość pracy jądra: 1.7 – 3.0 GHz
- Dostępne od: 10 września 2007
Opteron (45 nm SOI)
Quad-core – Shanghai (23xx, 83xx)
- CPU-Steppings: C2
- L3-Cache: 6 MB
- Częstotliwość: 2300–2900 MHz
- HyperTransport 1.0, 3.0
Hexa-core – Istanbul (24xx, 84xx)
- CPU-Steppings: D0
- L3-Cache: 6 MB
- Częstotliwość: 2300–2900 MHz
- HyperTransport 3.0 do 4.8GT/s, HTA [2]
- Socket F (1207)
Zobacz też
Przypisy
Linki zewnętrzne
- Oficjalna strona AMD Opteron
- Dokumentacja techniczna AMD
- Specyfikacja techniczna AMD K8 Opteron. balusc.xs4all.nl. [zarchiwizowane z tego adresu (2006-05-11)].
- Specyfikacja techniczna AMD K8 Dual Core Opteron. balusc.xs4all.nl. [zarchiwizowane z tego adresu (2007-06-09)].
- Understanding the Detailed Architecture of AMD’s 64 bit Core