CSL-Computer Shop

CSL-Computer: Blog

Infos und Hintergründe zu aktueller PC-Technik

CSL-Computer: Blog - Infos und Hintergründe zu aktueller PC-Technik

AMD Dual Graphics

Das Prinzip der Dual-Graphics-Lösung von AMD klingt vielversprechend:

dual

Man nehme eine APU mit integrierter Grafikeinheit, kombiniere diese mit einer dedizierten Grafikkarte und schon hat man eine Grafiklösung, die zum kleinen Preis hochklassige Gamingleistung liefert.

Eine echte Alternative zu teureren Grafikkarten sollte diese Option bieten. Bereits bei Einführung der ersten Generation der APU Kombi-Prozessoren vor einigen Jahren kündigte AMD diese Möglichkeit an, damals noch unter dem Namen Hybrid CrossfireX. Schnell zeigte sich jedoch, dass das Zusammenspiel der iGPU (integrierten Grafikeinheit) und der dedizierten Grafikkarte alles andere als ausgereift war. Mikroruckler und fehlerhafte Darstellungen konnten einem den Spaß am Spielen verleiden, so dass es lediglich in der Theorie eine echte Alternative zu leistungsstarken Grafikkarten blieb.

Seitdem wurden Veränderungen an AMDs Catalyst-Treiber durchgeführt, um die Probleme der Crossfire- und Hybrid Crossfire-Funktionen zu beheben.

Als im Oktober 2013 die neue „Hawaii“ Grafikkarten-Generation vorgestellt wurde, hatte man bei AMD bereits den Catalyst 13.8 Beta Treiber veröffentlicht, der ein funktionierendes Frame Pacing bot und einen einsatzfähigen Dual-Graphics-Modus der dedizierten R9 290X und R9 290 Grafikkarten ermöglichte.

Frame Pacing kontrolliert dabei die Synchronität der Grafikberechnungen beider GPUs im Dual-Modus. Die Ausgabe jedes einzelnen Frames wird angepasst, um eine möglichst gleichmäßige Bildausgabe zu gewährleisten.

Ende 2013 wurde mit dem Catalyst 13.12 erstmals eine finale Treiber-Version released, die Frame Pacing unter DirectX 10 und DirectX 11 sowie Auflösungen bis zu 2560 x 1600 Pixel unterstützt.

 

Vor einem Monat nun wurde die Treiber-Version Catalyst 13.35 Beta X bereitgestellt. Diese beinhaltet weitere Neuerungen: Frame Pacing funktioniert jetzt auch mit den kostengünstigeren R7 Grafikkarten. Höhere Auflösungen als 2560 x 1600 Pixel sowie die Multi-Monitor-Eyefinity und auch die APUs der ersten und zweiten Generation „Richland“ und „Trinity“ werden ebenfalls unterstützt.

Bei der Nutzung des Dual-Grafik-Modus ist Frame Pacing bereits in den Voreinstellungen des Catalyst Treibers aktiviert.

catalyst

Nun aber zu der wichtigsten Frage: Was bringt AMD Dual-Graphics effektiv?

Die Neuerungen seit Erscheinen des Catalyst 13.35 Beta Treibers scheinen sich auszuzahlen. Auf der Webseite von PC Perspective (englisch) befindet sich ein ausführlicher Test der neuen Funktionen und umfangreiche Spiele-Benchmarks. Getestet wurde mit den Games Battlefield 3, Skyrim, Bioshock Infinite, GRID 2 und Battlefield 4.

Es zeigt sich, dass bis auf Skyrim alle Titel von der verbesserten Performance der Dual-Grafik profitieren. Da Skyrim noch DirectX 9 nutzt und diese Version nicht von der Dual-Grafik unterstützt wird, entfällt hier die Performance. Battlefield 3 hingegen kann in der durchschnittlichen Framerate um bis zu 35% zulegen.

Um uns selbst ein Bild zu machen, haben wir eines unserer Systeme mit AMD Dual-Graphics ausgestattet und getestet.

Zum Einsatz kam ein System, das wie folgt konfiguriert war:

  • AMD A8-6600K APU („Richland“)
  • AMD Radeon R7-250 1 GB GDDR5
  • 8 GB DDR3 1600 MHz
  • MSI A78M-E35
  • 1000 GB HDD Western Digital
  • Windows 7 Home Premium 64-Bit SP1

Als Treiber-Version wurde Catalyst 14.2 V1.3 Beta verwendet und die Framerates wurden per FRAPS aufgezeichnet. Eine 2 Minuten Sequenz von Battlefield 4 in Low-Settings wurde als Referenz verwendet.

 

DUAL_BF4

Man sieht, dass die dedizierte Grafikkarte sowie die Dual-Grafik eine deutlich bessere Performance liefern als die reine APU-Leistung. Das war auch zu erwarten. Weniger groß ist allerdings der Unterschied zwischen der Leistung der R7-250 und der Kombination APU 6600K+R7 250.

Ausschlaggebend hierfür mag die Konfiguration des Testsystems sein. So wird in unserem Fall die Grafikleistung der APU durch den Arbeitsspeicher limitiert. Ein 2133 MHz getakteter RAM würde eine signifikantere Verbesserung darstellen, wie unsere bisherigen Tests zeigten. Auch eine Grafikkarten-Version mit DDR3-Speicher, die das Synchronisieren der Speichertaktung mit dem RAM einfacher macht, könnte das Frame Pacing verbessern.

Dennoch ergeben sich leicht verbesserte Höchstwerte sowie um ca. 10 % gesteigerte Durchschnittswerte für die Dual-Grafik-Lösung.

Vergleich_BF4

 

Seit Oktober befindet sich AMD auf dem Weg, die lang angekündigte Dual-Grafik, früher Crossfire / Hybrid-Crossfire, zur versprochenen Praxisreife zu bringen. Durch die Verbesserungen des Catalyst-Treibers im letzten halben Jahr scheinen die bisherigen Darstellungsprobleme der Vergangenheit anzugehören und auch die Unterstützung hoher Bildschirmauflösungen ist umgesetzt.

Inwieweit die Dual-Grafik-Lösung eine ernsthafte Alternative für das Gaming darstellt, ist diskussionswürdig. Da AMD den Einsatz der R7-Reihe plus APU empfiehlt, und damit die kleinen Karten der neuen Serie, darf man keine allzu großen Leistungssprünge erwarten. Der Performancezuwachs durch die Dual-Grafik  ist feststellbar, jedoch nicht so erheblich wie im Vorfeld erwartet.

Es bleibt abzuwarten, wie die Entwicklung der Dual-Grafik weitergehen wird. Eine echte Alternative zu dedizierten Grafikkarten der gehobenen Klasse kann die Dual-Grafik momentan noch nicht bieten. Für spielbare Performance zum kleinen Preis ist die Dual-Lösung jedoch eine echte Option.

AMD – Kaveri Release

Die-Shot Kaveri-APU

Die-Shot von Kaveri (Bild: AMD)

Man konnte fast annehmen, dass nach vielen wiederspüchlichen Aussagen, Dementi und Verschiebungen die neue APU-Generation von AMD, Kaveri, nicht auf dem Markt erscheinen würde, und doch ist sie nun endlich Anfang 2014 erschienen.

Was wurde nicht alles spekuliert und dementiert (siehe dazu unseren Beitrag „AMD Kaveri – Architektur„). In diesem Artikel wollen wir uns jetzt aber auf die konkreten Fakten konzentrieren.

CPU

Die neue APU-Generation kommt mit einer neuen Architektur und einer Vielzahl neuer Features.
Gefertigt werden die Prozessoren von Globalfundries im 28 nm Verfahren. Durch die feinere Struktur  konnte die Leistungsaufnahme (TDP) gesenkt werden. Auch wurde erstmals die neue Steamroller-Architektur verwendet, die auf gleicher Fläche mehr Transistoren unterbringt. Dadurch konnte die Effizienz der CPU gesteigert werden. Allerdings sinkt gleichzeitig auch die Taktfrequenz etwas ab, so dass bei allen aktuellen Modellen nicht mehr die MHz Zahlen wie bei den Vorgängern erreicht werden kann. Im Endeffekt bleibt somit die Rechenleistung im Vergleich zum Vorgänger etwa gleich.

GPU

Die Grafikeinheit (GPU) wurde auf Basis der aktuellen Radeon R7 Grafikkarten gefertigt und verwendet somit auch die neue Graphics Core Next-Architektur (GCN). Durch GCN kann die GPU neben DirectX 11.2 auch die neu entwickelte Mantle API verwenden. Die Kaveri APUs unterstützen zudem, bisher exklusiv, die Heterogeneous System Architecture (HSA) wodurch CPU und GPU deutlich besser zusammenarbeiten können. So kann die CPU mit hUMA (Heterogeneous Uniform Memory Access) gleichzeitig auf denselben Speicher zugreifen wie die GPU und somit, sofern die Software dies unterstützt, Rechenvorgänge deutlich schneller abarbeiten.

 Verfügbare CPUs

aktuell

aktuell verfügbare APUs

Zum Verkaufsstart bringt AMD zunächst zwei Kaveri-Varianten, worauf aber weitere folgen werden. Bisher erhältlich sind das Spitzenmodel A10-7850K und der etwas schwächere A10-7700K. Beide sind mit 4 CPU-Kernen ausgestattet.

Da AMD uns bereits einige Tage vor dem Release eine Version zum Testen zur Verfügung gestellt hat, hatten wir die Möglichkeit die neuen APUs ausführlich zu testen.

csl_benchmark

CSL-Benchmark

Deutlich erkennbar ist, dass die Performance des Systems vom verwendeten Speicher abhängt. Ebenfalls ist festzustellen, dass selbst anspruchsvollste Gaming-Highlights wie Battlefield 4 (zumindest im Kampagnen-Modus) mit diesen APUs gut spielbar sind. Stellt man ein solches System einem preislich vergleichbaren System mit Intel Core i5 CPU gegenüber, so hat die AMD APU hier eine bessere Performance und erreicht somit nach Meinung des Autors ein sehr gutes Ergebnis in dieser Preisklasse.

Sockel / Mainboard

Für die neuen APUs hat AMD wegen der 28 nm-Bauweise einen neuen Sockel entwickelt FM2+. Dieser ist abwärtskompatibel zu FM2 (also zu den Vorgängermodellen).  Alle namhaften Mainboardhersteller (ASUS, MSI, ASRock und Gigabyte) haben bereits für diesen Sockel neue Mainboards herausgebracht.

Fazit

In dieser Preisklasse eine klare Kaufempfehlung!

AMD Kaveri – Architektur

AMD Roadmap

AMD Roadmap

Auf der offiziellen AMD Roadmap wird „Kaveri“ (Die Kaveri ist ein Fluss im südlichen Indien, ist den Hindus heilig und wird daher oft auch „Ganges des Südens“ genannt) bereits im Jahr 2012 als kommende Entwicklungsstufe für Desktop CPUs erwähnt. Danach tauchten wiederum Gerüchte auf, diese CPU-Architektur sei komplett und ersatzlos von der Liste der x86-Architektur gestrichen worden. Dies wurde allerdings von AMD bestritten und stellte sich letztendlich auch als Fehlinformation heraus. Tatsächlich wurden die Richland-APUs dazwischen geschoben und vor Kaveri herausgebracht. Somit  waren sie der offizielle Nachfolger der erfolgreichen Trinity A-Serie von AMD.
Nachdem die Gerüchteküche also ordentlich die Abfolge der CPU-Generationen thematisierte, wurde nun um die Fähigkeiten der neuen APUs diskutiert und spekuliert. Hoch im Kurs stand hierbei der zu verwendende Speicher. Es wurde spekuliert, dass die Kaveri-CPUs nicht wie bisher üblich DDR3-Speicher, sondern den bisher nur in  Grafikkarten eingesetzten GDDR5-Speicher verwenden würden, wovon letzendlich die integrierte Grafikeinheit erheblich profitieren würde.

AMD Roadmap 2013

AMD Roadmap 2013

Doch all diese Gerüchte wurden nach einigem weiteren Hin und Her durch die Veröffentlichung der offiziellen Roadmap auf der Computermesse Computex in Teipei Lügen gestraft. Dort kündigte AMD ihre neue APU-Generation offiziell für Anfang 2014 (Auslieferung ab 14.01.2014) an.


Fakten

Was kann nun aber diese neue APU (Accelered Processing Unit) wirklich?
Sie kombiniert zwei Steamroller-Module mit einer GCN-Grafikeinheit (Graphics Core Next), ist nach der neuen 28 Nanometer Fertigung produziert und benötigt den neuen FM2+ Sockel, der jedoch abwärtskompatibel zu Trinity und Richland (FM2) ist. Diese Kombination ermöglicht mehr Leistung bei gleichzeitig höherer Effizienz (die TDP sinkt von 100 auf 95 Watt).
Darüber hinaus kann Kaveri erstmals dank HSA (Heterogeneous System Architecture) einheitlichen Speicher für CPU und GPU verwenden. AMD  nutzte dafür bei den Kaveri APUs Huma (Heterogeneous Uniform Memory Access), eine neu entwickelte Speicherarchitektur, die wohl die größte Neuerung der Kaveris wird. So kann die GPU Berechnungen von der CPU übernehmen und diese somit entlasten. Außerdem erhält Kaveri einen DSP-Kern, der Trueaudio berechnet und somit nicht nur den Klang verbessert, sondern ebenfalls die CPU entlastet.
Auch wird Kaveri die neue Mantle-API unterstützen, über die wir in unserem Blog bereits berichtet haben.

Fazit

Was Kaveri letztendlich an Leitungsplus entgegen Richland bringt, werden wir berichten wenn erste Leitungstests und genaue Spezifikationen verfügbar sind.
Derzeit wird spekuliert, dass Kaveri bis zu 30 Prozent mehr Leistung bringen könnte.

 

AMD Steamroller Architektur und Heterogeneous Queuing

Demnächst ist es wieder soweit: AMD bringt neue Technologien auf den Markt: Eine neue Architektur und das sogenannte Heterogeneous Queing. Aber was ist das alles eigentlich?
Fangen wir mit (hQ) an.
Bereits seit einiger Zeit sind onBoard-Grafikeinheiten leistungsfähig genug, um vollwertigen Gtafikkarten im unteren Leistungssegment Konkurrenz zu machen. Gerade da AMD hat mit den APUs, die CPU und GPU vereinen, eine starke Produktgruppe zur Hand. hQ ist ein neues Konzept von AMD, um die Verzahnung von CPU und GPU zu verbessern und somit noch mehr Leistung herausholen zu können.
Dazu richtet es für die CPU- und GPU-Aufgaben sogenannte Application Task-Queues ein, die die anfallende Arbeit verteilen können und dabei das Betriebssystem umgehen, wodurch Umwege über Kernel und Treiber verkürzt und somit für höhere Arbeitsgeschwindigkeiten sorgt.

Eine weitere Neuerung ist, dass die GPU nun auch die CPU mit Aufgaben versorgen kann. Bisher war die Beziehung zwischen CPU und GPU eine Master/Slave Beziehung, nun ist sie eine gleichwertige.

Diagrammdarstellung von Heterogeneous QueuingQuelle: Heise.de

Diagrammdarstellung von Heterogeneous Queuing
Quelle: Heise.de

Und auch wenn es möglich wäre, all dies über Software zu erreichen, so hat AMD sich dafür entschieden eine Hardwarelösung zu nutzen, die sich deutlich positiver auf die Performance auswirken soll. Und letztlich steht allen Heterogeneous System Architecture-Partnern eine direkte Schnittstelle zur Verfügung, so dass ihre Hardware direkt und schnell auf die CPU zugreifen kann und Applikationen wie Finanzsoftware, Bild- oder Videoverarbeitung können ihre Aufgaben dann optimal verteilen, um das Bestmögliche Ergebnis zu erzielen.
Interessant ist hierbei übrigens, dass Intel zwar mit C++-AMP etwas ähnliches, jedoch nur sehr stiefmütterlich behandeltes System offeriert und die AMP-Nutzerszene vergleichsweise klein ist.

Und Architekturen, gerade Steamroller?
Nun, immer wieder liest und hört man von den verschiedenen Architekturen, nach denen moderne CPUs aufgebaut sind. Im Falle von AMD ist dies meist die Bulldozer Architektur, deren Bezeichnung bisweilen auch um Piledriver ergänzt oder ersetzt wird. Und demnächst kommt Steamroller dazu.
Aber was genau hat es damit auf sich und was ist der Unterschied zwischen Bulldozer, Piledriver und Steamroller?
Bulldozer ist der Nachfolger von K10, beides von AMD entwickelte sogenannte Mikroarchitekturen. Mikroarchitektur bezieht sich hierbei auf die internen Abläufe bei der Befehlsverarbeitung und nicht den tatsächlichen, physischen Aufbau eines Prozessors.

AMD_Bulldozer_block_diagram_(CPU_core_bloack)

Bildliche Darstellung des Modul-Aufbaus der Bulldozer Architektur.
Quelle: Wikipedia.de

Im Gegensatz zum K10 Design basiert Bulldozer auf Modulen, von denen jedes von Betriebssystemen als zwei logische Prozessorkerne erkannt wird, was es möglich macht, bis zu acht Threads gleichzeitig ablaufen zu lassen.
2012 kam dann Piledriver – bei APUs auch als Trinity bekannt -, die erste Überarbeitung von Bulldozer. Änderungen umfassten unter anderem die Unterstützung von FMA3 (das Intel erst mit der Anfang 2013 eingeführten Haswell Architektur übernahm), sowie höhere Geschwindigkeiten in der Prozessverarbeitung.
Und nun steht die zweite Überarbeitung bevor: Steamroller, für APUs auch als Kavari bezeichnet, dass die auf Piledriver basierenden Richland-APUs ersetzen soll (mehr dazu im nächsten Blog-Beitrag).

Far Cry 3: Blood Dragon

blooddragonSeit kurzem bieten wir zu allen AMD A10-APUs das Spiel Far Cry 3: Blood Dragon an. Aber ist die Grafikeinheit in den APUs denn wirklich so leistungsfähig, dass Gaming mit ihr richtig Spaß macht?

Um diese Frage beantworten zu können, haben wir FC3: Blood Dragon auf einem unserer Angebots-PCs mit AMD A10-APU installiert und getestet.

Das Spiel

Wikipedia beschreibt den Open-World Ego-Shooter Far Cry 3: Blood Dragon folgendermaßen:

„Far Cry 3: Blood Dragon ist in einem neon-poppigen retrofuturistischen Stil der Achtzigerjahre gehalten. Die Charaktere, Handlung, Gewaltdarstellung und „Zeichentrickfilm“-Zwischensequenzen sind stilistisch stark überzeichnet, selbstironisch und wimmeln nur so vor schwarzem Humor und Referenzen zu Action- und Science-Fiction-Filmen der 1980er, wie beispielsweise Terminator und Predator. Far Cry 3: Blood Dragon hat keinerlei inhaltlichen Bezug zu Far Cry 3, sondern stellt ein eigenes Spiel dar.“  (Quelle: Wikipedia, http://de.wikipedia.org/wiki/Far_Cry_3:_Blood_Dragon )

Der Download

Dem PC liegt ein Promo-Flyer mit einem Bonus-Code bei, der auf der Internetseite von AMD eingelöst werden kann. Im Anschluss bekommt man einen neuen Bonus-Code für den Ubisoft Shop, mit dem das Spiel kostenlos heruntergeladen werden kann. Der Ablauf funktioniert soweit reibungslos, auch angekündigte E-Mails werden schnell zugestellt.

Einen kleinen Stolperstein gibt es jedoch: Aus Jugendschutzgründen kann der Kauf des USK16 Titels nur zwischen 22 Uhr und 6 Uhr durchgeführt werden. Dies gilt allerdings nur für den Kaufvorgang, der Download des Spiels kann danach mit Hilfe der kostenlosen Software Uplay zu beliebiger Uhrzeit durchgeführt werden. Die Verbindungsgeschwindigkeit ist gut – die 3 GB des Spiels brauchten weniger als 30 Minuten über eine 50 MBit Leitung.

Der Test

Unser Testkandidat ist der CSL Sprint 5764 (Quad). Mit aktuell (26.08.2013) 449,- Euro liegt das System preislich im Mittelfeld, der im CSL-Shop erhältlichen PCs mit AMD A10-APU.

Die Ausstattung des Test-Systems umfasst eine AMD A10-6800K Black Edition APU mit 4× 4100 MHz aus der aktuellen Richland-Generation und die ebenfalls im Chip verbaute Grafikeinheit AMD Radeon HD 8670D (4096 MB HyperMemory). Die APU sitzt, zusammen mit 16 GB RAM, auf dem ASUS A85XM-A Mainboard mit 7.1 HD Audio onBoard-Sound. Die Festplatte ist ein 1000 GB SATA Laufwerk.
Alle weiteren Ausstattungsmerkmale des PCs spielen für den Test keine Rolle.

Nach dem Start des Spiels wird man von einem Vorspann empfangen, der aus Standbildern, wie Comic-Panels, zusammengeschnitten ist und dem Autoren dieses Artikels spontan einen kleinen Nostalgie-Schub bescherte, denn so sahen Spiele auf seinem ersten PC aus. Die Zwischensequenzen, die den übergreifenden Handlungsstrang erklären sind ebenso gestaltet.

Bei aller Nostalgie ist es aber dennoch als Glück zu bezeichnen, dass die Ingame-Grafik trotz Retro doch recht hochwertig daherkommt, wenngleich auch sie, wie der Rest des Spiels, mit VHS typischen Scan-Lines und einer vertikalen Bildstörung versehen ist.

Nach einem ersten Feuergefecht als Teil des Vorspanns, in dem der Spieler ein Maschinengewehr in einem Hubschrauber bedienen muss, folgt eine amüsante Tutorial-Sequenz, in der die Steuerung ausführlich erläutert wird und ausprobiert werden kann.

Danach geht es dann, ganz wie man es von einem Ego-Shooter erwartet, direkt zu Sache …

 

In einem ersten Testlauf ließen wir die Grafikqualität-Einstellungen wie sie automatisch eingestellt wurden, d.h. „Allgemeine Qualität“ = „Optimal“, alle weiteren Eigenschaften sind hier auf „Niedrig“ eingestellt. Die Bildschirmauflösung lag bei 1920×1080 Pixeln.

Das Ergebnis kann überzeugen: Die Maps laden schnell und das Gameplay läuft wirklich flüssig ab, hier hat AMD nicht zu viel versprochen.
Die Texturen sehen trotz niedrigen Einstellungen ordentlich aus und auch Flammen und Rauch kommen ganz passabel rüber. Ein paar Abstriche muss man bei der Kantenglättung und den Lichteffekten hinnehmen, aber wirklich gestört hat das nicht, die Konzentration gehört halt doch der Action. Und so ein bisschen passen die kleinen Treppenstufen auf schrägen Kanten ja auch zum Retro-Stil des Spiels.

Jetzt wollten wir wissen, was sich alles aus der APU herausholen lässt und stellten die „Allgemeine Qualität“ auf „Ultra“, wobei alle weiteren Einstellungen auf Werte von „Hoch“ über „Sehr hoch“ bis „Ultra“ umgestellt werden. Die Bildschirmauflösung lag wiederrum bei 1920×1080 Pixeln.

Zwar bleibt das Spiel auch mit diesen Einstellungen einigermaßen spielbar, aber diverse Ruckler und ein eher gemächliches Vorankommen lassen sich hier nicht übersehen. Richtiger Spielspaß sieht anders aus.
An dieser Stelle sei erwähnt, dass im Erscheinungsbild keine Welten zwischen niedrigen und hohen Einstellungen liegen – ganz im Gegenteil: Wie schon erwähnt, passt die etwas unvollkommene Grafikqualität sehr gut zu Thema und Stil des Spiels.

Also schnell wieder die Einstellungen herabgesetzt und weiter geht es.

Fazit

Far Cry 3: Blood Dragon ist ein wirklich witziges und unterhaltsames Spiel, insbesondere für die Kinder der späten 1980er Jahre und Arcade-Freunde. Die onChip-Grafik der A10-APU ist dabei weder ein Hindernis noch ein Nachteil, sondern ermöglicht bei entsprechenden Einstellungen ein flottes und optisch recht attraktives Gameplay. Und wer hier noch etwas mehr mit verschiedenen Qualitäts-Einstellungen und Bildschirmauflösungen testet, findet sicher ein ausgewogenes Spielerlebnis mit Spaß für viele Stunden.

GPU-Computing

TeslaKeplerGK110_FNL_800_PR

Die Shot: NVIDIA Kepler GPU (Quelle: NVIDIA)

Mit dem Begriff GPU-Computing bezeichnet man den Einsatz von Grafikprozessoren als zusätzliche CPUs, wobei das Verfahren eigentlich GPGPU (General Purpose Computation on Graphics Processing Unit = Mehrzweck-Berechnung über den Grafikprozessor) heißt.

Die Ausführung von parallelen Algorithmen kann auf die Weise erheblich beschleunigt werden.

Entwicklung

Zunächst dienten Grafikprozessoren allein den Zweck, die Pixel von Bildschirmseiten zu berechnen und zu mehr war ihr Funktionsumfang, noch die kompletten neunziger Jahre hindurch, auch nicht in der Lage. Anfang dieses Jahrhunderts hat sich die grundsätzliche Systematik bei der Berechnung von Computergrafiken geändert, weil die stetig steigenden Anforderungen, besonders aus dem Bereich der Videospiele, nicht mehr mit der bis dahin genutzten Technik umgesetzt werden konnten. Nun mussten die Shader, so heißen die Recheneinheiten der GPUs, nicht nur immer mehr Pixel gleichzeitig berechnen können, sondern auch immer komplexere Funktionen für einzelne Pixel durchführen können, um z.B. aufwendige 3D-Effekte berechnen zu können.

Diese Entwicklung führte dazu, dass die Shader im Laufe der Zeit zu frei programmierbaren Recheneinheiten wurden, von denen in modernen Grafikkarten nicht selten rund 1000 Stück ihren Dienst verrichten.

Funktionsweise

Anders als CPUs, die darauf ausgelegt sind, ein bestimmtes Programm möglichst schnell auszuführen, versuchen GPUs möglichst viele Berechnungen gleichzeitig auszuführen. Dabei profitieren Sie von ihrer hohen Speicherbandbreite und der hohen Anzahl ihrer Recheneinheiten, obwohl die einzelnen Shader relativ simpel strukturierte „In-Order“ Prozessoren sind, d.h. auf jede Eingabe folgt eine Berechnung und ein Ergebnis. Die Techniken der Rechenkerne in modernen CPUs wie Sprungvorhersagen und spekulative Ausführung von Anweisungen kennen sie gänzlich nicht. Ebenso benötigen sie für ihre Arbeit keine der großen Cache-Speicher, über die CPUs verfügen.

Aus diesem Grund sind die Kerne in CPUs auch nicht mit den „Kernen“ in GPUs vergleichbar. Dafür ist es aber möglich, sehr viele Shader in einer GPU unterzubringen und hier liegt eben ihre große Stärke, in der parallelen, massenhaften Ausführung von Operationen.

Eine Software die GPGPU nutzt, besteht immer aus zwei Komponenten. Die eine Komponente regelt die Arbeit der CPU, übersetzt die Instruktionen an die GPU und steuert sowohl den Datenstrom zur GPU als auch den Rückstrom der Ergebnisse. Die andere Komponente enthält den Programmablauf für die GPU, sprich die Anweisungen, die in den Shadern ausgeführt werden sollen.

Damit das richtig gut funktioniert, braucht man neben der geeigneten Software auch eine geeignete Aufgabe. Am besten eine, bei der riesige Mengen von eigenständigen (Teil-) Berechnungen auszuführen sind, d.h. Berechnungen, die nicht von den Ergebnissen vorangegangener Berechnungen abhängen. Oder anders gesagt, eine Aufgabe, die sich gut parallelisieren lässt.

Kurzum mit der richtigen Software und der richtigen Aufgabe kann ein einfacher PC durch GPGPU zu einer Art Supercomputer gemacht werden. Aber eben auch nur dann.

Einsatzgebiete

Die hauptsächlichen Einsatzgebiete für GPGPU sind technische und wissenschaftliche Anwendungen, bei denen riesige Datenmengen analysiert und berechnet werden müssen, wie z.B. physikalische Simulationen, Klimamodelle, Finanzmathematik, Kryptographie und vieles mehr. Diese Aufgaben können sehr gut parallelisiert werden, weil massenhaft Einzelberechnungen durchgeführt werden müssen, die nicht von Vorergebnissen abhängen.

Wohingegen es im Bereich der privaten Computer-Nutzung fast keinen sinnvollen Einsatz dieser Technik gibt. Da typische Alltagssoftware Berechnungen ausführt, die sich schlecht bis gar nicht parallelisieren lassen und auch häufig keine ausreichende Wertemenge liefern, kann sie nicht oder nur sehr wenig von den Vorteilen des GPGPU profitieren.

Was sind das für Codenamen?

Wer Informationen über neueste Entwicklungen am Prozessoren-Markt sucht, stolpert zwangläufig über viele seltsame Bezeichnungen – Bulldozer, Sandy Bridge, Trinity oder auch Haswell, die neueste Mikro-Architektur von Intel. Dabei kann man schnell den Überblick verlieren und es wirft automatisch die Frage auf: Was sind das für Namen?

In der Entwicklungsphase geben die Hersteller ihren Projekten fast immer einen Codenamen. Je nachdem, ob es auf den Markt kommt oder sich die Veröffentlichung verzögert, verschwinden viele dieser Codenamen in der Versenkung.
Aber wie kommen die namhaften CPU-Hersteller, und hier beschränken wir uns bewusst auf AMD und Intel, zu den jeweiligen Codenamen?

Wenn man Intels Manager Arie Harsat glauben darf, muss der Name in erster Linie gut klingen und darf nicht die Markenrechte von Dritten verletzen.

“You might think there’s a lot of meaning behind the name, but the reality is I just tried to find a nice name that could pass the legal test,” said Arie Harsat, the strategic planning manager behind several of Intel’s prominent codenames including “Yonah,” “Merom” and “Sandy Bridge.”
(http://www.intelfreepress.com/news/origin-of-a-codename-ivy-bridge/48)

Gerade Intel ist in diesem Bereich ein gebranntes Kind. Nachdem man sich Mitte/Ende der 90er-Jahre einige Abmahnungen wegen seiner Codenamen einhandelte, nutzt man seitdem beim weltgrößten Prozessorenhersteller ausschließlich geografische Namen und lässt diese vorsorglich von der eigenen Rechtsabteilung auf Markenrechtsverletzungen prüfen.

Leider! – muss man sagen, denn Batman, Batman’s Revenge, Hendrixx (nach Jimi Hendrix) oder auch Zappa (Frank Zappa) – einige frühe Codenamen für Motherboard-Chipsätze – boten den Entwicklern Gelegenheit, ihren Helden zu huldigen.

Die Verantwortlichen bei Intel beziehen Ihre Inspiration mittlerweile aus der näheren Umgebung Ihrer Entwicklungsstätten. Der Codename „Haswell“ bezieht sich beispielsweise auf den Ort Haswell im US-Bundesstaat Colorado.

Ein anderes Beispiel bieten die bekannten Sandy Bridge-Prozessoren, die ursprünglich mit dem Codenamen „Gesher“, dem hebräischen Wort für Brücke, benannt werden sollten, um einem konsequenten Schritt zu neuen Ufern Ausdruck zu verleihen.
Nachdem man darauf kam, dass es eine ehemalige politische Partei in Israel gleichen Namens bereits gab, übersetzte man den Namen ins Englische und fügte ein „Sandy“ davor – vielleicht als Anspielung auf Sand, einem Hauptbestandteil von in der Prozessorproduktion verwendeten Siliziumscheiben. Die Ivy Bridge-Architektur stellt als Nachfolger der Sandy Bridge-CPUs eine Weiterentwicklung dar, von daher blieb die „Bridge“ erhalten und das Ivy (Efeu) kam dazu.

Eine genaue Aufstellung der Intel Codenamen und ihres Ursprungs findet man bei Wikipedia:
http://en.wikipedia.org/wiki/List_of_Intel_codenames

Beim zweiten großen Hersteller von Desktop-CPUs – AMD – ist eine solche Stringenz in der Namensgebung wie bei Intel nicht unbedingt zu erkennen. Die Codenamen der ersten Athlon-Generation beziehen sich z.B. auf edle Pferde (Thoroughbred / Palomino) oder Autotypen (Spitfire /Thunderbird / Morgan).

Später kamen dann auch geografische Ortsnamen dazu. Als Beispiele seien hier Oregon, Newcastle, Manila oder Palermo genannt. Auch erfreuten sich astronomische Sternenbilder großer Beliebtheit wie die Codenamen Regor, Rana, Deneb oder Sargas zeigen – oder auch ganz simpel „Stars“.

Die AMD „Bulldozer“-Serie, inklusive der optimierten „Piledriver“-Revision, steht z.B. in der Tradition eher rustikaler Namensvetter. Als Beispiele seien hier „ClawHammer“ (dt. Tischlerhammer /2003), „SledgeHammer“ (dt. Vorschlaghammer /2003) und „CopperHead“ (dt. Klemmkeil /2010) angeführt.

Bei all diesen Codenamen kann man schon einmal den Überblick verlieren und wahrscheinlich haben selbst die zuständigen Entwickler nicht immer hundertprozentig den Überblick über ihre Namenskreationen.

Wer einen umfangreichen Überblick über die Codenamen im Hardware- und Software-Bereich sucht, findet bei Wikipedia u.a. so illustre Namen wie Darth Vader, Catwoman, Godzilla, Hulk Hogan oder Obi Wan….möge die Macht mit Euch sein!

http://en.wikipedia.org/wiki/List_of_computer_technology_code_names

Richland APUs

APUsSeit wenigen Tagen ist die neue „Elite A-Series“ APU-Generation von AMD, Codename „Richland“, verfügbar. Wir haben uns angesehen, was die neuen APUs von der Vorgänger-Generation „Trinity“ unterscheidet.

Rechenkünste

Die neuen APU-Modelle sind mit 2 und 4 Kernen verfügbar, die auf der Piledriver Architektur von AMD basieren. Wie auch die Vorgänger-Serie „Trinity“, werden die „Richland“-APUs im aktuellen 32 nm Design gebaut und laufen ebenfalls auf FM2-Sockeln. Sicher eine gute Nachricht für alle Aufrüster bzw. Umsteiger, die damit kein neues Mainboard benötigen, sondern lediglich ein BIOS-Update, um eine „Richland“-APU auf ihren vorhanden FM2-Mainboards laufen zu lassen.

Am grundsätzlichen Aufbau hat sich also nicht viel geändert, auch die Anzahl der Transistoren auf dem 246 mm² großen DIE ist mit 1,3 Milliarden gleich geblieben. Allerdings macht AMD den kleinen Schaltern mehr Dampf. Die Taktfrequenzen wurden bei allen „Richland“-APUs um 300 MHz angehoben, gleiches gilt auch für die jeweiligen Turbo Modi, so dass das Spitzenmodell A10-6800K nun mit satten 4,1 GHz (Turbo: 4,4 GHz) daher kommt und es das Einsteiger-Modell A4-4000 immerhin auf 3,0 GHz (Turbo: 3,2 GHz) bringt.

Weiterhin wird ein DDR3-Speichertakt von 1866 MHz unterstützt, einzig das Spitzenmodell A10-6800K unterstützt 2133 MHz, was sich nicht nur positiv auf die CPU-Leistung auswirkt, sondern auch die Grafikleistung etwas beschleunigen dürfte, da auch die GPU den Arbeitsspeicher verwendet.

Bei der elektrischen Leistungsaufnahme bleibt AMD auf Energiesparkurs und gibt für die neue Generation TDPs (Thermal Design Power -> Maximal abgegebene Wärmeleistung) von 65 W bis 100 W aus, was gegenüber einer gleichwertigen Kombination aus CPU und dedizierter Grafikkarte recht wenig ist.

GrafikpowerAPU_Radeon

Die integrierten Grafikeinheiten der neuen APUs rangieren nun im Radeon HD 8xxx Bereich, allerdings sind hier keine revolutionären Neuerungen gegenüber der „Trinity“-Serie umgesetzt worden.

Die DirectX-11 GPUs der zweiten Generation basieren nach wie vor auf der VLIW4-Architektur, allerdings hat AMD auch hier die Taktfrequenzen leicht angehoben und verschiedene Features aus der dritten Generation aufgenommen. So stehen den Grafikeinheiten der „Richland“-APUs der „Unified Video Decoder“ und die „Video Codec Engine“ zur Verfügung, mit denen HD-Inhalte mit bis zu 60 fps im Chip decodiert werden können. Außerdem können mit dem „Multi View Codec“ zwei HD-Streams gleichzeitig beschleunigt werden. Zusätzlich werden Features wie die AMD Wireless-Display-Technologie, Cloud-Gaming und CrossFire unterstützt und AMD hat die 3D-Performance weiter verbessert.

So sollte man sich auch nicht von Eindruck täuschen lassen, es handele sich „nur“ um eine GPU der zweiten Generation, denn AMD bleibt mit den „Richland“-APUs weiterhin der Platzhirsch bei den integrierten Grafikeinheiten und hängt selbst die GPUs aus Intels aktueller „Haswell“-Generation ab.

Bei vielen aktuellen Spielen machen die neuen APUs eine gute Figur, wenngleich bei hohen Auflösungen teils auf ein paar Detaileinstellungen verzichtet werden muss. Wem die Grafikleistung nicht ausreicht, kann dank Unterstützung von AMD Dual Graphics  kostengünstig und energiesparend aufrüsten, in dem er einen zusätzlichen Grafikchip aus der Radeon HD 6xxx Reihe in den PCI-Express Slot steckt. Laut AMD kann die Grafikleistung so um den Faktor 1,5 verbessert werden.

 

Modell

Kerne

Basistakt

max. Turbo

L2-Cache

Grafik

Takt / Shader

TDP

A10-6800K

4

4,1 GHz

4,4 GHz

4 MiByte

HD 8670D

844 MHz / 384

100 Watt

A10-6700

4

3,7 GHz

4,3 GHz

4 MiByte

HD 8670D

844 MHz / 384

65 Watt

A8-6600K

4

3,9 GHz

4,2 GHz

4 MiByte

HD 8570D

844 MHz / 256

100 Watt

A8-6500

4

3,5 GHz

4,1 GHz

4 MiByte

HD 8570D

800 MHz / 256

65 Watt

A6-6400K

2

3,9 GHz

4,1 GHz

1 MiByte

HD 8470D

800 MHz / 192

65 Watt

A4-4000

2

3,0 GHz

3.2 GHz

1 MiByte

HD 7480D

720 MHz / 128

65 Watt

Überblick über die einzelnen „Richland“-APUs

Welche Leistungsfähigkeit benötigt mein PC

CSL-PC

Jeder, der sich schon einmal einen PC kaufen wollte, hat sich bereits die Frage gestellt „Was möchte ich mit dem PC machen?“ und die darauf folgende Frage „Was brauche ich dafür?“.

Nicht viele können sich diese Frage bei der großen Anzahl verschiedener Komponenten und Hersteller selbst beantworten. Die Allerwenigsten kennen die genauen Funktionen der einzelnen Bauteile in einem PC. Wie viel Arbeitsspeicher brauche ich, wenn ich mit Bildbearbeitungsprogrammen arbeiten möchte? Welche Grafikkarte ist für aktuelle Games geeignet? Und welche CPU ist für meine Anforderungen optimal? Diesen Fragen wollen wir auf den Grund gehen.

 

CPUCPU

Bei der Wahl der richtigen CPU stellt sich zunächst einmal die Frage nach dem Hersteller (AMD oder Intel®) und der Anzahl der Kerne, die der Prozessor haben soll.

Für einfache Büroarbeiten und das Surfen im Internet reicht ein DualCore–Prozessor völlig aus.

Eine QuadCore CPU empfiehlt sich dann, wenn Ihr Computer intensiv genutzt wird. Wenn viele Anwendungen und Programme geöffnet sind, haben Sie so stets die nötigen Reserven für schnelles Arbeiten.

Sollten Sie jedoch sehr anspruchsvolle Anwendungen verwenden, die mehrere große Arbeitsprozesse gleichzeitig durchführen, empfiehlt sich eine Acht-Kern CPU der AMD FX-Serie bzw. eine der Intel® Core™ i7 Vier-Kern CPUs.

Die These „Je mehr CPU-Kerne, desto leistungsfähiger die CPU“ gilt also nicht, denn einige der leistungsstärksten Desktop-Prozessoren von Intel® haben lediglich vier Prozessorkerne.

 

Fazit: Die CPU ist das Herzstück Ihres Computers. Sie spielt eine wichtige Rolle, wenn Sie viele Dinge zeitgleich erledigen wollen. Je nach Anzahl und Art der Anwendungen erhöht sich die Leistungsanforderung an die CPU.

 

GrafikkarteGrafikkarte

Eine Grafikeinheit ist in allen Anwendungsbereichen unumgänglich. Sie ist für die grafische Darstellung und deren Qualität zuständig. Dabei unterscheidet man Grafikkarten grundsätzlich in drei Kategorien:

 

OnBoard-/OnChip-Lösungen

Diese Variante ist aufgrund der technischen Entwicklungen der CPU-Hersteller AMD und Intel® in der letzten Zeit immer beliebter geworden. Vor allem die OnChip-Lösungen sind mittlerweile konkurrenzfähig gegenüber vielen Grafikkarten. Mit einigen OnChip-Lösungen ist das Spielen von anspruchsvolleren Spielen bereits möglich.

 

Business-Lösungen

Bei dieser Variante handelt es sich um Grafikkarten, bei denen das Hauptaugenmerk nicht auf die 3D-Funktionen gelegt wird, sondern eher auf ein scharfes und kontrastreiches Bild. Allerdings gibt es auch Business-Lösungen mit 3D-Funktionen, die beispielsweise für die von Architekten genutzten CAD-Anwendungen (computer-aided design) geeignet sind.

 

Spiele-Grafikkarten

Der wohl bekannteste Anwendungsbereich für Grafikkarten ist der Gaming-Bereich. Hauptsächlich sind in dieser Kategorie die Chipsätze von AMD (Radeon™-Serie) und NVIDIA® (GeForce®-Reihe) vertreten. Spiele-Grafikkarten gibt es in verschiedenen Preis- und Leistungsklassen.

Sollten Sie gelegentlich ältere Spieleklassiker spielen, reicht eine Grafikkarte der unteren Preisklasse völlig aus. Bevorzugen Sie allerdings aktuelle Spiele, sollten Sie sich für ein Mittelklasse-Modell ab einem Preis von ca. 100 € entscheiden.

Für anspruchsvolle Gamer, die Wert auf hohe Auflösungen und detailreiche Texturen legen, ist eine Grafikkarte im höheren Preisbereich zu empfehlen. Diese Grafikkarten bieten ein enormes Leistungspotential im Bereich der 3D-Darstellung.

 

Fazit: Bei der Grafikkarte kommt es ganz besonders auf den bevorzugten Anwendungsbereich an. Daher sollte man sich vor dem PC-Kauf gut informieren, welche Grafikkarten für den eigenen Anwendungsbereich geeignet sind.

 

ArbeitsspeicherArbeitsspeicher

Der Arbeitsspeicher ist für die Zugriffsgeschwindigkeiten auf die einzelnen Anwendungen verantwortlich. Daher ist ein großer Arbeitsspeicher für viele Ansprüche unverzichtbar.

Grundsätzlich gilt: Je höher die Ansprüche an die Prozesse im PC, desto größer sollte der Arbeitsspeicher sein. Allerdings kommt es, wie bei den anderen Komponenten, ebenfalls stark auf den Anwendungsbereich an.

Wenn Sie Ihren PC vorwiegend für Büro- und Internetanwendungen nutzen, sind 4 GB Arbeitsspeicher ausreichend.

Bei anspruchsvolleren Programmen, zum Beispiel im Bereich der Bildbearbeitung und aktuellen Spielen, sind die Anforderungen an den Arbeitsspeicher bereits höher. Daher sollten Sie sich in diesem Fall für 8 GB bis 16 GB Arbeitsspeicher entscheiden.

Für Hochleistungsrechner, die mit aufwendigen 3D-Programmen und dem gleichzeitigen Bearbeiten mehrerer Prozesse flüssig arbeiten sollen, lohnen sich 32 GB Arbeitsspeicher, die auch für die Zukunft noch ausreichend Reserven bieten.

 

Fazit: Der Arbeitsspeicher ist für die Geschwindigkeit ausschlaggebend, in der die einzelnen Programme ausgeführt werden. Daher sollten Sie sich für mehr Arbeitsspeicher entscheiden, je anspruchsvoller Ihre Anwendungen sind.