> > > > ROCm 2.4 unterstützt TensorFlow 2.0 und Infinity Fabric Link

ROCm 2.4 unterstützt TensorFlow 2.0 und Infinity Fabric Link

Veröffentlicht am: von

amd rocmMit der Radeon Open Compute Platform (ROCm) baut AMD seit 2016 eine Compute-Schnittstelle für das Ausführen von Code auf den GPU-Beschleunigern (und auch Prozessoren) auf. ROCm tritt dabei gegen NVIDIAs CUDA-Plattform an und hat es bisher schwer bei Entwicklern Fuß zu fassen, denn CUDA beherrscht den Markt.

Allerdings gibt AMD seine Ambitionen in diesem Bereich nicht auf – ganz im Gegenteil. Das Angebot immer neuer Radeon-Instinct-Karten zieht das Fortführen der ROCm-Schnittstelle nach sich, die nun die Versionsnummer 2.4 erreicht hat. Diese unterstützt unter anderem TensorFlow-2.0-CUDA-Code, der auf TensorFlow 2.0 entwickelt ist, wird zu C++ konvertiert, der dann auch auf AMD-GPUs ausgeführt werden kann. Laut AMD soll es dabei keinerlei Leistungsverlust geben, wenn der Code auf der Hardware ausgeführt wird. Die Konvertierung nimmt natürlich etwas Zeit in Anspruch.

ROCm 2.4 unterstützt zudem den AMD Infinity Fabric Link, der bei den Radeon Instinct MI60 und MI50 zum Einsatz kommt und bis zu vier Karten zusammenschaltet.

Eine große Rolle im ROCm-Gesamtkonzept kommt den Compilern zu, denn sie sollen beliebigen Code auf der eigenen AMD-Hardware schnellstmöglich ausführen können. Dazu hatte AMD bereits vor Jahren einen neuen LLVM-Compiler veröffentlicht, der für die CPU-Berechnungen den Code entsprechend aufarbeiten soll. Da die GPUs aber den wesentlich höheren und damit wichtigeren Anteil bei entsprechenden Berechnungen haben, sorgt ein GCN-Compiler für die Anpassungen am GPU-Code. Dieser ist speziell auf die Graphics-Core-Next-Architektur hin optimiert und wendet diese Optimierungen im Zielcode an. Für jeden Zielcode wie OpenCL, CUDA, ISO C++ oder Python hat AMD eine entsprechende Schnittstelle entwickelt.

ROCm 2.4 kann im entsprechenden Git-Repository bezogen werden. Erst kürzlich kündigte AMD die Zusammenarbeit mit dem US-Energieministerium an, für das ein Frontier getaufter Supercomputer mit AMD-CPUs und AMD-GPUs aufgebaut werden soll, der 2021 eine Rechenleistung von 1,5 ExaFLOPS erreichen soll.

Damit soll nahezu jeglicher Code, der ansonsten über andere Schnittstellen auf Nicht-AMD-GPUs ausgeführt wird, auch auf AMD-Hardware laufen. Intel baut ebenfalls mit der One-API eine Schnittstelle auf, die über Prozessoren und GPUs hinweg ein und denselben Code ausführen können soll. Noch in diesem Jahr soll eine erste Version veröffentlicht werden.

Social Links

Diesen Artikel bewerten:

Ø Bewertungen: 0

Tags

Kommentare (2)

Diskutiert das Thema in unserem Forum:
ROCm 2.4 unterstützt TensorFlow 2.0 und Infinity Fabric Link

Das könnte Sie auch interessieren:

  • DRAM Calculator 1.5.0 für Ryzen-Prozessoren veröffentlicht (Update)

    Logo von IMAGES/STORIES/2017/DRAM-CALCULATOR

    Yuri "1usmus" Bubliy hat den DRAM Calculator in der Version 1.5.0 veröffentlicht. Dieser richtet sich an alle Nutzer eines Ryzen-Prozessors von AMD. Die neueste Version gilt aufgrund des guten Vorgängers bereits als neue Referenz für das RAM-OC im Zusammenspiel mit den Ryzen-Prozessoren –... [mehr]

  • NV Scanner API: Automatisches OC nun auch für Pascal-GPUs

    Logo von IMAGES/STORIES/2017/NVIDIA-TITANXP

    Zusammen mit der Turing-Architektur hat NVIDIA eine neue NV Scanner API eingeführt, die ein effizientes und automatisches Overclocking ermöglichen soll. Neben der Tatsache, dass die Software dazu die Spannungs/Takt-Kurve abläuft, soll der neue OC Scanner vor allem durch den synthetischen... [mehr]

  • Große Sicherheitslücken in Software von ASUS und Gigabyte

    Logo von IMAGES/STORIES/2017/GIGABYTE_Z390_MAINBOARDS_LOGO

    Wer ein Mainboard oder eine Grafikkarte eines beliebigen Herstellers verbaut hat und die entsprechenden Zusatzprogramme für eine Überwachung, ein Overclocking oder aber die LED-Steuerung verwenden möchte, der ist auf die dazugehörigen Anwendungsprogramme des jeweiligen Herstellers... [mehr]

  • OBS unterstützt nun NVIDIAs RTX Encoder

    Logo von IMAGES/STORIES/2017/TURING-GPU

    Zusammen mit der Turing-Architektur führt NVIDIA einen neuen dedizierten Hardware-Encoder namens NVENC ein. Der neue NVENC-Encoder unterstützt H.265 (HEVC) bei 8K mit 30 FPS. Zudem werden nativ durch die Hardware HEVC YUV444 10/12b HDR bei 30 FPS, H.264 8K und VP9 10/12b HDR... [mehr]

  • NVIDIA FrameView bietet eine volle FPS- und Verbrauchs-Analyse

    Logo von IMAGES/STORIES/2017/NVIDIA-FRAMEVIEW

    Zusammen mit den ersten beiden Super-Modellen stellte NVIDIA mit FrameView ein neues Tool zur Analyse der FPS vor. Basis von FrameView ist PresentMon. NVIDIA hat die Software nun in die Beta entlassen und damit kann sich jeder die Beta 0.9.4124.26691055 herunterladen und eigene Analysen... [mehr]

  • NVIDIA macht PhysX zur Open-Source-Software

    Logo von IMAGES/STORIES/2017/NVIDIA

    NVIDIA macht den Source-Code für PhysX Open-Source und damit für alle zugänglich. Im Juni 2008 ins Leben gerufen, galt und gilt PhysX als Einschränkung für eine offene Entwicklung von Spielen und soll somit NVIDIA zum Vorteil gereichen. Zwischenzeitlich gab es immer wieder Vorwürfe, NVIDIA... [mehr]