Beschreibung der Beschaffung
Los 2 die Anforderungen für das GPU-gestützte Inferenzserversystem
Prozessor 2x x86_64-kompatible Prozessoren mit jeweils 32 physikalische Cores pro Prozessor, mind. 2,6GHz Basistakt
Arbeitsspeicher 2TB DDR4-3200MHz ECC reg.
Netzwerk Insgesamt acht Hochgeschwindigkeits- Netzwerkkarten (Single-Port) zur Node-to-Node Kommunikation. Diese müssen dem Standard 200Gb/s HDR InfiniBand entsprechen.
Zusätzlich zwei dedizierte Netzwerk-Adapter zur externen Storage-Anbindung. Diese müssen jeweils über zwei Schnittstellen verfügen (Dual- Port) und wahlweise als 200Gb/s HDR InfiniBand oder 200Gb/s Ethernet konfigurierbar sein.
Laufwerke SSD/HDD zwei 1.92 TB M.2 NVME SSDs für das Betriebssystem
30 TB lokaler Storage. Dieser muss aus Performancegründen mit U.2 NVME SSDs realisiert sein
Gehäuse 6 Höheneinheiten, luftgekühlt (Strömungsrichtung von vorne nach hinten)
Netzteil Die Stromversorgung ist auf 230V AC / 50 Hz ausgelegt. Es werden Anschlusskabel (3m) mitgeliefert, mit denen der Server an bereitgestellte Rack-PDUs (C13 bei 10A bzw. CEE 7/3 „Schuko“ bei 16A).angeschlossen werden kann .
Der Ausfall mehrerer Netzteile kann toleriert werden (N+N Redundanz). Selbst bei N-1 funktionierender Netzteile muss zumindest das Hostsystem booten können.
GPU Acht GPUs mit jeweils 80 GB Speicher und CUDA Compute Capability >= 8.0, miteinander verbunden ohne Einsatz von PCI-Express. Die Bandbreite zwischen zwei beliebige GPUs muss mindestens 600 GB/s (bi-direktional) betragen. Die Gesamtbandbreite muss mindestens 4.8 TB/s betragen (non-blocking). Die GPU Speicherbandbreite muss mindestens 2.0 TB/s betragen (Bandbreite zum lokalen GPU- Speicher)
Anforderungen/ Kriterien S/W Der Server wird komplett betriebsfertig konfiguriert geliefert und in dem bereitgestellten Rackspace installiert, inklusive Strom- und Infiniband-Verkabelung.
Es ist keine weitere Installation von Software notwendig. Dies umfasst sowohl das grundlegende Betriebssystem wie auch notwendige Virtualisierungs-schichten zur Ausführung fertiger Container-Images.
Ein Cloud-basierter Update-Service für alle Software-, Treiber- und Firmware-Komponenten wird angeboten
Betriebsfertige Docker-Images für mindestens die Deep Learning Frameworks Caffe, TensorFlow, Theano, Torch (pyTorch) und CNTK sind verfügbar und werden unterstützt
OOB ManagementDer Server verfügt über eine Fernwartungs- Schnittstelle (Baseboard Management Controller BMC) mit unbeschränkter KVM-Funktionalität für Monitoring und zur Kontrolle der Betriebsparameter. Der BMC besitzt eine dedizierte Netzwerk-Schnittstelle
Service Zugriff auf ein RMA-Portal zur Durchführung und Dokumentation eines notwendigen Teileaustauschs
Versand des Austauschteils (Customer Replaceable Unit) am nächsten Arbeitstag nach RMA-Bestätigung
Vor-Ort Einsatz (Field Replacement Unit) durch Techniker. Kosten für Anreise und Arbeitszeit sind inkludiert
Zugriff auf ein online Support-Portal (24x7) mit direktem Zugang zur Wissensdatenbank und Troubleshooting Informationen
Call Center (24x7) mit telefonischer Unterstützung für Support Service Anfragen
Technische Unterstützung (Telefon, Email) durch qualifizierte Techniker mit direktem Zugriff auf Software Stack Experten (CUDA, SDK, Applikationen, Frameworks)
Zugriff auf Supported Software Service Subscription (umfasst technischen Support, Wartung, Updates und Upgrades) für alle vor-installierten Software- Komponenten
Zugriff auf Deep-Learning / Machine-Learning Container-Software in einer optimierten Version für den angebotenen Server
Zugang zu einer GPGPU Cloud, inklusive Management, Monitoring und Scheduling Funktionalitäten zur Unterstützung des angebotenen Produkts
Remote-Wartung durch Techniker auf Wunsch über Fernwartungs-Schnittstelle inklusive Ausführung von integrierten Diagnosetools
Umfassender Applikations-Support für führende DL-/ML- Frameworks durch KI-Experten
Alle genannten Servicekriterien sind für 3 Jahre zu gewährleisten.
Gewährleistung 24 Monate gesetzliche Gewährleistung
Garantie: Sämtliche Bedingungen der gesetzlichen Gewährleistung gem. BGB müssen im Rahmen einer Garantie für 1 weiteres Jahr auf insgesamt 3 Jahre erfüllt werden (inkl. H/W- Komponenten-Vorabaustausch, Reaktionszeit 24h)
Zudem wird der Server mit 3 Jahren Enterprise-Grade Service angeboten. Eine Verlängerung des Service-Vertrags nach 3 Jahren muss möglich sein.
Infiniband 1 x NVidia/Mellanox MQM8790-HS2F Quantum Infiniband Switch HDR
1 x NVidia/Mellanox Support and Warranty, Silver 3 years
4x Mellanox Passive Copper cable, IB HDR, up to 200Gb/s, QSFP56, LSZH, 2m, black pulltab, 26AWG