Facebook a prezentat noua sa platforma de accelerare la editia de anul acesta a summit-ului OCP. Intitulata Facebook Zion, platforma este prima de genul sau care accepta noul arhitectura de module acceleratoare, sau “OAM”. Ca si parte a platformei Zion, Facebook are o gama de opt procesoare si opt acceleratoare impreuna cu interconexiunile dintre ele.
In acest articol, vom prezenta felul in care arata acest sistem, si vom oferi o perspectiva asupra a ceea ce insemna aceasta platforma.
Platforma Facebook Zion este compusa din opt procesoare si opt acceleratoare. Modulul este dezagregat, iar procesoarele serverelor sunt amplasate in “sanii” modulare, in timp ce acceleratoarele stau in alt sistem modular.
Cele opt CPU-uri stau in patru servere cu cate doua socket-uri. Acestea sunt conectate la platforma de accelerare in care sunt amplasate acceleratoare multiple. Platforma este inchegata prin folosirea mai multor materiale, inclusiv retelistica, CPU-uri si acceleratoare.
Modulul de server este o solutie dual-socket modulara. Facebook a expus, la prezentare, varianta cu solutia LGA3647 de la Intel Xeon Skylake / Cascade Lake. Serverul avea heatsink-uri mari si douasprezece DIMM-uri pentru fiecare CPU, si module OCP NIC 3.0.
Aceste servere cu doua socket-uri pot fi in numar de patru pe un sasiu si ofera puterea a opt socket-uri pentru pentru calculatii, memorie si conectivitate in materie de retea.
Acceleratoarele sunt amplasate in sasiuri separate. Acestea sunt construite special pentru necesitatile termice ale acceleratoarelor. Sasiul sistemului expus a fost gandit pentru racirea cu aer. De-a lungul partii de sus a chiuvetei de caldura, se afla un capac de plastic ce asigura interconectarea, dar serveste si ca ghidaj pentru alinierea heatsink-urilor in sasiu in asa fel incat sa se asigure cel mai bun traseu de aer.
Fiecare OAM este conceput penrtu cca 450 W de racire cu aer. Astfel, acestea au o chiuveta de caldura imensa, care cantareste cateva kilograme bune. Sub partea asamblata mecanic se pot observa conectorii OAM. Acestia asigura putere si date catre acceleratoare. Chiar daca seamana cu conectorii SXM2/3 de la Nvidia, acestia sunt special conceputi pentru a fi construiti de mai multi producatori. Un lucru interesant de observat este ca, desi heatsink-ul este imens, PCIe nu arata iesit din comun.
Pentru a mentine calitatea semnalului intre platforma OAM si serverele de calcul, precum si de la raftul OAM pana la nodurile de calculatie ale CPU-ului, Facebook a folosit un numar de cabluri rutate intern.
Cablajul pentru Zion a fost special conceput de Facebook. Ni s-a spus ca fiecare dintre acesti conectori poarta opt cabluri banda x16 PCIe intre fiecare dintre sasiuri. Acest lucru permite mentinerea unei densitati foarte mari cu o complexitate a cablajului minima. Dintr-un anumit punct de vedere, aceste cabluri banda de 128 ofera mai multa conectivitate PCIe decat un server dual socket modern Intel Xeon Scalable.
Concluzii
Platforma Facebook Zion este impresionanta si reprezinta un mare pas in fata din punct de vedere al infrastructurii. In afara de Facebook, companii precum Microsoft sau Baidu s-au aratat interesate de factorul de forma OAM. De aceea, ne asteptam sa vedem din ce in ce mai multe design-uri, precum si utilizarea platformei Zion in alte parti.
Preluat de pe Serve the Home