Qualcomm intentioneaza sa lanseze un cip de inferenta AI pentru piata centrelor de date, numit Cloud AI 100.
Familia de produse ASIC va veni intr-o varietate de factori de forma si puncte termice de proiectare pentru diferite cazuri de utilizare. Dincolo de aceasta, foarte putine detalii au fost facute publice.
Sarcinile de lucru ale AI pot fi impartite in doua subcategorii – formare si inferente. De formare, in cazul in care creati de fapt, plase neuronale, necesita o putere de procesare semnificativ mai mare, in timp ce inferentele se concentreaza doar pe executarea pe plase.
Modelul 7nm Cloud AI 100 va viza ultima piata, impreuna cu rivalii de la producatorii de FPGA, pana la start-up-uri, catre giganti chinezi – precum si liderii pietei Intel si Nvidia. Qualcomm a spus ca unul dintre atributele cheie ale produsului va fi eficienta energetica a acestuia si a revendicat o imbunatatire a performantei de 10 ori fata de FPGA.
Familia de cipuri va sustine runtime, inclusiv ONNX, Glow si XLA, precum si cadre de invatare a masinilor, cum ar fi Google TensorFlow, PyTorch, Keras, MXNet, PaddlePaddle si Microsoft Cognitive Toolkit.
Produsele tipice vor fi lansate in acest an, cu o lansare completa in 2020. Nimic altceva nu a fost dezvaluit despre produs – compania a spus ca se asteapta sa dezvaluie in mod corespunzator cipul in cursul acestui an.
In cazul in care Cloud AI 100 se dovedeste popular, va fi o inversare marcata a averilor din centrul de date Qualcomm – dupa o incercare dezastruoasa a unei linii server Arm.
Compania, cel mai mare furnizor de cipuri smartphone din lume, a intrat pe piata centrelor de date la sfarsitul anului 2017, lansand primul sau server CPU, Centriq 2400 – un cip pe baza de arme cu pana la 48 de nuclee, fabricat pe un proces de 10nm .
Cipul pare sa fi fost bine primit de industrie si ar fi putut avea succes pe termen lung, dar divizia a suferit in curand dupa ce a fost prinsa in mijlocul problemelor de afaceri mai largi ale Qualcomm. Compania se lupta cu cel mai mare client, Apple, in instanta, si a petrecut o mare parte din 2018 incercand sa opreasca o incercare ostila de preluare de catre Broadcom – care a functionat, afacerea fiind blocata in cele din urma de guvernul Statelor Unite, dar s-a dovedit a fi o distragere costisitoare si inutila .
Cu actionarii nervosi, compania a promis in ianuarie ca va face reduceri de costuri de 1 miliard de dolari – avand in vedere ca centrul de date se va sfarsi prin a face obiectul reducerilor.
In mai putin de un an, divizia de centre de date a trecut de la aproximativ 1000 de angajati la 50.