Hirdetés

Bedarálhatja gépi tanulás piacát a Nervana NNP

Az Intel, korábban Lake Crest kódnéven futó megoldása célirányosan az említett területre készült.

Írta: Abu85
Forrás: PROHARDVER!
2017-12-15 17:48

Az Intel jó ideje készíti elő a gépi tanulásra szánt hardverportfólióját. Ezek között egyelőre több általános modell van, vagy esetleg olyan fejlesztések, amelyeket nem ide terveztek, de működnek. Az igazi támadás azonban a korábban felvásárolt Nervana technológiáira építkezve kezdődik majd meg.

Jelenleg a legfontosabb a Lake Crest kódnevű ASIC. Ez 12 darab, direkt gépi tanulásra kialakított processzorklasztert tartalmaz, amelyeket 4096 bites buszon bekötött HBM2 memória szolgál ki, a memórialapkák összkapacitása pedig 32 GB. Magát a lapkát nagyrészt még a Nervana tervezte, ezért is készül a TSMC 28 nm-es node-ján. Itt az Intel túl kockázatosnak látta a saját gyártástechnológiára való átültetést, így lemondtak erről. Ez alapvetően jó ötlet volt, mert a tervekhez képest amúgy is csúszik a megjelenés, viszont a hardvert a vállalat az elmúlt héten lezajlott NIPS 2017-es rendezvényen demonstrálta.

Az x16-os PCI Express 3.0-s interfészbe helyezhető gyorsító mintapéldánya két darab 8 tűs tápcsatlakozót igényelt, de ez nem számít annyira extrémnek a célzott területen. A HBM2 memória 1 TB/s-os memória-sávszélességet biztosított, továbbá kiderült, hogy a 32 GB-os modell mellett lesz 16 GB-os is.

Az új fejlesztés a Nervana NNP, azaz Neural Network Processor sorozatba érkezik, és a koncepció kizárólag a gépi tanulás kiszolgálása volt. Carey Kloss, az Intel AI részlegét vezető alelnök szerint manapság a gépi tanulás olyan hardvereken történik, amelyeket nem is erre terveztek. Ettől maga a feldolgozás végbemegy, de a rendszer hatékonysága messze lesz az ideálistól, amit leginkább az aktuális megoldások limitációi okoznak. Ezekre igen hatékony módokon reagál az Intel fejlesztése.

A Lake Crest ASIC egyik fontos képessége, hogy lehetővé teszi az adatlokalitás direkt menedzselését. Ez a gépi tanulás szempontjából azért fontos, mert minimalizálja az adatmozgást a lapka és a memória között, ami végeredményben alacsonyabb fogyasztást fog eredményezni. Emellett a HBM memórialapkák akár direkten hozzárendelhetők az egyes tensor magokhoz, annak érdekében, hogy az adat fizikailag is a lehető legközelebb legyen a releváns feldogozókhoz. Ráadásul a gépi tanulás a legtöbbször memórialimitbe fut, ezen belül is kevés lesz a memória-sávszélesség. Az Intel szerint még az 1 TB/s sem segít, így trükközni kell a hatékonyság javítása érdekében.

Az alapot a 2 MB-nál is nagyobb processzorklaszterenkénti gyorsítótár biztosítja, amit kiegészít egy 30 MB-os teljes lapkára vonatkozó gyorsítótár is. Ez teszi lehetővé, hogy a feldolgozás nagyrészt a lapkán belül maradjon, de emellett számos szoftveres trükk is folyamatosan dolgozik azon, hogy a HBM alrendszer csak akkor legyen használva, ha arra elengedhetetlenül szükség van.

A másik fontos extra a FlexPoint technológia, ami biztosítja 32 bites szimpla pontosságú feldolgozáshoz közeli eredményt, miközben csak 16 bit allokációkkal dolgozik. Ez az új numerikus formátum lehetővé teszi a memória-sávszélesség kétszeres hatékonyságú kihasználását a normál 32 bites szimpla pontosságú feldolgozáshoz viszonyítva, illetve az operációk végrehajtása is jóval hatékonyabb. Maga a FlexPoint kifejezetten a gépi tanulás tréning szakaszára lett kidolgozva.

A harmadik újítás a Lake Crest lapkák összeköttetésére vonatkozik, ugyanis ez 1 terabit/másodperces bidirekcionális linkeken keresztül valósítható meg, méghozzá teljesen szoftveresen kontrollálva, minden linkhez szoftveresen konfigurált QoS-t (Quality of service) társítva. Ezzel olyan virtuális csatornák biztosíthatók a lapkák között, amelyek paraméterei tetszőlegesen konfigurálhatók. Ezeken keresztül másolhatók az adatok akár közvetlenül lapkából-lapkába a fedélzeti memória kihagyásával, így kímélve tovább a memória-sávszélességet.

Egy lapka hat linket kínál, és ilyen formában nyolc darab Nervana NNP köthető össze tórusz topológiával. Az így kialakított konfiguráció logikailag úgy működik, mintha egy nagy processzor lenne, ami a feldolgozási modell megváltoztatása nélkül, lényegében nyolcszoros, közel lineáris gyorsulást ad.

Sajnos a pontos teljesítményről még nincs összehasonlítható adat. A NIPS 2017-en lehetett hallani információkat, de problémát jelent, hogy amíg a legtöbb piaci szereplő az elméleti számítási teljesítményt adja meg a hardverénél, addig az Intel szerint ez önmagában semmit sem ér, mert úgyis erősen memórialimites lesz a gépi tanulás tréning szakasza. Emiatt a vállalat úgynevezett számítási kapacitásban gondolkodik, ami figyelembe veszi a precizitást, a memória-sávszélességet és a számítási teljesítményt is.

Annyi azért kiderült, hogy a Nervana NNP nagyon erős, gyakorlatilag nincs ellenfele azok között a hardverek között, amelyek ma a piacon megvásárolhatók. Ez persze sejthető volt, hiszen amíg a legtöbb vállalat kifejezetten általánosan tervezett processzort vett be, addig az Intel megoldása konkrét ASIC. A Google második generációs TPU koncepciója hasonló, de a hírek szerint ennél is gyorsabb a Nervana NNP, ráadásul nem is kevéssel. Ezzel a hardverrel tehát az Intel nagyon bejelentkezik, konkrétan bedarálhatják a piacot.

Hozzászólások (35)

Kapcsolódó cégek:
Intel

Azóta történt

Hivatalos bejelentés nélkül futott be az új Xeon Phi

Az Intel a Knights Mill prezentálása helyett inkább egy korábban bemutatott FPGA-t leplezett le újra.

Hír 2017-12-19 9
Új prototípussal köszönt be a kvantumszámítógépek világába az Intel

A vállalat 49 qubites, Tangle Lake kódnevű szupravezető kvantumchipje egy újabb fontos lépés lehet a kvantumszámítógépek terjedése felé.

Hír 2018-01-10 123
A Trillium projekt részeként jönnek az ARM gépi tanulásra szánt IP-i

A vállalat eddigi is nézegette a manapság felkapott piacot, és rájöttek, hogy dedikált hardver nélkül nehéz lesz helytállni.

Hír 2018-02-15 11
Forradalmi lehet az MIT AI processzora

A Massachusettsi Műszaki Egyetem szerint megoldották a neurális hálók legnagyobb problémáját.

Hír 2018-02-19 44

Előzmények

Gépi tanuláshoz optimalizált kamerát fejlesztett az Amazon

A DeepLens elkészítésében az Intel is aktívan részt vett, főleg a hardveres alap szempontjából.

Hír 2017-12-04 1
Öntanuló lapkával célozza a gépi tanulást az Intel

A Loihi kódnevű fejlesztés akár nagyságrendekkel is gyorsabb lehet az aktuális megoldásoknál.

Hír 2017-09-28 28
Részletezte az új Xeon Phi fejlesztést az Intel

A Knights Mill a Knights Landing kódnevű lapka közvetlen továbbfejlesztése.

Hír 2017-08-23 2
Gépi tanulást gyorsítana az Intel az USB portról

A vállalat megújította a Movidius Neural Compute Stick eszközét, amely hivatalosan sosem jelent meg.

Hír 2017-07-21 15

Percről percre

Kiderült, hogy hol veszik a legtöbb kínai EV-t

it A kínai EV-k és hibridek eddigi legnagyobb exportpiaca Belgium volt, azonban az EU-s álláspont és a kínai stratégiaváltás miatt immáron Brazíliába kerül a legtöbb ilyen jármű.

Mullet MadJack teszt

gp A Hammer95 első játékában a mesterséges intelligencia találkozik a szintipoppal, a 80-as évek hajviseletével, és rengeteg vérontással.

Nubia Neo 5G - olcsó játék

ma Van-e esélye a legolcsóbb gaming telefonnak a piacon közel egy év késéssel?

Állásajánlatok

Full Stack Developer Diákmunka

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Eladó - Szerviztechnikus

Cég: Alpha Laptopszerviz Kft.

Város: Pécs

Részletek

Hirdetés

Bedarálhatja gépi tanulás piacát a Nervana NNP

Azóta történt

Hivatalos bejelentés nélkül futott be az új Xeon Phi

Új prototípussal köszönt be a kvantumszámítógépek világába az Intel

A Trillium projekt részeként jönnek az ARM gépi tanulásra szánt IP-i

Forradalmi lehet az MIT AI processzora

Előzmények

Gépi tanuláshoz optimalizált kamerát fejlesztett az Amazon

Öntanuló lapkával célozza a gépi tanulást az Intel

Részletezte az új Xeon Phi fejlesztést az Intel

Gépi tanulást gyorsítana az Intel az USB portról

Percről percre

Kiderült, hogy hol veszik a legtöbb kínai EV-t

Mullet MadJack teszt

Nubia Neo 5G - olcsó játék

Állásajánlatok

Full Stack Developer Diákmunka

Eladó - Szerviztechnikus

Indul a PlayStation Days of Play, bemutatkoztak a következő PS Plus játékok

Még két színben megcsodálható az ár/érték trónra pályázó Moto

Hivatalos, hogy Game Pass-be jön a Call of Duty: Black Ops 6

Az ár/érték bajnok Galaxy A52-re is kész a One UI 6.1

Végre megjelenési dátumot kapott a Zenless Zone Zero

Dobhatja a Google az Exynost és a Samsungot

Magyarországon is megjelent a Honor Band 9

Hirdetés

Hi﻿rd﻿etés﻿

Bedarálhatja gépi tanulás piacát a Nervana NNP

Azóta történt

Előzmények

Percről percre

Állásajánlatok

H﻿ir﻿d﻿e﻿té﻿s

Hirdetés

Hirdetés