@Branimir Maksimovic,
Ma jasno je sta je glavni problem AVX-512, doduse i power management sa preciznoscu drvosece je parao oci.
Nova strategija nece AVX-512 uciniti manje zahtevnim u slucajevima kada su AVX-512 jedinice solidno opterecene, ali ce smanjiti besmisleno obaranje frekvencija zbog sporadicnih AVX-512 instrukcija ili AVX-512 poslova koji ne povecavaju bitno potrosnju energije.
Naravno, to i dalje ne resava glavni problem AVX-512 instrukcija: brzu memoriju. Ali mislim da Intel planira to da adresira sa HBM2 memorijom koja ce verovatno biti L4 kes ili ce je biti toliko da ce izigravati bafer za procesiranje kao kompletan VRAM na GPU akceleratorima.
Citat:
nkrgovic
Da, i bfloat16 je zanimljiv - ali ako pogledas IBM Power10, koji jeste niche, oni imaju 1000 flops per clock cycle, per cpu core, i jos je memorija mnogo, ali mnogo bolja nego na Intel/AMD, sto Bane cesto spominje vezano za ove arhitekture.... Power10 ima memory bw oko 1TB/s - tako da moze da bude i iskoristi tih 1000 flops/core-u - plus ima neke besne fore za deljenje memorije izmedju masina i slicno
Nemam pojma koliki je niche uopste taj segment koji gadja Intel sa AVX-512.
Nemam direktna iskustva sa Intel-ovim sales pitch-om za ove proizvode, pretpostavljam da je stari dobri "Ubrzajte svoj x86 kod bez $$$$$$ za portovanje" koji nije sljakao sa Xeon Phi-jem.
Iskreno, ne vidim nikakav smisao ovoga osim ako HPC nema neki skriveni segment u x86 industriji (u sta cisto sumnjam). Na DC x86 procesorima se vrte baze podataka, kojekakvi servisi bazirani na TCP/IP-u (web i l.) i gomila virtuelnih masina / kontejnera. Ne vidim ni u jednoj od ovih stvari neki masivni HPC gde bi AVX-512 bio resenje, osim za stari dobri "niche" matorog i komplikovanog x86 koda koji niko ne zeli da baci pa se snalaze.
Ako nije tako, IBM verovatno gadja dobar deo trzista kojima treba takva topologija sistema. Ostalo NVIDIA brise sa svojim CUDA resenjima koja su se nametnula kao de-facto standard vec duze vreme (za AI/ML odavno, kao i za gomilu HPC aplikacija).
Mislim da je i Intel, na visoko-strateskom nivou, to ukapirao jos pre nekoliko godina - kada su startovali svoj GPU (Xe) projekat.
U principu, Intel-ova buduca ponuda (ako uspeju da je zavrse) za HPC ce biti kombinacija tesno integrisanih Xeon procesora kao "pumpi" i Xe akcelearatora (Ponte Vecchio kao prva generacija). Zbog za*era sa 7nm, Intel je verovatno morao da se tali sa TSMC - inace bi imali totalni fail: Aurora superkompjuter.
Kako je kupac Argonne (citaj: DOE) koji je vec imao bliske susrete sa Intel za*erima, to bi verovatno odzvanjalo godinama.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos:
http://www.digicortex.net/node/17 Gallery:
http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! -
https://github.com/psyq321/PowerMonkey