
Viimeisen kahden vuoden aikana tekoälykeskustelut ovat pyörineet lähes kokonaan laskentatehon ympärillä: ei tarpeeksi GPU:ta, riittämätön laskentakapasiteetti ja riittämättömät klusterit.Mutta tässä raportissa korostetaan toistuvasti yhtä keskeistä seikkaa: tekoälyä todella hidastaa ei kyvyttömyys laskea, vaan kyvyttömyys siirtää tietoja.
Kun mallikoot ovat kasvaneet kymmenistä megatavuista useisiin gigatavuihin, järjestelmän kiireisimpiä komponentteja eivät enää ole laskentayksiköt, vaan muisti ja väylät.Toisin sanoen tekoälyn pullonkaula on hiljaa siirtymässä – "laskentaongelmasta" perustavanlaatuisempaan ehdotukseen: säilytysongelma.
Tämä on johtanut radikaalimpaan suuntaan: jos tiedon liikkuminen on suurin ylimääräinen kustannus, miksi ei antaisi laskennan tapahtua suoraan varastoon?
Arkkitehtuuri nimeltä Compute-in-Memory (CIM) yrittää kirjoittaa tämän logiikan uudelleen juuresta.Avain sen mahdollistamiseen ei ole edistyneempi prosessisolmu, vaan eräänlainen teknologia, joka ei ole ollut niin "valtavirtaa" aiemmin.analoginen muisti.
Tämä artikkeli kehottaa meitä pohtimaan uudelleen kriittistä kysymystä: kun tekoäly kehittyy nykyiseen asemaansa, mikä todella määrittää sen ylärajan – laskentateho vai tallennustila?
Tekoälyn suorituskyvyn pullonkaula on siirtymässä "laskentatehosta" "tallennus- ja tiedonsiirtoon", ja ratkaisu on laskentaparadigman rekonstruoinnissa "analogisella muistilla + Compute-in-Memory (CIM)".
Syvien hermoverkkojen (DNN) ydinlaskenta on vektori-matriisikertolasku (VMM), joka luontaisesti perustuu massiiviseen painolukemaan.Kun mallien koot kasvavat megatavuista gigatavuihin (10 Mt–10 Gt), ne asettavat valtavia vaatimuksia sirulle tallennetulle.
Harjoittelu on "kirjoitusintensiivistä", kun taas päättely on "intensiivistä lukua" - molemmat pyörivät painon säilyttämisen (synaptisen muistin) ympärillä.
Johtopäätös: AI ei ole pelkkä tietojenkäsittelyongelma;Kyse on pohjimmiltaan "tallennus + tiedonsiirron tehokkuudesta".
Perinteiset GPU:t/TPU:t toimivat yksinkertaisella periaatteella: laskenta tapahtuu prosessointielementeissä (PE), kun taas tiedot tallennetaan SRAM/DRAM-muistiin, mikä johtaa tiheään tiedonsiirtoon ja erittäin alhaiseen tehokkuuteen.
Energiatehokkuuden vertailu:
Keskeinen ristiriita: Ongelma ei ole kyvyttömyys laskea, vaan kyvyttömyys siirtää tietoja tehokkaasti.
CIM-arkkitehtuuri tallentaa painot suoraan muistitaulukoihin ja suorittaa laskelmia (rinnakkais-VMM) näissä taulukoissa, mikä poistaa tarpeen siirtää tietoja "tallennus-↔-laskentayksiköiden välillä".
Perusteellista muutosta:
Tämä on paradigman muutos arkkitehtonisella tasolla, ei pelkkä optimointi.
CIM:n toteuttamiseksi tarvitaan uusi "painonkannatin".Pääehdokkaita ovat mm.
Näiden laitteiden olennainen kyky on esittää painoja jatkuvalla konduktanssilla (analoginen monibitti).
Raportissa ei painoteta "voidaanko se tehdä", vaan käytännön esteitä:
1. Koulutushaasteet (kirjoitusprosessi)
Vaatimukset: Lineaarisuus ja symmetria
Käytännön kysymyksiä: Epälineaarisuus ja epäsymmetria heikentävät tarkkuutta
2. Päätelmähaasteet (lukuvakaus)
Painot ajautuvat ajan myötä, ja ongelmia ovat muun muassa:
- Lämpöliike
- Lukuhäiriöt
- Säilytysongelmat
3. Array-tason ongelmat
- Vaihtuvuus eri laitteissa
- Kompromissit tarkkuuden, ADC-suorituskyvyn ja taulukon koon välillä
Keskeinen johtopäätös: Analogisen muistin ongelma ei ole "onko tarkkuus riittävä", vaan "vakaus ja hallittavuus".
Tulevaisuuden suuntaviivat sisältävät:
Essence: Tämä ei ole yhden pisteen läpimurto, vaan täyden pinon rekonstruktio.
Tekoälyn pullonkaula ei ole enää laskentateho, vaan "tallennus ja tiedonkulku".Analoginen CIM muuttaa "tallennustilan" tietojenkäsittelyn uudeksi ytimeksi – määrittää uudelleen, miten tekoälyjärjestelmät toimivat alusta alkaen.