NVIDIA wil de AI-cloud onder je bureau zetten
NVIDIA en Microsoft brengen AI naar je eigen laptop. Goed nieuws voor je data en je rekening, maar nog geen reden om meteen te kopen.
NVIDIA en Microsoft kondigden gisteren op Computex een nieuwe generatie Windows-pc’s aan. De AI draait daarin niet alleen in de cloud, maar ook op de machine zelf. De belangrijkste chip is RTX Spark, waarmee een laptop lokaal een AI-agent van 120 miljard parameters kan draaien.
Daarnaast komt NVIDIA met DGX Station, een werkstation voor op je bureau dat modellen van 1.000 miljard parameters aankan.
Dat raakt drie dingen waar je elke maand mee te maken hebt. Je rekening, je data en je afhankelijkheid van internet. Ik leg uit wat er echt verandert, en waarom je toch nog niet meteen je creditcard hoeft te trekken.
Een supercomputer op je bureau, AI in je laptop
Ik begin bij de laptop. RTX Spark is een superchip die NVIDIA samen met Microsoft en MediaTek bouwde: één petaflop rekenkracht, tot 128 GB geheugen en slank genoeg voor een 14-inch laptop. Dell, HP, ASUS en Microsoft Surface brengen er dit najaar modellen mee uit. Het bijzondere is dat een AI-agent volledig op het apparaat draait en zelfstandig je laptop bedient, zonder verbinding met de cloud. NVIDIA's eigen demo laat zo'n laptop een model van 120 miljard parameters draaien met een contextvenster van een miljoen tokens. Dat soort AI kon je tot voor kort alleen via de cloud aanspreken. Nu draait het op je schoot.
De DGX Station gaat nog een stap verder. NVIDIA noemt dit werkstation "de krachtigste AI-supercomputer voor op je bureau". Het heeft 748 GB geheugen en een Grace Blackwell-superchip die modellen tot 1.000 miljard parameters lokaal draait. Dat is frontier-klasse rekenkracht waar je tot nu toe een heel datacenter voor nodig had. De machine komt eind dit jaar.
Voor NVIDIA is dit een flinke stap. Het bedrijf dat normaal vooral de chip levert, ontwerpt nu de hele pc en daagt Apple, Intel en Qualcomm op hun eigen terrein uit. Jensen Huang vergeleek het met de sprong van telefoon naar smartphone. Satya Nadella beloofde "onbeperkte intelligentie op elk bureau". Marketingtaal, dat weten we. Onder die taal zit wel een boodschap en die snap je het snelst via een vergelijking met stroom. Tot nu toe werkte AI als stroom uit het net: je betaalt per verbruik en de leverancier bepaalt de prijs. Wat NVIDIA nu verkoopt, zijn zonnepanelen op je eigen dak: een investering vooraf, waarna de opbrengst voor jou is.
Waarom dit je rekening en je data raakt
De vaste aanname was dat AI elk jaar goedkoper zou worden, maar bij de grote labs gebeurt het tegenovergestelde. GPT-5.5 is per token drie keer zo duur als GPT-5 van acht maanden eerder. Gemini Flash verdrievoudigde zijn prijs. Anthropic schoof er met een nieuwe tokenizer stilletjes dertig tot vijftig procent verbruik bovenop. Twee weken terug schreef ik over de AI-rekening die ontploft. Lokale AI is de andere kant van dat verhaal. Een open model dat goed genoeg is en draait op hardware die je bezit, dat zet een plafond op wat een leverancier je kan vragen. NVIDIA levert er zelf open-source modellen bij, zoals de nieuwe Nemotron-lijn, dus er is ook echt iets krachtigs om op die machine te draaien. Voor het meeste routinewerk volstaat zo'n model ruimschoots.
Dan je data. Bij een model op je eigen apparaat blijft je data in huis. NVIDIA bouwde er met Microsoft een laag omheen, OpenShell, die elke agent in een eigen afgeschermd vak zet en zelfs persoonsgegevens kan maskeren voordat er toch iets naar de cloud gaat. De vraag “blijft onze data wel in huis?“ heeft voor het eerst gewoon "ja" als antwoord. Voor een consultant met cliëntdossiers, een beleidsmaker met persoonsgegevens of een mkb'er die zijn offertes niet op een Amerikaanse server wil, is dit een belangrijk detail.
Dan je verbinding. Een agent op je laptop stopt niet halverwege omdat je door je weeklimiet heen bent of omdat de wifi in de trein hapert. Hij draait gewoon door. Klinkt klein, totdat je op een belangrijk moment tegen zo'n limiet aanloopt.
Nog niet je creditcard trekken
Nu de nuchtere kant. Die laptop komt pas in het najaar, de DGX Station eind dit jaar, en over de prijs heeft NVIDIA veelzeggend gezwegen. Analisten verwachten flinke prijzen, dus reken niet op een koopje. Voor de meeste lezers is dit in 2026 geen aankoopbeslissing.
Goed om te weten is dat een lokaal model bij echt denkwerk nog merkbaar minder goed dan het beste model uit de cloud. De winst zit in de combinatie. Het routine en gevoelige werk, zeg tachtig procent, kan straks thuis draaien. De echt moeilijke twintig procent stuur je naar een frontier-model in de cloud. Wie nu al zo denkt, haalt het meeste uit allebei.
En let op de keerzijde van "gratis, privé en zegt nooit nee". Bij open-source modellen die je zelf draait, zijn de remmen er met een gratis tooltje zo afgehaald. Datzelfde model dat geen weeklimiet kent, heeft ook minder ingebouwde remmen op wat het uitvoert of ophaalt. Prima in een afgeschermde testopstelling, minder prima als het ongecontroleerd op gevoelige data losgaat. Dezelfde discipline die je een agent in de cloud meegeeft, geldt hier dubbel.
Dus, onthoud wie hier de verkoper is. NVIDIA werd 5.000 miljard dollar waard door de chips in de datacenters van de cloud, en nu wil datzelfde bedrijf je ook de hardware onder je bureau verkopen. Ze winnen sowieso. Neem de keynote dus met een korrel zout en kijk naar je eigen situatie.
Wat je deze week wel kunt doen, kost niets. Je hebt geen nieuwe hardware nodig om dit te proberen. Installeer een tool als LM Studio op de laptop die je al hebt, draai er een klein lokaal model op en voel hoe ver die tachtig procent komt. Maak daarnaast de lijstje: welk AI-werk is routine en gevoelig en kan straks naar je eigen machine, en welk werk heeft de cloud echt nodig? Als je dat nu uitzoekt, weet je precies wat zo'n machine over een jaar voor jou waard is.
Ook het vermelden waard
NVIDIA onthult Vera, een CPU speciaal voor agents Naast de hardware voor je bureau bouwt NVIDIA ook aan de datacenterkant van dezelfde toekomst met agents. Vera is een processor met 88 eigen cores die in tests een Linux-kernel in twintig seconden compileert en een topklasse-x86-chip voorbijstreeft. De eerste exemplaren gingen al naar OpenAI, Anthropic en SpaceX.
Apple stelt zijn AI-bril uit tot eind 2027 Terwijl de hardwarerace versnelt, schuift Apple zijn slimme bril juist een jaar op naar eind 2027. De reden is veelzeggend: de visuele AI-functies krijgen ze nog niet goed genoeg. Liever later dan een halfbakken product, en dat zegt iets over hoe lastig deze laag is.
Meta werkt aan een AI-hanger die je dag onthoudt Uit een intern memo blijkt dat Meta een AI-hanger test die je aan je shirt klikt of om je nek draagt en die meeluistert met je gesprekken. Het bouwt voort op Limitless, een startup die Meta eind 2025 kocht. Het bedrijf mikt op tien miljoen wearables in de tweede helft van 2026.
Perplexity verandert een Mac mini in een AI die altijd doorwerkt Perplexity deelt gratis Mac mini's uit om zijn Personal Computer te demonstreren: een AI-agent die op het kleine bureaucomputertje permanent achtergrondtaken draait. Hetzelfde idee als NVIDIA's bureau-AI, maar dan met hardware die er nu al staat.
Lees ook
Google deed honderd aankondigingen, weinig wat je daarvan merkt
Vergeet de chief AI officer. Hij zit al aan je koffietafel.
Vind je dit waardevol? Deel het.
Stuur THE HUMAN LOOP door naar één collega die ook met AI bezig is. Voor elke vriend die zich aanmeldt, krijg je gratis maanden premium: inclusief alle Playbooks.
Concreet:
2 vrienden = 1 maand.
5 vrienden = 3 maanden.
12 vrienden = een half jaar.







