Wall Street veegde begin 2026 $285 miljard van SaaS-aandelen af nadat ze AI-agents zagen die daadwerkelijk werk konden doen — niet alleen erover chatten. De logica was simpel: als een AI e-mails kan opstellen, agenda's beheren en operationele taken afhandelen, wie heeft er dan nog een SaaS-licentie van €200 per maand nodig?

De ironie is dat de agent die de paniek veroorzaakte — Anthropic's Cowork — nog steeds in research preview is. Klap je laptop dicht en hij stopt met werken. Zo hoort serieuze software niet te werken.

De echte vraag is dus niet of AI-agents eraan komen. Dat doen ze. De vraag is hoe je kunt zien welke echt werken.

De drie vragen die echte agents onderscheiden van demo's

Na het testen van tientallen AI-agents en het volgen van de markt — van code-assistenten tot volledige outcome-gerichte tools — blijken drie vragen steeds het verschil te maken.

1. Heeft de agent een persistent geheugen?

Geen sessiegeheugen. Geen "het onthoudt de laatste 5 berichten." Echt persistent geheugen dat sessies overleeft, je voorkeuren leert en context opbouwt over tijd.

De meeste agents beginnen elke keer bij nul. Je legt opnieuw uit wie je contacten zijn, hoe je e-mails geschreven wilt hebben, wat je agendavoorkeuren zijn. Dit is het equivalent van elke ochtend een nieuwe assistent inhuren en het eerste uur besteden aan bijpraten.

Een echte agent onthoudt dat je met je Nederlandse collega's in het Nederlands schrijft, dat je vergaderingen van 45 minuten prefereert boven 60, en dat je bestuurslid formele taal verwacht terwijl je mede-oprichter een "Hey, snelle update" stijl krijgt.

Dit is geen leuke feature. Het is het fundament waar alles op bouwt.

2. Produceert de agent resultaten die je kunt inspecteren en bewerken?

Hier vallen veel agents door de mand. Ze beloven "dingen af te handelen" maar produceren ondoorzichtige resultaten die je niet kunt verificeren voordat ze verzonden worden.

Een e-mail die je AI opstelt moet verschijnen als concept dat je kunt lezen, bewerken en goedkeuren — niet iets dat direct de deur uit gaat. Een agenda-afspraak moet met de juiste details verschijnen ter bevestiging. Een taak moet context bevatten, niet alleen een titel.

Het onderscheid is belangrijk omdat vertrouwen wordt opgebouwd door transparantie. Als je kunt zien wat de agent deed, het kunt bewerken en dan goedkeuren, ontwikkel je vertrouwen in het systeem. Als de agent achter een gordijn opereert, gok je.

3. Wordt de context beter over tijd?

De moeilijkste vraag, en degene die een productiviteitstool onderscheidt van een echte AI-agent.

Is de 10e e-mail die de agent voor je opstelt beter dan de 1e? Weet hij dat je de vorige keer in het Nederlands mailde en afsloot met "Groet"? Begrijpt hij dat vergaderingen met deze klant altijd uitlopen, dus hij een buffer van 30 minuten moet toevoegen?

Groeiende context betekent dat de agent slimmer wordt bij elke interactie. Niet omdat het onderliggende AI-model verbetert, maar omdat jouw agent kennis opbouwt over jou, je contacten, je workflows en je voorkeuren.

Zonder groeiende context heb je een dure auto-complete. Mee heb je iets dat echt verbetert hoe je werkt.

Hoe huidige AI-agents scoren

Anthropic Cowork

Sterk op bewerkbare resultaten — documenten, spreadsheets, presentaties. Geheugen bestaat maar is niet betrouwbaar genoeg. Context groeit niet mee. Stopt als je je laptop dichtdoet. Score: circa 1,5 van 3.

Lindy

Meest bekende outcome-agent voor executives. Heeft persistent geheugen in theorie, maar resultaten zijn ondoorzichtig en moeilijk te bewerken. Gebruikers melden dat credits verbranden op mislukte taken zonder duidelijke uitleg. Trustpilot: 2,4 van 5. Score: circa 1 van 3.

Google Opal

Gratis, wat telt. De geheugenfunctie ziet eruit als een spreadsheet — niet duurzaam genoeg. Artifacts zijn beperkt. Grootste risico: Google's geschiedenis van het verlaten van experimentele producten. Score: circa 0,5 van 3.

Hoe een echte AI-agent workflow eruitziet

Maandagochtend, 8:30. Je opent je inbox. Je AI-agent heeft 's nachts al 47 e-mails getriaged. Nieuwsbrieven en notificaties zijn gearchiveerd. Zes e-mails vragen je aandacht — elk met een conceptantwoord in de juiste taal en de juiste toon voor die specifieke persoon.

Je bestuurslid krijgt een formele Nederlandse e-mail. Je mede-oprichter krijgt een informeel Engels bericht. De agent kent het verschil omdat hij je e-mailgeschiedenis heeft geanalyseerd.

Je reviewt, past twee concepten licht aan, keurt alle zes goed. Totale tijd: 4 minuten.

9:00. Je ochtend-briefing verschijnt — agenda van vandaag, taken op prioriteit, en een notitie dat een contact die je 3 maanden niet gesproken hebt volgende week een meeting met je heeft. De agent heeft alvast hun recente activiteit opgezocht.

Overdag stelt iemand een vergadering voor op donderdag 14:00. De agent checkt je planningsregels, ziet dat je "geen meetings na 13:00 op donderdagen" hebt staan, stelt vrijdagochtend voor en stelt het antwoord op. Je ziet het concept, keurt het goed, en het wordt verstuurd.

Elke stap is zichtbaar. Elke actie is bewerkbaar. Elke interactie maakt de volgende beter.

De kern

De AI-agent revolutie is echt, maar de meeste tools die op de golf meerijden halen de lat niet voor dagelijks gebruik. De drie vragen — persistent geheugen, bewerkbare resultaten, groeiende context — zijn geen willekeurige criteria. Het zijn de minimumvereisten voor software waaraan je je professionele communicatie en agenda toevertrouwt.

Stel de drie vragen. Vertrouw de antwoorden.

Drie vragen die elke AI-agent moet beantwoorden voordat je er echt werk aan toevertrouwt