Guides

Wat is autonomous remediation?

Definitie

Autonomous remediation — het automatisch uitvoeren van herstelacties bij incidenten, op basis van vooraf gedefinieerde policies, zonder dat een engineer de actie hoeft te initiëren of goed te keuren.

Autonomous remediation is de verst gevorderde vorm van geautomatiseerde incidentafhandeling: het systeem detecteert, beslist en handelt op eigen gezag — binnen de grenzen die engineers vooraf hebben vastgelegd. Het is niet het startpunt van automatisering; het is het resultaat van een traject waarin detectie betrouwbaar is, oplossingen gestandaardiseerd zijn en verificatie na elke actie is ingebouwd.

1. Wat is autonomous remediation?

Autonomous remediation is de uitvoering van een herstelactie zonder menselijke tussenkomst. Het systeem detecteert een afwijking, matcht die op een policy, voert de gedefinieerde actie uit en verifieert het resultaat.

Het woord "autonoom" betekent hier niet "onbeperkt." Het betekent: de beslissing om te handelen is vooraf genomen door een engineer, vastgelegd in een policy en gedelegeerd aan het systeem. De scope is expliciet begrensd.

Autonomous remediation is nauw verwant aan self-healing infrastructure: beide beschrijven systemen die incidenten zelfstandig afhandelen. Het verschil is perspectief: self-healing beschrijft het architectuurpatroon, autonomous remediation beschrijft het uitvoeringsmechanisme.

2. Autonomous vs assisted remediation

Remediation kent een spectrum van volledige menselijke controle tot volledige delegatie:

Handmatig

Een engineer ontvangt een alert, beoordeelt de situatie, voert de herstelactie uit en verifieert het resultaat. De mens is in elke stap betrokken.

Assisted

Het systeem detecteert en stelt een actie voor. Een engineer keurt goed voordat het systeem uitvoert. Runbook automation werkt typisch op dit niveau.

Autonoom

Het systeem detecteert, beslist en voert uit zonder tussenkomst. De engineer wordt achteraf geïnformeerd via een log. Bij falende verificatie escaleert het systeem alsnog.

In het maturity model voor MSP-automatisering komt autonomous remediation overeen met niveau 4–5.

3. Wat maakt een remediatie-actie geschikt voor autonomie?

Drie criteria bepalen of een incident kandidaat is:

Omkeerbaarheid

De actie moet ongedaan gemaakt kunnen worden als het resultaat niet is wat verwacht werd. Een service herstarten is omkeerbaar. Data permanent verwijderen is dat niet.

Verifieerbaarheid

Het systeem moet objectief kunnen vaststellen of de actie het gewenste resultaat heeft opgeleverd. Verificatie is de veiligheidsklep.

Definiëerbaarheid

De conditie, de actie en het verwachte resultaat moeten vooraf en ondubbelzinnig vastgelegd kunnen worden.

Typische kandidaten: service herstarts, disk cleanup, certificaatvernieuwing, DNS-failover, herstart van mislukte backupjobs.

Lees meer: wanneer is autonomous remediation veilig? · het operationele model detect → decide → act

Veelgestelde vragen

Wat is het verschil tussen autonomous remediation en runbook automation?

Het verschil zit in wie de trigger geeft. Bij runbook automation voert het systeem een gedefinieerd script uit nadat een engineer goedkeuring geeft of een workflow start. Bij autonomous remediation triggert het systeem zelf op basis van real-time detectie en een policy. De engineer is niet in de loop voor de beslissing — alleen voor het definiëren van de policy vooraf en het beoordelen van de audit trail achteraf.

Is autonomous remediation hetzelfde als self-healing?

De termen overlappen maar zijn niet identiek. Self-healing beschrijft het architectuurpatroon: een systeem dat zichzelf herstelt via de gesloten loop van detectie, beslissing, actie en verificatie. Autonomous remediation beschrijft het uitvoeringsmechanisme: het autonoom uitvoeren van de herstelactie. Elk self-healing systeem gebruikt autonomous remediation, maar autonomous remediation kan ook bestaan als onderdeel van een bredere incident response workflow.

Welke acties zijn niet geschikt voor autonome uitvoering?

Acties die niet omkeerbaar zijn (data verwijderen, configuratie wijzigen zonder rollback), acties die context-afhankelijke beoordeling vereisen (incidenten met meerdere mogelijke oorzaken), acties die directe klantcommunicatie veronderstellen, en acties op incidenttypes die nog niet geclassificeerd of getest zijn. De vuistregel: als je de beslissing niet op voorhand kunt nemen, is menselijke tussenkomst de juiste keuze.

Hoe UptimePilot dit aanpakt

UptimePilot is gebouwd rond autonomous remediation als kernmechanisme. Het platform detecteert incidenten op infrastructuurlaag, matcht op expliciete policies en voert herstelacties autonoom uit — met verplichte verificatie na elke actie. Wat het systeem mag doen is vastgelegd en herleidbaar. Wat het niet mag doen, wordt geëscaleerd.

Volgende stap

Welke incidenten voldoen aan de criteria voor autonome remediatie?