Guides

Wat is self-healing infrastructure?

Definitie

Self-healing infrastructure — een infrastructuurpatroon waarbij systemen afwijkingen zelfstandig detecteren en corrigeren binnen vooraf gedefinieerde grenzen, zonder dat een mens de actie hoeft te initiëren of goed te keuren.

Self-healing infrastructure is een infrastructuurpatroon waarbij systemen afwijkingen zelfstandig detecteren en corrigeren binnen vooraf gedefinieerde grenzen — zonder dat een mens de actie hoeft te initiëren of goed te keuren. De kern is een gesloten loop: detectie → beslissing → actie → verificatie. Monitoring detecteert dat er iets mis is. Self-healing gaat één stap verder: het koppelt de detectie aan een vooraf vastgelegde actie, voert die uit en controleert of het incident daadwerkelijk is verholpen. Voor een uitgebreide behandeling met volwassenheidsniveaus, zie de complete gids over self-healing infrastructure.

1. Wat is self-healing infrastructure?

Self-healing infrastructure draait om één principe: bekende problemen verdienen geen handmatige tussenkomst. Het systeem volgt een vaste loop:

Detect

het systeem signaleert een afwijking. Een service reageert niet, een schijf loopt vol, een certificaat nadert de verloopdatum.

Decide

het systeem matcht de afwijking op een vooraf gedefinieerde policy. Geen interpretatie: de policy beschrijft exact welke conditie tot welke actie leidt.

Act

het systeem voert de actie uit en verifieert het resultaat. Als de verificatie slaagt, logt het de handeling. Als de verificatie faalt, escaleert het naar een engineer.

Alle drie de stappen zijn verplicht. Een systeem dat alleen detecteert is monitoring. Een systeem dat detecteert en een melding stuurt is alerting. Self-healing is de combinatie van detectie, beslissing, actie en verificatie in een gesloten loop. Het woord "zelf" verwijst niet naar autonome intelligentie — het verwijst naar gecodificeerde expertise.

2. Wat self-healing wél en niet is

Wat het wél is

Een architectuurpatroon met policy-gebaseerde beslissingslogica voor bekende incidenten
Een uitbreiding op monitoring, niet een vervanging ervan
Een manier om bekende incidenten af te handelen zonder wachttijd — ook buiten kantooruren

Wat het niet is

Geen vervanging van monitoring — self-healing heeft monitoring nodig als signaallaag
Geen silver bullet voor onbekende of complexe incidenten
Geen onzichtbare autonomie — elke actie is herleidbaar in een audit trail

3. Wanneer is self-healing relevant voor een MSP?

Herhalende incidenten op bekende klassen

Als dezelfde incidenttypes keer op keer terugkomen met dezelfde oplossing, zijn dat kandidaten voor autonome afhandeling.

After-hours belasting

Self-healing handelt direct, ongeacht tijdstip. Voor MSPs waar after-hours support een significant deel van de operationele kosten vertegenwoordigt, is dat directe verlichting.

Hoge MTTR op bekende incidentklassen

Als de hersteltijd hoog is niet omdat de oplossing complex is, maar omdat er gewacht wordt op een beschikbare engineer, ontbreekt de beslis- en actielaag.

Schaarse engineercapaciteit

Elke L1-handeling die autonoom wordt afgehandeld, is tijd die beschikbaar komt voor L2- en L3-werk.

In het maturity model voor MSP-automatisering bevindt self-healing zich op niveau 4–5.

Veelgestelde vragen

Wat is het verschil tussen self-healing en automatisering?

Automatisering is een breed begrip dat alles omvat van geplande scripts tot runbook automation. Self-healing is een specifiek patroon binnen automatisering: de gesloten loop van detectie, beslissing, actie en verificatie zonder menselijke tussenkomst. Niet alle automatisering is self-healing, maar self-healing is altijd een vorm van automatisering. Het verschil is de autonome beslissing: bij self-healing triggert het systeem zelf op basis van real-time detectie en een policy.

Welke incidenten lenen zich voor self-healing?

Incidenten die voldoen aan drie criteria: de oorzaak is bekend, de oplossing is gestandaardiseerd en het resultaat is verifieerbaar. Daarnaast moet de actie bij voorkeur omkeerbaar zijn. Typische kandidaten: service herstarts, disk cleanup, certificaatvernieuwing, DNS-failover bij connectiviteitsproblemen. Niet geschikt: incidenten met meerdere mogelijke oorzaken, onomkeerbare acties of situaties die context-afhankelijke beoordeling vereisen.

Heb ik speciale monitoring nodig voor self-healing infrastructure?

Niet per se speciale monitoring, maar wel betrouwbare monitoring. Self-healing triggert op signalen uit je detectielaag. Die signalen moeten specifiek, meetbaar en consistent zijn. Hoe rijker de telemetrie — response times, resource utilization, service dependencies — hoe meer incidenttypes je kunt dekken.

Hoe UptimePilot dit aanpakt

UptimePilot bouwt self-healing infrastructure als een dienst voor mkb-MSPs. Het platform detecteert incidenten op infrastructuurlaag, matcht op vooraf gedefinieerde policies, voert de remediatie uit en verifieert het resultaat. Elke autonome actie is herleidbaar in een audit trail — expliciete policies die je op één pagina kunt uitleggen.

Volgende stap

Welke incidenten in jouw omgeving zijn geschikt voor self-healing?