Guides
Wat is self-healing infrastructure?
Definitie
Self-healing infrastructure — een infrastructuurpatroon waarbij systemen afwijkingen zelfstandig detecteren en corrigeren binnen vooraf gedefinieerde grenzen, zonder dat een mens de actie hoeft te initiëren of goed te keuren.
Self-healing infrastructure is een infrastructuurpatroon waarbij systemen afwijkingen zelfstandig detecteren en corrigeren binnen vooraf gedefinieerde grenzen — zonder dat een mens de actie hoeft te initiëren of goed te keuren. De kern is een gesloten loop: detectie → beslissing → actie → verificatie. Monitoring detecteert dat er iets mis is. Self-healing gaat één stap verder: het koppelt de detectie aan een vooraf vastgelegde actie, voert die uit en controleert of het incident daadwerkelijk is verholpen. Voor een uitgebreide behandeling met volwassenheidsniveaus, zie de complete gids over self-healing infrastructure.
1. Wat is self-healing infrastructure?
Self-healing infrastructure draait om één principe: bekende problemen verdienen geen handmatige tussenkomst. Het systeem volgt een vaste loop:
het systeem signaleert een afwijking. Een service reageert niet, een schijf loopt vol, een certificaat nadert de verloopdatum.
het systeem matcht de afwijking op een vooraf gedefinieerde policy. Geen interpretatie: de policy beschrijft exact welke conditie tot welke actie leidt.
het systeem voert de actie uit en verifieert het resultaat. Als de verificatie slaagt, logt het de handeling. Als de verificatie faalt, escaleert het naar een engineer.
Alle drie de stappen zijn verplicht. Een systeem dat alleen detecteert is monitoring. Een systeem dat detecteert en een melding stuurt is alerting. Self-healing is de combinatie van detectie, beslissing, actie en verificatie in een gesloten loop. Het woord "zelf" verwijst niet naar autonome intelligentie — het verwijst naar gecodificeerde expertise.
2. Wat self-healing wél en niet is
Wat het wél is
Wat het niet is
3. Wanneer is self-healing relevant voor een MSP?
Herhalende incidenten op bekende klassen
Als dezelfde incidenttypes keer op keer terugkomen met dezelfde oplossing, zijn dat kandidaten voor autonome afhandeling.
After-hours belasting
Self-healing handelt direct, ongeacht tijdstip. Voor MSPs waar after-hours support een significant deel van de operationele kosten vertegenwoordigt, is dat directe verlichting.
Hoge MTTR op bekende incidentklassen
Als de hersteltijd hoog is niet omdat de oplossing complex is, maar omdat er gewacht wordt op een beschikbare engineer, ontbreekt de beslis- en actielaag.
Schaarse engineercapaciteit
Elke L1-handeling die autonoom wordt afgehandeld, is tijd die beschikbaar komt voor L2- en L3-werk.
In het maturity model voor MSP-automatisering bevindt self-healing zich op niveau 4–5.
Veelgestelde vragen
Wat is het verschil tussen self-healing en automatisering?
Automatisering is een breed begrip dat alles omvat van geplande scripts tot runbook automation. Self-healing is een specifiek patroon binnen automatisering: de gesloten loop van detectie, beslissing, actie en verificatie zonder menselijke tussenkomst. Niet alle automatisering is self-healing, maar self-healing is altijd een vorm van automatisering. Het verschil is de autonome beslissing: bij self-healing triggert het systeem zelf op basis van real-time detectie en een policy.
Welke incidenten lenen zich voor self-healing?
Incidenten die voldoen aan drie criteria: de oorzaak is bekend, de oplossing is gestandaardiseerd en het resultaat is verifieerbaar. Daarnaast moet de actie bij voorkeur omkeerbaar zijn. Typische kandidaten: service herstarts, disk cleanup, certificaatvernieuwing, DNS-failover bij connectiviteitsproblemen. Niet geschikt: incidenten met meerdere mogelijke oorzaken, onomkeerbare acties of situaties die context-afhankelijke beoordeling vereisen.
Heb ik speciale monitoring nodig voor self-healing infrastructure?
Niet per se speciale monitoring, maar wel betrouwbare monitoring. Self-healing triggert op signalen uit je detectielaag. Die signalen moeten specifiek, meetbaar en consistent zijn. Hoe rijker de telemetrie — response times, resource utilization, service dependencies — hoe meer incidenttypes je kunt dekken.
Hoe UptimePilot dit aanpakt
UptimePilot bouwt self-healing infrastructure als een dienst voor mkb-MSPs. Het platform detecteert incidenten op infrastructuurlaag, matcht op vooraf gedefinieerde policies, voert de remediatie uit en verifieert het resultaat. Elke autonome actie is herleidbaar in een audit trail — expliciete policies die je op één pagina kunt uitleggen.
Volgende stap