Cloud monitoring-partij Datadog heeft forse updates uitgebracht om cloudbeheer efficiënter en kosteneffectiever te maken. Datadog Kubernetes Autoscaling is een managementtool die optimalisatie van cloudresources automatiseert. Daarmee schaalt het Kubernetes-omgevingen automatisch op basis van real-time en opgeslagen gebruiksgegevens. Kan Datadog de show stelen tegenover het gangbare Application Performance Management (APM)?
Allereerst stelt Datadog dat het met Kubernetes autoscaling de eerste partij is die gebruikers hun Kubernetes-omgeving direct vanaf het platform laat wijzigen. Dat wil zeggen dat aanpassingen en controle dichter bij de backend control plane en provisioning-laag plaatsvinden die voor de cloudomgeving zelf wordt gebruikt.
83 procent ‘idle containers’
Kubernetes-implementaties zijn vaak overprovisioned. Dit is om te voorkomen dat problemen met de infrastructuurcapaciteit gevolgen hebben voor eindgebruikers. Dit levert tegelijkertijd verspilde cloudcomputers op. In het rapport State of Cloud Costs 2024 beweert het bedrijf dat 83 procent van de containerkosten gerelateerd zijn aan ongebruikte resources. Of het nu 38 procent of 83 procent is, maakt niet zoveel uit, we snappen het punt. Kubernetes-adoptie drijft overprovisioning aan en heeft fijnmaziger controle nodig. Dit is van groot belang om de prestaties van de infrastructuur te optimaliseren, en dat is wat Datadog probeert te leveren.
Maar het optimaliseren van de infrastructuur is slechts één component. IT-teams moeten er namelijk nog steeds voor kunnen zorgen dat applicaties goed blijven presteren. Daarvoor zijn voldoende resources nodig om op te schalen.
Geschikte resources
Yrieix Garnier, VP of Product bij Datadog, zegt dat Datadog Kubernetes Autoscaling voortdurend controleert en automatisch Kubernetes-resources van het juiste formaat voorziet. Bedrijven praten graag over return on investment (ROI), maar dat gesprek gaat meestal over kapitaalinvesteringen, producten of mensen. In plaats daarvan duwt dit de ROI-gesprekken naar beneden in de IT-stack om de ROI op container assets te onderzoeken.
“Klanten zijn in staat om workloads en clusters met een hoog aantal inactieve resources te identificeren, een eenmalige fix te implementeren door middel van intelligente automatisering of Datadog in staat te stellen de workload automatisch te schalen op een continue basis”, legt Garnier uit. “Containers zijn een belangrijk gebied van verspilde uitgaven omdat er zoveel kosten verbonden zijn aan inactieve resources, maar organisaties kunnen ook niet riskeren dat de prestaties verslechteren of dat er niet genoeg resources zijn om te schalen. De sleutel voor bedrijven is om een balans te vinden tussen controle en automatisering, waarbij ze acties kunnen automatiseren wanneer ze er klaar voor zijn.”
Hij suggereert dat Datadog Kubernetes Autoscaling deze balans biedt door geautomatiseerde Kubernetes “rightsizing” te verbinden met real-time kosten- en prestatiegegevens.
Gedemocratiseerde optimalisatie?
Het ligt voor de hand dat optimalisatietech een duwtje in de richting van automatisering vereist. Toch klinkt het idee van “democratisering” op dit vlak misschien wat gekker. Dat is echter waar Datadog voor pleit. Het bedrijf zegt dit mogelijk te maken door een uniforme UI te bieden die Kubernetes resource-gebruik en kostenstatistieken weergeeft. Hierdoor dient het voor elk teamlid makkelijker te zijn om resources te begrijpen en te schalen.
Teams kunnen ook monitoring en resource management verenigen, zegt Garnier. Het platform van Datadog geeft organisaties volledig inzicht in hoe rightsizing hun workload en clusterprestaties beïnvloedt, ondersteund door hoge-resolutie trailing container metrics, zodat teams actie kunnen ondernemen op basis van deze context. Datadog Kubernetes Autoscaling bevindt zich nu in bèta.
Datadog Live Debugger
In lijn met de vooruitgang op het gebied van Kubernetes autoscaling kondigde Datadog ook de lancering aan van Live Debugger. Dat is een tool waarmee ontwikkelaars door code in productieomgevingen kunnen stappen en de exacte hoofdoorzaak van codeerfouten kunnen vinden. Live Debugger vereist geen downtime. Het stelt ontwikkelaars in staat om direct in productieomgevingen te werken in plaats van uren te besteden aan trial-and-error, vooral wanneer men productieproblemen tracht te reproduceren in ontwikkelomgevingen.
“Debuggen kan een traag en inefficiënt proces zijn dat uitgebreide handmatige gegevensverzameling vereist en de mogelijkheid om bugs te reproduceren in perfect gereconstrueerde omstandigheden. Deze beperkingen hebben een negatieve invloed op de productiviteit van ontwikkelaars en uiteindelijk op de ervaring van de eindgebruiker,” zegt Hugo Kaczmarek, Director of Product bij Datadog. “We halen het giswerk uit debuggen, minimaliseren de frictie die ontwikkelaars ervaren en creëren een tool die inherent snelle probleemoplossing ondersteunt met behoud van de hoogste normen voor codekwaliteit en beveiliging.”
Breakpoint-hoofdpijn
De trage en inefficiënte processen waar Kaczmarek naar verwijst, kennen veelal dezelfde oorzaak. Traditionele debugging-technieken dwingt ontwikkelaars om handmatig breakpoints in te stellen in hun codebase. Dit leidt tot kopzorgen zoals het doorkammen van onbekende code en documentatie die door anderen is geschreven. Dit terwijl ze exact hetzelfde productieprobleem met exact dezelfde omstandigheden in hun lokale omgeving proberen te reproduceren.
“Live Debugger vereenvoudigt dit proces aanzienlijk door de benodigde informatie uit de live productieomgeving samen te voegen en direct te integreren in de geïntegreerde ontwikkelomgeving (IDE) van de gebruiker”, aldus Kaczmarek. “Het product versnelt root-cause analyse met AI-gegenereerde exception summary en one-click testcreatie die nauwkeurig alle bugcondities reproduceert op basis van productiegegevens. Het gebruik van Live Debugger verbetert niet alleen de ervaring van ontwikkelaars, maar verkort ook drastisch de tijd die nodig is om problemen op te lossen. Hierdoor kunnen engineers meer tijd besteden aan het leveren van business value.”
Live Debugger beschikt over een exception replay-functie. Dit laat ontwikkelaars door de executiestroom van hun code stappen. Hierin kunnen zij lokale variabele waarden zien die live werden vastgelegd toen de exception werd opgeworpen, zonder dat ze code hoeven uit te voeren. Het biedt ook visualisaties en context: Datadog levert namelijk de observeerbaarheidscontext die nodig is om problemen op te lossen en biedt een AI-gestuurde samenvatting van de ‘uitvoeringscontext’ van de code. Het is een eerste hypothese voor de hoofdoorzaak van het probleem. Dit wordt vergezeld door visualisaties van datastromen tussen services en waar de interactie tussen deze onderdelen plaatsvond in de code.
Brave hond – aai over de bol?
Zijn alle tools en diensten die via het Datadog-platform worden aangeboden een voorbode van een nieuwe openbaring voor cloud-efficiëntie? Luidt het het einde in van overprovisioning? Het is in ieder geval een nieuwe, heldere visie om de typische Kubernetes-implementatie, die altijd complexer is dan hij zou moeten zijn, net zo eenvoudig te maken als het aaien van een hond (excuses voor de hond-gerelateerde analogie, ik kon er niet omheen)?
Ja, enigszins, maar waarschijnlijk niet tot het punt van perfectie, dus we kunnen nog meer bezoekjes aan de dierenarts krijgen naarmate we verder komen. Iemand een hondensnack?
Lees ook: VAST Data heeft Nvidia-certificaat op zak voor optimaliseren AI-datacenters