16. SRE ja palvelujen luotettavuuden kehittäminen
Manage episode 324669985 series 2827697
SRE eli Site Reliability Engineering on alunperin Googlen lanseeraama malli sovelluspalvelujen kehittämiseen ja hallintaan. Tavoitteena on lähestyä IT-operointia ja palveluiden luotettavuuden parantamista sovelluskehitysmäisesti ja riskejä hallitsemalla. Halusimme selvittää mitä kaikkea tämä käytännössä tarkoittaa. Tässä jaksossa meillä on vieraana Jaakko Pallari Polar Squadista avaamassa mitä kaikkea SRE oikeastaan on.
Linkkejä:
- Site Reliability Engineering
- SLO
- Incident Postmortem
- Chaos Engineering
- Chaos Toolkit
- Resilience4J
- Health Check
- Grafana
- Grafana Loki/
- Prometheus
- Elasticsearch
- InfluxDB
- Honeycomb
- Sloth
- SRE Finland
Vieras
- Jaakko Pallari: @lepovirta
Juontajat
Seuraa podcastia
- Kotisivu: https://koodiapinnanalla.fi/
- Twitter: @KoodiPinnanAlla
- Sähköposti: koodaillaan@koodiapinnanalla.fi
- Anna palautetta podcastista
- Tule mukaan kehittämään DIASia: https://dias.fi/jobs.html
38 episodi