Wesentliche Konzepte für moderne Cloud-Architektur: Ein vollständiges technisches Glossar
Building a cloud-based product means working with dozens of tools, patterns, and architectural decisions at the same time. Teams need a shared vocabulary to communicate efficiently.
This guide consolidates the foundational concepts of modern cloud architecture into a structured, reusable glossary that helps engineering, DevOps, and platform teams stay aligned.
1. Grundlagen zu Containern und Kubernetes
Kernkonzepte von Kubernetes
Pods, Deployments/StatefulSets, Services, Ingress, ConfigMaps, Secrets und Namespaces definieren, wo Workloads ausgeführt werden und wie sie innerhalb des Clusters kommunizieren. Mit korrektem Zugriff, Sicherheits- und Ressourcendefinitionen verhalten sich Cluster vorhersehbar und bleiben stabil.
Knoten- und Knotenpoolverwaltung
Die Leistung von Workloads hängt stark von der Hardware der Knoten, der Auswahl von Region/Zone und der Knotenpoolstrategie ab. Autoscaling-Regeln beeinflussen die Zuverlässigkeit bei variabler Last direkt.
Horizontaler Pod-Autoscaler (HPA)
Der HPA skaliert Pods automatisch basierend auf CPU-, Speicher- oder benutzerdefinierten Metriken. Korrekte Schwellenwerte sowie Mindest- und Höchstwerte verhindern Serviceausfälle bei plötzlichen Verkehrsspitzen.
Liveness / Readiness / Startup Probes
Probes informieren den Kubelet darüber, ob eine Anwendung gesund ist. Falsche Probe-Werte führen zu unnötigen Neustarts und Instabilität des Dienstes.
Container Image & Docker Basics
Layered image structure, entrypoint/command usage and multi-stage builds result in smaller, faster images. Proper image versioning improves CI/CD transparency.
Ressourcenanforderungen & -limits
Eine genaue CPU-/Speicherkonfiguration kontrolliert die Kosten und stellt eine faire Ressourcenzuweisung sicher. Falsche Limits können zu Drosselung oder Knotenabstürzen führen.
2. Event-Driven Architecture & Messaging
Apache Kafka
Mit Topics, Partitionen und Consumer-Gruppen transportiert Kafka zuverlässig Datenströme mit hohem Volumen. Offset- und Commit-Strategien ermöglichen eine sichere Wiederverarbeitung ohne Datenverlust.
Topic & Partition Design
Die korrekte Auswahl des Partitionsschlüssels bewahrt die Reihenfolge bei kritischen Operationen. Eine mangelhafte Partitionierung führt zu Latenzproblemen und Hotspots.
Skalierung von Consumer-Gruppen
Mitglieder derselben Gruppe teilen sich die Last, während separate Gruppen dieselben Daten unabhängig voneinander konsumieren – ideal für Sicherheitskonzepte und parallele Verarbeitungsszenarien.
Retry, DLQ & Back-Pressure
Retry-Richtlinien, Dead-Letter-Queues und die Steuerung der Consumer-Geschwindigkeit halten das Gleichgewicht zwischen Producer und Consumer aufrecht. Eine idempotente Verarbeitung verhindert zudem Probleme durch duplizierte Nachrichten.
Kafka-Benutzeroberflächen (UI) & Überwachungswerkzeuge
Die Sichtbarkeit von Consumer-Lag, Durchsatz und Partitions-Status hilft Administratoren dabei, Probleme frühzeitig zu erkennen und Muster zu identifizieren, die in Logs leicht übersehen werden.
3. Datenfluss & Orchestrierung
Apache NiFi
Processors, FlowFiles, Connections und Queues ermöglichen eine visuelle Datenflusssteuerung. Backpressure-Schwellenwerte und die Provenance-Verfolgung bieten dabei vollständige End-to-End-Transparenz.
NiFi Registry
Die Versionierung von Datenflüssen verbessert die Konsistenz zwischen verschiedenen Umgebungen. Rollbacks und Promotions werden zu einfachen, visuellen Vorgängen.
Schritte einer Serverless-Funktion
Die Aufteilung von Workflows in zustandslose (stateless) Funktionen ermöglicht eine unabhängige Skalierung und schnellere Deployments. Payload-plus-Kontext-Modelle reduzieren dabei unnötige Abhängigkeiten.
4. API-Gateway & TLS-/Zertifikatsmanagement
API Gateways (Kong, KIC)
Routing, Authentifizierung, Ratenbegrenzung (Rate Limiting) und Protokollierung werden über einen zentralen Einstiegspunkt bereitgestellt. Die Unterstützung von gRPC und REST vereint dabei verschiedenartige Microservices.
cert-manager
ACME, Issuer/ClusterIssuer und DNS-Challenge-Mechanismen automatisieren das TLS-Zertifikatsmanagement. Eine konsistente Vertrauenskette (Trust Chain) bleibt selbst in hybriden Umgebungen gewahrt.
5. Observability & Operations
Prometheus Metrics
Counter, Gauges, Histogramme und Summaries messen das Systemverhalten. ServiceMonitor- und Scrape-Interval-Konfigurationen ermöglichen eine automatische Erkennung (Discovery). Ein gutes Label-Design verbessert zudem die Lesbarkeit der Abfragen.
Grafana Dashboards
Verwandelt Metriken in visuelle Narrative und ermöglicht ein zentralisiertes Alarmmanagement. Gemeinsam genutzte Dashboard-Bibliotheken schaffen ein einheitliches Verständnis innerhalb der Teams.
Fluent Bit Pipelines
Input → Filter → Output pipelines enrich logs and send them to Elasticsearch, OpenSearch and similar destinations. Adding trace-ID or customer-ID drastically reduces debugging time.
OpenTelemetry
“Bietet eine einheitliche Telemetrie für Metriken, Logs und Traces. Es reduziert den Vendor Lock-in und vereinfacht das Agent-Management durch Auto-Instrumentierung.
SLO / SLI / Error Budgets
Die frühzeitige Definition von Service-Zielen reduziert das Alarm-Rauschen (Alert Noise) und richtet Teams auf kundenorientierte Metriken aus.
6. Speicherung & Datenbanken
Amazon S3
Bucket-Design, Präfixe und Lifecycle-Richtlinien beeinflussen direkt die Kosten und die Beständigkeit (Durability). Signierte URLs (Pre-signed URLs) ermöglichen einen sicheren und kontrollierten Dateiaustausch.
PostgreSQL Multi-Tenant Patterns
Schema-Trennung, search_path und Row Level Security (RLS) verstärken die Isolation der Mandanten. Intelligente Indizierung und pgBouncer verbessern die Zuverlässigkeit unter hoher Last.
Redis Caching
Ideal für leistungsrelevante Daten durch Key-Value-Strukturen, TTLs, Rate-Limit-Tokens und Persistenzoptionen. Falsche Eviction-Policies können jedoch zu einer Cache-Degradierung führen.
7. CI/CD & DevOps
GitOps & Argo CD
“Die Verwaltung von Manifesten über Git gewährleistet einen lückenlosen Audit-Trail. Health-Check-Regeln und Branch-Filter stellen dabei die Konsistenz der Umgebungen sicher.
CI Pipeline (Build → Scan → Deploy)
Die Standardisierung der Pipeline – vom Code über das Image und den Security-Scan bis hin zum Deployment – minimiert Überraschungen im Produktivbetrieb. Quality-Gates reduzieren dabei kritische Ausfälle.
Helm Charts
Ermöglichen die Wiederverwendbarkeit über mehrere Umgebungen hinweg. Values-Dateien erlauben dabei umgebungsspezifische Secrets und Ressourcen-Konfigurationen.
Umgebungstrennung & Geheimnisverwaltung
Klare Grenzen zwischen Dev, Test und Prod sowie ein zentralisiertes Secret-Management (Secrets, External Secrets, Vault) sind essenziell für die Sicherheit.
8. Service Mesh (Optional)
Istio / Linkerd
Bietet mTLS, Traffic-Shifting, Policy-Enforcement und verbesserte Beobachtbarkeit (Observability). Der Datenverkehr kann gesteuert werden, ohne den Anwendungscode zu ändern.
9. Scaling & Performance Practices
Back-Pressure & Async Patterns
Der Ausgleich der Producer- und Consumer-Geschwindigkeit durch Warteschlangentiefe (Queue Depth) und Durchsatz verhindert Systeminstabilität. Das Vermeiden blockierender Operationen beschleunigt den Datenfluss.
Node Disk I/O & Storage Class Selection
Disk-IOPS definieren die eigentlichen Flaschenhälse, insbesondere bei NiFi-Repositories oder temporärem Objektspeicher.
Wiederholungslogik & Idempotenz
Gewährleistet Konsistenz in Persistenzschichten. Idempotenz-Schlüssel bieten zusätzliche Sicherheit für kritische Workflows.
Zustellgarantien
Wählen Sie je nach Anwendungsbedarf zwischen At-Least-Once oder Exactly-Once. Kompensationsabläufe (Compensation Flows) und Audit-Logs vereinfachen dabei die Wiederherstellung.
10. Praktische Leitfäden
CNCF Trail Map
Bietet eine empfohlene Abfolge – Container → Orchestrierung → Service Mesh → Observability – um die konzeptionelle Komplexität für die Teams zu reduzieren.
Cloud Well-Architected Frameworks
Sicherheit, Kosten und Betrieb werden mithilfe strukturierter Checklisten bewertet. AWS, Azure und GCP bieten hierfür dedizierte Frameworks an.
Cross-Team Glossary
Das Pflegen kurzer Definitionen in Confluence oder Notion hilft dabei, neue Teammitglieder schnell einzuarbeiten und eine konsistente Terminologie sicherzustellen.







