Wesentliche Konzepte für moderne Cloud-Architektur: Ein vollständiges technisches Glossar

Building a cloud-based product means working with dozens of tools, patterns, and architectural decisions at the same time. Teams need a shared vocabulary to communicate efficiently.
This guide consolidates the foundational concepts of modern cloud architecture into a structured, reusable glossary that helps engineering, DevOps, and platform teams stay aligned.


1. Grundlagen zu Containern und Kubernetes

Kernkonzepte von Kubernetes

Pods, Deployments/StatefulSets, Services, Ingress, ConfigMaps, Secrets und Namespaces definieren, wo Workloads ausgeführt werden und wie sie innerhalb des Clusters kommunizieren. Mit korrektem Zugriff, Sicherheits- und Ressourcendefinitionen verhalten sich Cluster vorhersehbar und bleiben stabil.

Knoten- und Knotenpoolverwaltung

Die Leistung von Workloads hängt stark von der Hardware der Knoten, der Auswahl von Region/Zone und der Knotenpoolstrategie ab. Autoscaling-Regeln beeinflussen die Zuverlässigkeit bei variabler Last direkt.

Horizontaler Pod-Autoscaler (HPA)

Der HPA skaliert Pods automatisch basierend auf CPU-, Speicher- oder benutzerdefinierten Metriken. Korrekte Schwellenwerte sowie Mindest- und Höchstwerte verhindern Serviceausfälle bei plötzlichen Verkehrsspitzen.

Liveness / Readiness / Startup Probes

Probes informieren den Kubelet darüber, ob eine Anwendung gesund ist. Falsche Probe-Werte führen zu unnötigen Neustarts und Instabilität des Dienstes.

Container Image & Docker Basics

Layered image structure, entrypoint/command usage and multi-stage builds result in smaller, faster images. Proper image versioning improves CI/CD transparency.

Ressourcenanforderungen & -limits

Eine genaue CPU-/Speicherkonfiguration kontrolliert die Kosten und stellt eine faire Ressourcenzuweisung sicher. Falsche Limits können zu Drosselung oder Knotenabstürzen führen.


2. Event-Driven Architecture & Messaging

Apache Kafka

Mit Topics, Partitionen und Consumer-Gruppen transportiert Kafka zuverlässig Datenströme mit hohem Volumen. Offset- und Commit-Strategien ermöglichen eine sichere Wiederverarbeitung ohne Datenverlust.

Topic & Partition Design

Die korrekte Auswahl des Partitionsschlüssels bewahrt die Reihenfolge bei kritischen Operationen. Eine mangelhafte Partitionierung führt zu Latenzproblemen und Hotspots.

Skalierung von Consumer-Gruppen

Mitglieder derselben Gruppe teilen sich die Last, während separate Gruppen dieselben Daten unabhängig voneinander konsumieren – ideal für Sicherheitskonzepte und parallele Verarbeitungsszenarien.

Retry, DLQ & Back-Pressure

Retry-Richtlinien, Dead-Letter-Queues und die Steuerung der Consumer-Geschwindigkeit halten das Gleichgewicht zwischen Producer und Consumer aufrecht. Eine idempotente Verarbeitung verhindert zudem Probleme durch duplizierte Nachrichten.

Kafka-Benutzeroberflächen (UI) & Überwachungswerkzeuge

Die Sichtbarkeit von Consumer-Lag, Durchsatz und Partitions-Status hilft Administratoren dabei, Probleme frühzeitig zu erkennen und Muster zu identifizieren, die in Logs leicht übersehen werden.


3. Datenfluss & Orchestrierung

Apache NiFi

Processors, FlowFiles, Connections und Queues ermöglichen eine visuelle Datenflusssteuerung. Backpressure-Schwellenwerte und die Provenance-Verfolgung bieten dabei vollständige End-to-End-Transparenz.

NiFi Registry

Die Versionierung von Datenflüssen verbessert die Konsistenz zwischen verschiedenen Umgebungen. Rollbacks und Promotions werden zu einfachen, visuellen Vorgängen.

Link:  Wie das PEPPOL-Netzwerk technisch funktioniert (mit DNS-Logik)
Schritte einer Serverless-Funktion

Die Aufteilung von Workflows in zustandslose (stateless) Funktionen ermöglicht eine unabhängige Skalierung und schnellere Deployments. Payload-plus-Kontext-Modelle reduzieren dabei unnötige Abhängigkeiten.


4. API-Gateway & TLS-/Zertifikatsmanagement

API Gateways (Kong, KIC)

Routing, Authentifizierung, Ratenbegrenzung (Rate Limiting) und Protokollierung werden über einen zentralen Einstiegspunkt bereitgestellt. Die Unterstützung von gRPC und REST vereint dabei verschiedenartige Microservices.

cert-manager

ACME, Issuer/ClusterIssuer und DNS-Challenge-Mechanismen automatisieren das TLS-Zertifikatsmanagement. Eine konsistente Vertrauenskette (Trust Chain) bleibt selbst in hybriden Umgebungen gewahrt.


5. Observability & Operations

Prometheus Metrics

Counter, Gauges, Histogramme und Summaries messen das Systemverhalten. ServiceMonitor- und Scrape-Interval-Konfigurationen ermöglichen eine automatische Erkennung (Discovery). Ein gutes Label-Design verbessert zudem die Lesbarkeit der Abfragen.

Grafana Dashboards

Verwandelt Metriken in visuelle Narrative und ermöglicht ein zentralisiertes Alarmmanagement. Gemeinsam genutzte Dashboard-Bibliotheken schaffen ein einheitliches Verständnis innerhalb der Teams.

Fluent Bit Pipelines

Input → Filter → Output pipelines enrich logs and send them to Elasticsearch, OpenSearch and similar destinations. Adding trace-ID or customer-ID drastically reduces debugging time.

OpenTelemetry

“Bietet eine einheitliche Telemetrie für Metriken, Logs und Traces. Es reduziert den Vendor Lock-in und vereinfacht das Agent-Management durch Auto-Instrumentierung.

SLO / SLI / Error Budgets

Die frühzeitige Definition von Service-Zielen reduziert das Alarm-Rauschen (Alert Noise) und richtet Teams auf kundenorientierte Metriken aus.


6. Speicherung & Datenbanken

Amazon S3

Bucket-Design, Präfixe und Lifecycle-Richtlinien beeinflussen direkt die Kosten und die Beständigkeit (Durability). Signierte URLs (Pre-signed URLs) ermöglichen einen sicheren und kontrollierten Dateiaustausch.

PostgreSQL Multi-Tenant Patterns

Schema-Trennung, search_path und Row Level Security (RLS) verstärken die Isolation der Mandanten. Intelligente Indizierung und pgBouncer verbessern die Zuverlässigkeit unter hoher Last.

Redis Caching

Ideal für leistungsrelevante Daten durch Key-Value-Strukturen, TTLs, Rate-Limit-Tokens und Persistenzoptionen. Falsche Eviction-Policies können jedoch zu einer Cache-Degradierung führen.


7. CI/CD & DevOps

GitOps & Argo CD

“Die Verwaltung von Manifesten über Git gewährleistet einen lückenlosen Audit-Trail. Health-Check-Regeln und Branch-Filter stellen dabei die Konsistenz der Umgebungen sicher.

CI Pipeline (Build → Scan → Deploy)

Die Standardisierung der Pipeline – vom Code über das Image und den Security-Scan bis hin zum Deployment – minimiert Überraschungen im Produktivbetrieb. Quality-Gates reduzieren dabei kritische Ausfälle.

Helm Charts

Ermöglichen die Wiederverwendbarkeit über mehrere Umgebungen hinweg. Values-Dateien erlauben dabei umgebungsspezifische Secrets und Ressourcen-Konfigurationen.

Umgebungstrennung & Geheimnisverwaltung

Klare Grenzen zwischen Dev, Test und Prod sowie ein zentralisiertes Secret-Management (Secrets, External Secrets, Vault) sind essenziell für die Sicherheit.


8. Service Mesh (Optional)

Istio / Linkerd

Bietet mTLS, Traffic-Shifting, Policy-Enforcement und verbesserte Beobachtbarkeit (Observability). Der Datenverkehr kann gesteuert werden, ohne den Anwendungscode zu ändern.


9. Scaling & Performance Practices

Back-Pressure & Async Patterns

Der Ausgleich der Producer- und Consumer-Geschwindigkeit durch Warteschlangentiefe (Queue Depth) und Durchsatz verhindert Systeminstabilität. Das Vermeiden blockierender Operationen beschleunigt den Datenfluss.

Link:  ICANN, DNS-Auflösungskette und Autoritätskarte
Node Disk I/O & Storage Class Selection

Disk-IOPS definieren die eigentlichen Flaschenhälse, insbesondere bei NiFi-Repositories oder temporärem Objektspeicher.

Wiederholungslogik & Idempotenz

Gewährleistet Konsistenz in Persistenzschichten. Idempotenz-Schlüssel bieten zusätzliche Sicherheit für kritische Workflows.

Zustellgarantien

Wählen Sie je nach Anwendungsbedarf zwischen At-Least-Once oder Exactly-Once. Kompensationsabläufe (Compensation Flows) und Audit-Logs vereinfachen dabei die Wiederherstellung.


10. Praktische Leitfäden

CNCF Trail Map

Bietet eine empfohlene Abfolge – Container → Orchestrierung → Service Mesh → Observability – um die konzeptionelle Komplexität für die Teams zu reduzieren.

Cloud Well-Architected Frameworks

Sicherheit, Kosten und Betrieb werden mithilfe strukturierter Checklisten bewertet. AWS, Azure und GCP bieten hierfür dedizierte Frameworks an.

Cross-Team Glossary

Das Pflegen kurzer Definitionen in Confluence oder Notion hilft dabei, neue Teammitglieder schnell einzuarbeiten und eine konsistente Terminologie sicherzustellen.