Datensysteme

Aktualisiert am Mai 2026

InfluxDB Überwachung

Überwachen Sie den Schreibdurchsatz von InfluxDB, die Abfrageleistung, Kennzahlen der Speicher-Engine und den Zustand der Aufbewahrungsrichtlinien in Echtzeit – ganz ohne Konfiguration.

Kostenlose Testversion starten Dokumente anzeigen

Warum überwachen Sie InfluxDB?

InfluxDB ist die führende Zeitreihendatenbank für Metriken, Ereignisse und Echtzeitanalysen. Durch die Überwachung von InfluxDB werden eine reibungslose Dateneingabe, eine optimale Abfrageleistung und ein ordnungsgemäßes Aufbewahrungsmanagement gewährleistet.

Automatische Erkennung über Xitogent

Überwachung der Write-Point-Rate

Verfolgung der Abfrageausführungszeit

Metriken der Storage-Engine (TSM)

Zustand der Retention-Policy

Überwachung der Series-Kardinalität

Compaction-Verfolgung

1-Minuten-Erfassungsintervalle

Anpassbare Alarmschwellen für jede Metrik

Metrikerfassung im 1-Minuten-Takt out of the box

Was ist InfluxDB-Monitoring?

InfluxDB-Monitoring, erklärt

InfluxDB-Monitoring erfasst Write-Throughput-Stalls, ausufernde Series-Kardinalität (der klassische Ausfallmodus von InfluxDB 1.x/2.x), TSM-Compaction-Rückstände, langsame Queries und WAL-Wachstum, bevor sie Ingest-Verluste oder Query-Timeouts auf Ihren Grafana-Dashboards verursachen. Für IoT-Sensor-Pipelines, Application-Metrics-Backends und jede TICK-Stack-Bereitstellung ist die Sichtbarkeit pro Datenbank das, was einen 60-Sekunden-Alarm von einem mehrstündigen Incident auf der Suche nach fehlenden Datenpunkten unterscheidet. Xitoring erkennt Ihre InfluxDB automatisch, liest den nativen /metrics-Prometheus-Endpunkt und leitet Alarme an Slack, PagerDuty, Telegram oder Ihre bestehende Rufbereitschaft.

Kennzahlen

Was wir überwachen

Write Points/Sek.

Rate der geschriebenen Datenpunkte.

Abfragedauer

Durchschnittliche Abfrageausführungszeit.

Series-Kardinalität

Gesamtanzahl der eindeutigen Zeitreihen.

Speichergröße

TSM-Speicher auf der Festplatte.

Compaction-Rate

TSM-Compaction-Durchsatz.

Cache-Größe

In-Memory-Schreibcache-Nutzung.

WAL Disk Bytes

`storage.tsm1.wal.currentSegmentDiskBytes` + `oldSegmentsDiskBytes`. WAL-Wachstum ohne TSM-Konsolidierung bedeutet, dass die Recovery-Zeit beim Neustart explodieren wird.

Storage-Größe auf der Disk

`storage.tsm1.filestore.diskBytes` + numFiles pro Shard. Verfolgen Sie das gegen Ihre Retention Policy — hohe Dateianzahlen bei gleicher Datengröße deuten auf Fragmentierung hin.

HTTP 4xx / 5xx Rate

`httpd.clientError` + `httpd.serverError` (oder Prometheus `http_api_request_errors_total`). 4xx-Spitzen deuten auf Client-Schema-/Auth-Bugs hin; 5xx auf serverseitige Fehler.

Verbindungen / Auth-Fehler

`httpd.req` (gesamte HTTP-Requests), `httpd.authFail` (fehlgeschlagene Auth-Versuche), `httpd.pingReq`. Auth-Fehler-Spitzen weisen auf fehlkonfiguriertes Telegraf oder eine schiefgelaufene Credential-Rotation hin.

Runtime — Goroutines & GC

Go-Runtime-Stats: `runtime.NumGoroutine` (Goroutine-Leak-Erkennung), `runtime.HeapAlloc` (Live-Heap), `runtime.NumGC`/`PauseTotalNs` (GC-Druck). Leaks und Pause-Zeit-Regressionen erkennen, bevor es zu OOM kommt.

Subscription-Writes

`subscriber.pointsWritten` und `subscriber.writeFailures` — wenn Kapacitor oder nachgelagerte Pipelines über Subscriptions konsumieren, ist das der Weg, ihren Backpressure zu erkennen.

Auslöser & Benachrichtigungen

Konfigurierbare Alarmauslöser

Richten Sie benutzerdefinierte Trigger in Ihrem Dashboard ein, um benachrichtigt zu werden, sobald die Kennzahlen von „InfluxDB“ Ihre festgelegten Schwellenwerte überschreiten.

InfluxDB Dashboard zur Konfiguration von Überwachungsauslösern

Schreibdurchsatz

Warnung

Wird bei Anomalien der Schreibrate ausgelöst.

Abfragedauer

Warnung

Warnungen bei langsamen Abfragen.

Series-Kardinalität

entscheidend

Wird ausgelöst, wenn die Kardinalität zu hoch ist.

Speichergröße

entscheidend

Wird ausgelöst, wenn der Speicherplatz den Schwellenwert überschreitet.

Bedeutung von InfluxDB-Überwachung

InfluxDB verarbeitet schnelllebige Zeitreihendaten. Hohe Kardinalität, Schreibdruck und Compaction-Verzögerungen können die Leistung beeinträchtigen.

Schreibdurchsatz verfolgen, um die Ingestion-Gesundheit sicherzustellen
Series-Kardinalität überwachen, um OOM-Situationen zu vermeiden
Langsame Abfragen frühzeitig erkennen
Sicherstellen, dass die Compaction Schritt hält

Warum entscheiden Sie sich für Xitoring

Zero-Config-InfluxDB-Überwachung.

Installation mit einem einzigen Befehl
Globale Knoten
Zentrales Dashboard
Benachrichtigungen über mehrere Kanäle
Aufbewahrungsfristen

Anwendungsfälle

Häufige InfluxDB-Monitoring- Szenarien

Wo InfluxDB heute typischerweise läuft – und was schiefgehen könnte, wenn niemand aufpasst.

Die Datenbank hinter den Dashboards Ihres Teams

Wenn Dashboards in Grafana oder einem anderen Tool langsam erscheinen, liegt die Ursache oft in der darunterliegenden Datenbank – nicht im Dashboard selbst. Wir zeigen auf, wo die Langsamkeit tatsächlich liegt, damit das Team das Richtige behebt, anstatt dem Symptom hinterherzujagen.

Datenfluss von Sensoren und Geräten

Verbundene Geräte, Fabrikausrüstung und IoT-Sensoren senden jede Sekunde jedes Tages Messwerte. Ein stiller Rückstau in der Pipeline bedeutet Datenverlust – und verlorene Daten sind für immer verloren. Wir überwachen den Fluss von Ende zu Ende, damit ein einziger verlorener Messwert Alarm auslöst.

App- und Infrastrukturmetriken an einem Ort

Wenn dieselbe Datenbank sowohl App-Metriken als auch Server-Metriken enthält, verbirgt ein Problem mit der Datenbank alle Signale auf einmal. Wir überwachen die Datenbank selbst, damit das eigene Monitoring des Teams während eines Vorfalls niemals ausfällt.

Bevor Sie beginnen

Voraussetzungen für InfluxDB

Stellen Sie sicher, dass diese Punkte erfüllt sind — danach ist die Installation eine Sache von 60 Sekunden.

InfluxDB 1.x oder 2.x läuft auf dem Server
InfluxDB-HTTP-Port von Xitogent aus erreichbar (Standard 8086)
Optional: ein Read-only-Token, falls InfluxDB 2.x-Authentifizierung aktiviert ist

Einrichtungsanleitung

Erste Schritte in Minuten

Xitogent auf Ihrem InfluxDB-Host installieren

Installieren Sie den ressourcenschonenden Xitogent-Monitoring-Agenten auf dem Host, auf dem InfluxDB läuft.

curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY

Bestätigen, dass InfluxDB erreichbar ist

Prüfen Sie, dass InfluxDB auf seinem HTTP-Port (Standard 8086) lauscht und vom Xitogent-Host aus erreichbar ist. Xitogent fragt während der Integration nach Host und Port — zusätzliche Konfigurationsanpassungen oder Endpunkt-Freigaben sind nicht erforderlich.

sudo xitogent integrate

InfluxDB-Integration aktivieren

Aktivieren Sie die InfluxDB-Integration über das Xitoring-Dashboard oder die CLI. Xitogent erkennt Ihre InfluxDB-Version automatisch und beginnt mit der Erfassung von Schreib-, Query- und Storage-Metriken.

Alarmschwellen konfigurieren (optional)

Legen Sie eigene Schwellenwerte für Schreibdurchsatz, Query-Dauer oder Series-Kardinalität fest, um Ingest-Druck und unkontrolliertes Tag-Wachstum zu erkennen, bevor Queries langsamer werden.

Funktion überprüfen

Führen Sie diesen Befehl auf dem Server aus, um zu bestätigen, dass Xitogent die Integration erkannt hat. Innerhalb von etwa 30 Sekunden werden frische Metriken in Ihr Dashboard gestreamt.

sudo xitogent status

Vergleichen

Erwägen Sie Alternativen?

Sehen Sie, wie sich Xitoring gegen die Alternativen für InfluxDB-Monitoring schlägt — Pauschalpreise, tiefere Integrationen und ein Agent, der Ihren gesamten Stack abdeckt.

Xitoring vs.

Datadog

Pay-per-Host-Preise werden bei großem Umfang schnell teuer. Sehen Sie, wo Xitoring die gleiche Abdeckung mit einem Pauschaltarif liefert.

Xitoring vs.

New Relic

Full-Stack-Observability ohne Enterprise-Stufen, Ingestion-Gebühren oder Lizenzen pro Nutzer.

Xitoring vs.

Grafana Cloud

Ein Tool zu einem Preis, statt Prometheus, Loki und Grafana zu einem Stack zusammenzuflicken, den Sie selbst überwachen müssen.

Alle Vergleiche ansehen

Häufig gestellte Fragen

InfluxDB 1.x und 2.x?

Beide Versionen werden unterstützt.

Auswirkungen?

Unbedeutend – liest vom Endpunkt /debug/vars.

Wie erkenne ich InfluxDB-Kardinalitätsprobleme?

Series-Kardinalität IST der Ausfallmodus von InfluxDB 1.x/2.x — zu viele einzigartige Tag-Kombinationen verursachen OOM und langsame Queries. Führen Sie `SHOW SERIES CARDINALITY` (InfluxQL) oder `import "influxdata/influxdb/v1" v1.cardinality(...)` (Flux) aus, oder lesen Sie `database.numSeries` aus `_internal`. Alarmieren Sie bei jedem Sprung von 50 %+ gegenüber dem Baseline-Wert — das ist fast immer eine Tag-Value-Explosion durch ein unbeabsichtigt hochkardinales Feld (Request-IDs, Timestamps als Tags, User-IDs).

Was ist die _internal-Datenbank in InfluxDB?

`_internal` ist die spezielle Datenbank, in die InfluxDB 1.x seine eigenen Metriken schreibt — derselbe TSM-Speicher wie Userdaten, abfragbar via `USE _internal` + `SHOW MEASUREMENTS`. Enthält Measurements wie `write`, `queryExecutor`, `tsm1_engine`, `tsm1_cache`, `tsm1_wal`, `httpd`, `runtime`, `database`, `shard`. In InfluxDB 2.x wurde dies in den `_monitoring`-Bucket verschoben (vom Monitoring-Template eingerichtet). In 3.0 ist der `/metrics`-Prometheus-Endpunkt die kanonische Oberfläche.

Wie überwache ich InfluxDB-Compactions?

TSM-Compactions führen kleine WAL-/Cache-Dateien auf drei Ebenen (L1/L2/L3) plus Full-Compactions zu größeren optimierten Dateien zusammen. Beobachten Sie `storage.tsm1.compactions.cacheCompactionDuration`, `tsmLevel{1,2,3}CompactionQueue` (Queue-Tiefe — ungleich null bedeutet Rückstand) und `tsmLevel{1,2,3}CompactionDuration`. Eine wachsende Queue bei normaler Write-Rate = Compactor hängt hinterher = Query-Degradation steht bevor. Entweder hochskalieren oder Write-Rate reduzieren.

Was ist der Unterschied zwischen InfluxDB-1.x-, -2.x- und -3.0-Monitoring?

1.x verwendet InfluxQL + TICK-Stack, stellt `/debug/vars` und die `_internal`-Datenbank bereit, betreibt die TSM/TSI-Storage-Engine. 2.x verwendet Flux + Tasks, stellt `/metrics` (Prometheus) und den `_monitoring`-Bucket bereit, mit gleichem TSM/TSI darunter. 3.0 ist die neue FDAP-Architektur — DataFusion-Query-Engine, Parquet-Storage auf Object Stores, hat das Kardinalitätslimit vollständig entfernt, unterstützt SQL neben InfluxQL (Flux ist im Maintenance-Modus). Xitogent erkennt die Version automatisch und passt sich an.

Wie erkenne ich Langsamkeit bei InfluxDB-Queries?

Verfolgen Sie `queryExecutor.queryDurationNs` (mittlere Query-Zeit) und `queriesActive` (gleichzeitige laufende Queries). Spitzen bei Dashboard-Refreshes sind erwartet; anhaltendes Wachstum bedeutet, dass Queries langsamer werden (oft kardinalitäts- oder compaction-backlog-getrieben). Aktivieren Sie das Slow-Query-Log (`log-queries-after = '5s'` in `influxdb.conf` für 1.x), um bestimmte Übeltäter zur Untersuchung zu erfassen.

Wie überwache ich InfluxDB-TSM-Storage?

TSM (Time-Structured Merge Tree) ist die On-Disk-Storage-Engine für 1.x/2.x. Überwachen Sie `storage.tsm1.filestore.diskBytes` (gesamte On-Disk-Größe) und `numFiles` (Dateianzahl — hohe Zahlen bei gleichen Bytes = Fragmentierung). Kombinieren Sie das mit `storage.tsm1.cache.cachedBytes` (In-Memory-Write-Buffer) und WAL-Größe. Anhaltendes WAL-Wachstum ohne TSM-Konsolidierung = Compactor-Problem; aufgeblähte numFiles = Retention/Compaction kommt mit den Writes nicht hinterher.

Beeinträchtigt diese Integration die InfluxDB-Performance?

Keine messbare Auswirkung. Xitogent liest vom nativen `/metrics`-Prometheus-Endpunkt (oder `_internal`-/`_monitoring`-Query-Views) im 1-Minuten-Intervall — derselbe leichtgewichtige Mechanismus, den die eigenen Tools von InfluxData verwenden. Keine Instrumentierung wird in den Write-Pfad oder die Query-Engine injiziert.

InfluxDB überwachen heute

In weniger als 60 Sekunden eingerichtet. Keine Kreditkarte erforderlich. Umfassende Kennzahlen vom ersten Tag an.

Kostenlose Testversion starten

Entdecke weiter

InfluxDB Überwachung

Warum überwachen Sie InfluxDB?

InfluxDB-Monitoring, erklärt

Was wir überwachen

Write Points/Sek.

Abfragedauer

Series-Kardinalität

Speichergröße

Compaction-Rate

Cache-Größe

WAL Disk Bytes

Storage-Größe auf der Disk

HTTP 4xx / 5xx Rate

Verbindungen / Auth-Fehler

Runtime — Goroutines & GC

Subscription-Writes

Konfigurierbare Alarmauslöser

Schreibdurchsatz

Abfragedauer

Series-Kardinalität

Speichergröße

Bedeutung von InfluxDB-Überwachung

Warum entscheiden Sie sich für Xitoring

Häufige InfluxDB-Monitoring- Szenarien

Die Datenbank hinter den Dashboards Ihres Teams

Datenfluss von Sensoren und Geräten

App- und Infrastrukturmetriken an einem Ort

Voraussetzungen für InfluxDB

Erste Schritte in Minuten

Xitogent auf Ihrem InfluxDB-Host installieren

Bestätigen, dass InfluxDB erreichbar ist

InfluxDB-Integration aktivieren

Alarmschwellen konfigurieren (optional)

Funktion überprüfen

Erwägen Sie Alternativen?

Datadog

New Relic

Grafana Cloud

Häufig gestellte Fragen

InfluxDB überwachen heute

Verwandte Themen Integrationen