Systèmes de données

Mis à jour le mai 2026

InfluxDB Suivi

Surveillez en temps réel le débit d'écriture d'InfluxDB, les performances des requêtes, les indicateurs du moteur de stockage et l'état des politiques de conservation, sans aucune configuration.

Commencer l'essai gratuit Consulter les documents

Pourquoi surveiller ? InfluxDB?

InfluxDB est la principale base de données de séries chronologiques dédiée aux métriques, aux événements et à l'analyse en temps réel. La surveillance d'InfluxDB garantit une ingestion des données en écriture sans faille, des performances de requête optimales et une gestion adéquate de la conservation des données.

Détection automatique via Xitogent

Surveillance du taux d'écriture des points

Suivi du temps d'exécution des requêtes

Métriques du moteur de stockage (TSM)

Santé des politiques de rétention

Surveillance de la cardinalité des séries

Suivi des compactions

Intervalles de collecte d'1 minute

Seuils d'alerte personnalisables pour chaque métrique

Intervalles de collecte des métriques d'une minute par défaut

Qu'est-ce que le monitoring InfluxDB ?

Le monitoring InfluxDB, expliqué

Le monitoring InfluxDB détecte les blocages de débit en écriture, l'explosion de cardinalité des séries (le mode de défaillance classique d'InfluxDB 1.x/2.x), l'accumulation de compactions TSM, les ralentissements de requêtes et la croissance du WAL avant qu'ils ne provoquent une perte d'ingestion ou des timeouts de requêtes sur vos dashboards Grafana. Pour les pipelines de capteurs IoT, les backends de métriques applicatives et tout déploiement TICK-stack, la visibilité par base de données fait la différence entre une alerte à 60 secondes et un incident multi-heures à chercher des points de données manquants. Xitoring découvre automatiquement votre InfluxDB, lit l'endpoint Prometheus natif /metrics et achemine les alertes vers Slack, PagerDuty, Telegram ou votre astreinte existante.

Indicateurs

Ce que nous surveillons

Points écrits/sec

Taux d'écriture des points de données.

Durée des requêtes

Temps moyen d'exécution des requêtes.

Cardinalité des séries

Total des séries temporelles uniques.

Taille du stockage

Stockage TSM sur disque.

Taux de compaction

Débit de compaction TSM.

Taille du cache

Utilisation du cache d'écriture en mémoire.

Octets disque du WAL

`storage.tsm1.wal.currentSegmentDiskBytes` + `oldSegmentsDiskBytes`. La croissance du WAL sans consolidation TSM signifie que le temps de récupération explosera au redémarrage.

Taille de stockage sur disque

`storage.tsm1.filestore.diskBytes` + numFiles par shard. À suivre par rapport à votre politique de rétention — des nombres élevés de fichiers à taille de données identique signalent la fragmentation.

Taux HTTP 4xx / 5xx

`httpd.clientError` + `httpd.serverError` (ou `http_api_request_errors_total` côté Prometheus). Les pics de 4xx signalent des bugs de schéma/auth côté client ; les 5xx signalent des défaillances côté serveur.

Connexions / Échecs d'authentification

`httpd.req` (total des requêtes HTTP), `httpd.authFail` (tentatives d'auth échouées), `httpd.pingReq`. Les pics d'échecs d'auth signalent un Telegraf mal configuré ou une rotation d'identifiants ratée.

Runtime — Goroutines & GC

Statistiques runtime Go : `runtime.NumGoroutine` (détection de fuites de goroutines), `runtime.HeapAlloc` (heap vivant), `runtime.NumGC`/`PauseTotalNs` (pression GC). Détectez les fuites et les régressions de temps de pause avant l'OOM.

Écritures d'abonnement

`subscriber.pointsWritten` et `subscriber.writeFailures` — lorsque Kapacitor ou les pipelines en aval consomment via des abonnements, c'est ainsi que vous détectez leur backpressure.

Déclencheurs et alertes

Configurables déclencheurs d'alerte

Configurez des déclencheurs personnalisés dans votre tableau de bord pour être averti dès que les indicateurs d{name}s dépassent les seuils que vous avez définis.

InfluxDB tableau de bord de configuration des déclencheurs de surveillance

Débit d'écriture

avertissement

Se déclenche sur des anomalies du taux d'écriture.

Durée des requêtes

avertissement

Alerte sur les requêtes lentes.

Cardinalité des séries

crucial

Se déclenche lorsque la cardinalité est trop élevée.

Taille du stockage

crucial

Se déclenche lorsque le stockage dépasse le seuil.

Importance de la surveillance InfluxDB

InfluxDB gère des données de séries temporelles à haute vélocité. Une cardinalité élevée, la pression d'écriture et les retards de compaction peuvent dégrader les performances.

Suivez le débit d'écriture pour la santé d'ingestion
Surveillez la cardinalité des séries pour prévenir les OOM
Détectez tôt les requêtes lentes
Assurez-vous que la compaction suit le rythme

Pourquoi choisir Xitoring

Surveillance InfluxDB sans configuration.

Installation en une commande
Nœuds mondiaux
Tableau de bord unifié
Alertes multicanaux
Conservation historique

Cas d'usage

Scénarios courants de monitoring InfluxDB

Où InfluxDB fonctionne généralement aujourd'hui — et ce qui pourrait mal tourner si personne ne surveille.

La base de données derrière les tableaux de bord de votre équipe

Lorsque les tableaux de bord dans Grafana ou un autre outil semblent lents, la cause est souvent la base de données sous-jacente — et non le tableau de bord lui-même. Nous mettons en évidence l'origine réelle de la lenteur afin que l'équipe corrige le bon élément au lieu de courir après le symptôme.

Données provenant de capteurs et d'appareils

Les appareils connectés, les équipements d'usine et les capteurs IoT envoient des mesures chaque seconde de chaque jour. Une sauvegarde silencieuse dans le pipeline signifie des données perdues — et les données perdues sont perdues à jamais. Nous surveillons le flux de bout en bout afin qu'une seule lecture manquée déclenche l'alarme.

Métriques d'application et d'infrastructure en un seul endroit

Lorsque la même base de données contient à la fois les métriques d'application et les métriques de serveur, un problème avec la base de données masque tous les signaux à la fois. Nous surveillons la base de données elle-même afin que la propre surveillance de l'équipe ne s'interrompe jamais pendant un incident.

Avant de commencer

Prérequis pour InfluxDB

Assurez-vous d'avoir tout cela en place — la plupart des installations sont une affaire de 60 secondes une fois ces conditions réunies.

InfluxDB 1.x ou 2.x tournant sur le serveur
Port HTTP InfluxDB accessible depuis Xitogent (par défaut 8086)
Facultatif : un token en lecture seule si l'authentification InfluxDB 2.x est activée

Guide d'installation

Commencez par procès-verbal

Installer Xitogent sur votre hôte InfluxDB

Installez l'agent de monitoring léger Xitogent sur l'hôte qui exécute InfluxDB.

curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY

Confirmer qu'InfluxDB est accessible

Vérifiez qu'InfluxDB écoute sur son port HTTP (par défaut 8086) et est accessible depuis l'hôte qui exécute Xitogent. Xitogent demandera l'hôte et le port lors de l'integrate — aucune modification de configuration ou exposition d'endpoint supplémentaire n'est requise.

sudo xitogent integrate

Activer l'intégration InfluxDB

Utilisez le tableau de bord Xitoring ou la CLI pour activer l'intégration InfluxDB. Xitogent détecte automatiquement votre version d'InfluxDB et commence à collecter les métriques d'écriture, de requête et de stockage.

Configurer les seuils d'alerte (facultatif)

Définissez des seuils personnalisés pour le débit d'écriture, la durée des requêtes ou la cardinalité des séries afin de détecter la pression d'ingestion et la croissance incontrôlée des tags avant que les requêtes ne ralentissent.

Vérifier que tout fonctionne

Exécutez cette commande sur le serveur pour confirmer que Xitogent a bien détecté l'intégration. De nouvelles métriques apparaîtront sur votre tableau de bord dans environ 30 secondes.

sudo xitogent status

Comparer

Vous envisagez des alternatives ?

Découvrez comment Xitoring se positionne face aux alternatives pour la surveillance de InfluxDB — tarifs forfaitaires, intégrations plus poussées et un seul agent pour couvrir tout votre stack.

Xitoring vs

Datadog

La tarification à l'hôte devient vite onéreuse à grande échelle. Découvrez comment Xitoring offre la même couverture avec un forfait fixe.

Xitoring vs

New Relic

Une observabilité full-stack sans paliers entreprise, frais d'ingestion ni licences par utilisateur.

Xitoring vs

Grafana Cloud

Un seul outil à un seul prix, plutôt que d'assembler Prometheus, Loki et Grafana dans un stack que vous devez aussi surveiller.

Voir toutes les comparaisons

Souvent a posé des questions

InfluxDB 1.x et 2.x ?

Les deux versions sont prises en charge.

Conséquences ?

Négligeable — lecture à partir du point de terminaison /debug/vars.

Comment détecter les problèmes de cardinalité InfluxDB ?

La cardinalité des séries EST LE mode de défaillance d'InfluxDB 1.x/2.x — trop de combinaisons de tags uniques causent OOM et requêtes lentes. Exécutez `SHOW SERIES CARDINALITY` (InfluxQL) ou `import "influxdata/influxdb/v1" v1.cardinality(...)` (Flux), ou lisez `database.numSeries` depuis `_internal`. Alertez sur tout bond de 50 %+ depuis la baseline — c'est presque toujours une explosion de valeurs de tags issue d'un champ à haute cardinalité non intentionnel (IDs de requêtes, timestamps en tags, IDs utilisateurs).

Qu'est-ce que la base _internal dans InfluxDB ?

`_internal` est la base spéciale dans laquelle InfluxDB 1.x écrit ses propres métriques — même stockage TSM que les données utilisateur, interrogeable via `USE _internal` + `SHOW MEASUREMENTS`. Contient des mesures comme `write`, `queryExecutor`, `tsm1_engine`, `tsm1_cache`, `tsm1_wal`, `httpd`, `runtime`, `database`, `shard`. Dans InfluxDB 2.x, cela a été déplacé vers le bucket `_monitoring` (configuré par le template Monitoring). Dans la 3.0, l'endpoint Prometheus `/metrics` est la surface canonique.

Comment monitorer les compactions InfluxDB ?

Les compactions TSM fusionnent les petits fichiers WAL/cache en fichiers optimisés plus gros à trois niveaux (L1/L2/L3) plus les compactions complètes. Surveillez `storage.tsm1.compactions.cacheCompactionDuration`, `tsmLevel{1,2,3}CompactionQueue` (profondeur de file — non nulle = arriéré) et `tsmLevel{1,2,3}CompactionDuration`. Une file qui croît avec un taux d'écriture normal = compacteur qui prend du retard = dégradation des requêtes imminente. Soit montez en puissance, soit réduisez le taux d'écriture.

Quelle est la différence entre le monitoring InfluxDB 1.x, 2.x et 3.0 ?

1.x utilise InfluxQL + le stack TICK, expose `/debug/vars` et la base `_internal`, fait tourner le moteur de stockage TSM/TSI. 2.x utilise Flux + tâches, expose `/metrics` (Prometheus) et le bucket `_monitoring`, même TSM/TSI en dessous. 3.0 est la nouvelle architecture FDAP — moteur de requêtes DataFusion, stockage Parquet sur object stores, suppression complète de la limite de cardinalité, support SQL aux côtés d'InfluxQL (Flux est en mode maintenance). Xitogent détecte automatiquement la version et s'adapte.

Comment détecter la lenteur des requêtes InfluxDB ?

Suivez `queryExecutor.queryDurationNs` (temps de requête moyen) et `queriesActive` (requêtes simultanées en cours). Les pics lors des rafraîchissements de dashboards sont attendus ; une croissance soutenue signifie que les requêtes ralentissent (souvent causé par la cardinalité ou un arriéré de compactions). Activez le slow query log (`log-queries-after = '5s'` dans `influxdb.conf` pour 1.x) pour capturer les requêtes coupables et les investiguer.

Comment monitorer le stockage TSM d'InfluxDB ?

TSM (Time-Structured Merge tree) est le moteur de stockage sur disque pour 1.x/2.x. Monitorez `storage.tsm1.filestore.diskBytes` (taille totale sur disque) et `numFiles` (nombre de fichiers — un nombre élevé pour la même quantité d'octets = fragmentation). Associez avec `storage.tsm1.cache.cachedBytes` (buffer d'écriture en mémoire) et la taille du WAL. Croissance soutenue du WAL sans consolidation TSM = problème de compacteur ; numFiles qui explose = rétention/compaction ne suit pas le rythme des écritures.

Cette intégration affectera-t-elle les performances d'InfluxDB ?

Aucun impact mesurable. Xitogent lit depuis l'endpoint Prometheus natif `/metrics` (ou les vues de requêtes `_internal` / `_monitoring`) à un intervalle d'une minute — le même mécanisme léger qu'utilisent les propres outils d'InfluxData. Aucune instrumentation injectée dans le chemin d'écriture ou le moteur de requêtes.

Commencer à surveiller InfluxDB aujourd'hui

Configuration en moins de 60 secondes. Aucune carte bancaire requise. Statistiques complètes dès le premier jour.

Commencer l'essai gratuit

Continuez à explorer

Connexes Intégrations

PostgreSQL

Redis

Elasticsearch