Systèmes de données
    Mis à jour le mai 2026
    InfluxDB logo

    InfluxDB Suivi

    Surveillez en temps réel le débit d'écriture d'InfluxDB, les performances des requêtes, les indicateurs du moteur de stockage et l'état des politiques de conservation, sans aucune configuration.

    Pourquoi surveiller ? InfluxDB?

    InfluxDB est la principale base de données de séries chronologiques dédiée aux métriques, aux événements et à l'analyse en temps réel. La surveillance d'InfluxDB garantit une ingestion des données en écriture sans faille, des performances de requête optimales et une gestion adéquate de la conservation des données.

    Détection automatique via Xitogent
    Surveillance du taux d'écriture des points
    Suivi du temps d'exécution des requêtes
    Métriques du moteur de stockage (TSM)
    Santé des politiques de rétention
    Surveillance de la cardinalité des séries
    Suivi des compactions
    Intervalles de collecte d'1 minute
    Seuils d'alerte personnalisables pour chaque métrique
    Intervalles de collecte des métriques d'une minute par défaut
    Qu'est-ce que le monitoring InfluxDB ?

    Le monitoring InfluxDB, expliqué

    Le monitoring InfluxDB détecte les blocages de débit en écriture, l'explosion de cardinalité des séries (le mode de défaillance classique d'InfluxDB 1.x/2.x), l'accumulation de compactions TSM, les ralentissements de requêtes et la croissance du WAL avant qu'ils ne provoquent une perte d'ingestion ou des timeouts de requêtes sur vos dashboards Grafana. Pour les pipelines de capteurs IoT, les backends de métriques applicatives et tout déploiement TICK-stack, la visibilité par base de données fait la différence entre une alerte à 60 secondes et un incident multi-heures à chercher des points de données manquants. Xitoring découvre automatiquement votre InfluxDB, lit l'endpoint Prometheus natif /metrics et achemine les alertes vers Slack, PagerDuty, Telegram ou votre astreinte existante.

    Indicateurs

    Ce que nous surveillons

    Points écrits/sec

    Taux d'écriture des points de données.

    Durée des requêtes

    Temps moyen d'exécution des requêtes.

    Cardinalité des séries

    Total des séries temporelles uniques.

    Taille du stockage

    Stockage TSM sur disque.

    Taux de compaction

    Débit de compaction TSM.

    Taille du cache

    Utilisation du cache d'écriture en mémoire.

    Octets disque du WAL

    `storage.tsm1.wal.currentSegmentDiskBytes` + `oldSegmentsDiskBytes`. La croissance du WAL sans consolidation TSM signifie que le temps de récupération explosera au redémarrage.

    Taille de stockage sur disque

    `storage.tsm1.filestore.diskBytes` + numFiles par shard. À suivre par rapport à votre politique de rétention — des nombres élevés de fichiers à taille de données identique signalent la fragmentation.

    Taux HTTP 4xx / 5xx

    `httpd.clientError` + `httpd.serverError` (ou `http_api_request_errors_total` côté Prometheus). Les pics de 4xx signalent des bugs de schéma/auth côté client ; les 5xx signalent des défaillances côté serveur.

    Connexions / Échecs d'authentification

    `httpd.req` (total des requêtes HTTP), `httpd.authFail` (tentatives d'auth échouées), `httpd.pingReq`. Les pics d'échecs d'auth signalent un Telegraf mal configuré ou une rotation d'identifiants ratée.

    Runtime — Goroutines & GC

    Statistiques runtime Go : `runtime.NumGoroutine` (détection de fuites de goroutines), `runtime.HeapAlloc` (heap vivant), `runtime.NumGC`/`PauseTotalNs` (pression GC). Détectez les fuites et les régressions de temps de pause avant l'OOM.

    Écritures d'abonnement

    `subscriber.pointsWritten` et `subscriber.writeFailures` — lorsque Kapacitor ou les pipelines en aval consomment via des abonnements, c'est ainsi que vous détectez leur backpressure.

    Déclencheurs et alertes

    Configurables déclencheurs d'alerte

    Configurez des déclencheurs personnalisés dans votre tableau de bord pour être averti dès que les indicateurs d{name}s dépassent les seuils que vous avez définis.

    InfluxDB tableau de bord de configuration des déclencheurs de surveillance

    Débit d'écriture

    avertissement

    Se déclenche sur des anomalies du taux d'écriture.

    Durée des requêtes

    avertissement

    Alerte sur les requêtes lentes.

    Cardinalité des séries

    crucial

    Se déclenche lorsque la cardinalité est trop élevée.

    Taille du stockage

    crucial

    Se déclenche lorsque le stockage dépasse le seuil.

    01

    Importance de la surveillance InfluxDB

    InfluxDB gère des données de séries temporelles à haute vélocité. Une cardinalité élevée, la pression d'écriture et les retards de compaction peuvent dégrader les performances.

    • Suivez le débit d'écriture pour la santé d'ingestion
    • Surveillez la cardinalité des séries pour prévenir les OOM
    • Détectez tôt les requêtes lentes
    • Assurez-vous que la compaction suit le rythme
    Surveillance InfluxDB
    Analytique de séries temporelles
    02

    Pourquoi choisir Xitoring

    Surveillance InfluxDB sans configuration.

    • Installation en une commande
    • Nœuds mondiaux
    • Tableau de bord unifié
    • Alertes multicanaux
    • Conservation historique
    Vue d'ensemble
    Alertes
    Cas d'usage

    Scénarios courants de monitoring InfluxDB

    Où InfluxDB fonctionne généralement aujourd'hui — et ce qui pourrait mal tourner si personne ne surveille.

    La base de données derrière les tableaux de bord de votre équipe

    Lorsque les tableaux de bord dans Grafana ou un autre outil semblent lents, la cause est souvent la base de données sous-jacente — et non le tableau de bord lui-même. Nous mettons en évidence l'origine réelle de la lenteur afin que l'équipe corrige le bon élément au lieu de courir après le symptôme.

    Données provenant de capteurs et d'appareils

    Les appareils connectés, les équipements d'usine et les capteurs IoT envoient des mesures chaque seconde de chaque jour. Une sauvegarde silencieuse dans le pipeline signifie des données perdues — et les données perdues sont perdues à jamais. Nous surveillons le flux de bout en bout afin qu'une seule lecture manquée déclenche l'alarme.

    Métriques d'application et d'infrastructure en un seul endroit

    Lorsque la même base de données contient à la fois les métriques d'application et les métriques de serveur, un problème avec la base de données masque tous les signaux à la fois. Nous surveillons la base de données elle-même afin que la propre surveillance de l'équipe ne s'interrompe jamais pendant un incident.

    Avant de commencer

    Prérequis pour InfluxDB

    Assurez-vous d'avoir tout cela en place — la plupart des installations sont une affaire de 60 secondes une fois ces conditions réunies.

    • InfluxDB 1.x ou 2.x tournant sur le serveur
    • Port HTTP InfluxDB accessible depuis Xitogent (par défaut 8086)
    • Facultatif : un token en lecture seule si l'authentification InfluxDB 2.x est activée
    Guide d'installation

    Commencez par procès-verbal

    1

    Installer Xitogent sur votre hôte InfluxDB

    Installez l'agent de monitoring léger Xitogent sur l'hôte qui exécute InfluxDB.

    curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY
    2

    Confirmer qu'InfluxDB est accessible

    Vérifiez qu'InfluxDB écoute sur son port HTTP (par défaut 8086) et est accessible depuis l'hôte qui exécute Xitogent. Xitogent demandera l'hôte et le port lors de l'integrate — aucune modification de configuration ou exposition d'endpoint supplémentaire n'est requise.

    sudo xitogent integrate
    3

    Activer l'intégration InfluxDB

    Utilisez le tableau de bord Xitoring ou la CLI pour activer l'intégration InfluxDB. Xitogent détecte automatiquement votre version d'InfluxDB et commence à collecter les métriques d'écriture, de requête et de stockage.

    4

    Configurer les seuils d'alerte (facultatif)

    Définissez des seuils personnalisés pour le débit d'écriture, la durée des requêtes ou la cardinalité des séries afin de détecter la pression d'ingestion et la croissance incontrôlée des tags avant que les requêtes ne ralentissent.

    5

    Vérifier que tout fonctionne

    Exécutez cette commande sur le serveur pour confirmer que Xitogent a bien détecté l'intégration. De nouvelles métriques apparaîtront sur votre tableau de bord dans environ 30 secondes.

    sudo xitogent status

    Souvent a posé des questions

    InfluxDB 1.x et 2.x ?
    Les deux versions sont prises en charge.
    Conséquences ?
    Négligeable — lecture à partir du point de terminaison /debug/vars.
    Comment détecter les problèmes de cardinalité InfluxDB ?
    La cardinalité des séries EST LE mode de défaillance d'InfluxDB 1.x/2.x — trop de combinaisons de tags uniques causent OOM et requêtes lentes. Exécutez `SHOW SERIES CARDINALITY` (InfluxQL) ou `import "influxdata/influxdb/v1" v1.cardinality(...)` (Flux), ou lisez `database.numSeries` depuis `_internal`. Alertez sur tout bond de 50 %+ depuis la baseline — c'est presque toujours une explosion de valeurs de tags issue d'un champ à haute cardinalité non intentionnel (IDs de requêtes, timestamps en tags, IDs utilisateurs).
    Qu'est-ce que la base _internal dans InfluxDB ?
    `_internal` est la base spéciale dans laquelle InfluxDB 1.x écrit ses propres métriques — même stockage TSM que les données utilisateur, interrogeable via `USE _internal` + `SHOW MEASUREMENTS`. Contient des mesures comme `write`, `queryExecutor`, `tsm1_engine`, `tsm1_cache`, `tsm1_wal`, `httpd`, `runtime`, `database`, `shard`. Dans InfluxDB 2.x, cela a été déplacé vers le bucket `_monitoring` (configuré par le template Monitoring). Dans la 3.0, l'endpoint Prometheus `/metrics` est la surface canonique.
    Comment monitorer les compactions InfluxDB ?
    Les compactions TSM fusionnent les petits fichiers WAL/cache en fichiers optimisés plus gros à trois niveaux (L1/L2/L3) plus les compactions complètes. Surveillez `storage.tsm1.compactions.cacheCompactionDuration`, `tsmLevel{1,2,3}CompactionQueue` (profondeur de file — non nulle = arriéré) et `tsmLevel{1,2,3}CompactionDuration`. Une file qui croît avec un taux d'écriture normal = compacteur qui prend du retard = dégradation des requêtes imminente. Soit montez en puissance, soit réduisez le taux d'écriture.
    Quelle est la différence entre le monitoring InfluxDB 1.x, 2.x et 3.0 ?
    1.x utilise InfluxQL + le stack TICK, expose `/debug/vars` et la base `_internal`, fait tourner le moteur de stockage TSM/TSI. 2.x utilise Flux + tâches, expose `/metrics` (Prometheus) et le bucket `_monitoring`, même TSM/TSI en dessous. 3.0 est la nouvelle architecture FDAP — moteur de requêtes DataFusion, stockage Parquet sur object stores, suppression complète de la limite de cardinalité, support SQL aux côtés d'InfluxQL (Flux est en mode maintenance). Xitogent détecte automatiquement la version et s'adapte.
    Comment détecter la lenteur des requêtes InfluxDB ?
    Suivez `queryExecutor.queryDurationNs` (temps de requête moyen) et `queriesActive` (requêtes simultanées en cours). Les pics lors des rafraîchissements de dashboards sont attendus ; une croissance soutenue signifie que les requêtes ralentissent (souvent causé par la cardinalité ou un arriéré de compactions). Activez le slow query log (`log-queries-after = '5s'` dans `influxdb.conf` pour 1.x) pour capturer les requêtes coupables et les investiguer.
    Comment monitorer le stockage TSM d'InfluxDB ?
    TSM (Time-Structured Merge tree) est le moteur de stockage sur disque pour 1.x/2.x. Monitorez `storage.tsm1.filestore.diskBytes` (taille totale sur disque) et `numFiles` (nombre de fichiers — un nombre élevé pour la même quantité d'octets = fragmentation). Associez avec `storage.tsm1.cache.cachedBytes` (buffer d'écriture en mémoire) et la taille du WAL. Croissance soutenue du WAL sans consolidation TSM = problème de compacteur ; numFiles qui explose = rétention/compaction ne suit pas le rythme des écritures.
    Cette intégration affectera-t-elle les performances d'InfluxDB ?
    Aucun impact mesurable. Xitogent lit depuis l'endpoint Prometheus natif `/metrics` (ou les vues de requêtes `_internal` / `_monitoring`) à un intervalle d'une minute — le même mécanisme léger qu'utilisent les propres outils d'InfluxData. Aucune instrumentation injectée dans le chemin d'écriture ou le moteur de requêtes.

    Commencer à surveiller InfluxDB aujourd'hui

    Configuration en moins de 60 secondes. Aucune carte bancaire requise. Statistiques complètes dès le premier jour.

    Commencer l'essai gratuit

    Continuez à explorer

    Connexes Intégrations