Sistemi informatici
    Aggiornato il maggio 2026
    InfluxDB logo

    InfluxDB Monitoraggio

    Monitora in tempo reale la velocità di scrittura di InfluxDB, le prestazioni delle query, le metriche del motore di archiviazione e lo stato delle politiche di conservazione, senza alcuna configurazione.

    Perché monitorare InfluxDB?

    InfluxDB è il database di serie temporali leader nel settore per metriche, eventi e analisi in tempo reale. Il monitoraggio di InfluxDB garantisce un corretto inserimento dei dati in scrittura, prestazioni ottimali delle query e una gestione adeguata della conservazione dei dati.

    Rilevamento automatico tramite Xitogent
    Monitoraggio del tasso di write dei point
    Monitoraggio del tempo di esecuzione delle query
    Metriche del motore di storage (TSM)
    Salute delle policy di retention
    Monitoraggio della cardinalità delle serie
    Monitoraggio delle compattazioni
    Intervalli di raccolta di 1 minuto
    Soglie di allerta personalizzabili per ogni metrica
    Intervalli di raccolta metriche di 1 minuto preimpostati
    Che cos'è il monitoraggio di InfluxDB?

    Monitoraggio di InfluxDB, in breve

    Il monitoraggio di InfluxDB intercetta gli stalli di throughput in scrittura, la cardinalità delle serie fuori controllo (la classica modalità di fallimento di InfluxDB 1.x/2.x), gli arretrati di compaction TSM, i rallentamenti delle query e la crescita del WAL prima che provochino perdita di ingest o timeout di query sulle sue dashboard Grafana. Per pipeline di sensori IoT, backend di metriche applicative e qualsiasi deployment dello stack TICK, la visibilità per database è ciò che separa un avviso di 60 secondi da un incidente di più ore a caccia di datapoint mancanti. Xitoring rileva automaticamente il suo InfluxDB, legge l'endpoint Prometheus nativo /metrics e instrada gli avvisi verso Slack, PagerDuty, Telegram o il suo on-call esistente.

    Indicatori

    Ciò che monitoriamo

    Punti scritti/sec

    Tasso di scrittura dei punti dati.

    Durata delle query

    Tempo medio di esecuzione delle query.

    Cardinalità delle serie

    Totale delle serie temporali uniche.

    Dimensione dello storage

    Storage TSM su disco.

    Tasso di compattazione

    Throughput di compattazione TSM.

    Dimensione della cache

    Utilizzo della cache di scrittura in memoria.

    Byte su disco del WAL

    `storage.tsm1.wal.currentSegmentDiskBytes` + `oldSegmentsDiskBytes`. La crescita del WAL senza consolidamento TSM significa che il tempo di recovery al riavvio aumenterà sensibilmente.

    Dimensione dello storage su disco

    `storage.tsm1.filestore.diskBytes` + numFiles per shard. La tracci rispetto alla sua retention policy: conteggi di file elevati a parità di dimensione dati segnalano frammentazione.

    Tasso di HTTP 4xx / 5xx

    `httpd.clientError` + `httpd.serverError` (o il Prometheus `http_api_request_errors_total`). I picchi di 4xx segnalano bug di schema/auth lato client; i 5xx segnalano fallimenti lato server.

    Connessioni / Fallimenti di autenticazione

    `httpd.req` (richieste HTTP totali), `httpd.authFail` (tentativi di autenticazione falliti), `httpd.pingReq`. I picchi di fallimento di autenticazione segnalano Telegraf mal configurato o una rotazione di credenziali andata storta.

    Runtime: goroutine e GC

    Statistiche runtime Go: `runtime.NumGoroutine` (rilevamento di goroutine leak), `runtime.HeapAlloc` (heap live), `runtime.NumGC`/`PauseTotalNs` (pressione del GC). Intercetti leak e regressioni nei tempi di pausa prima dell'OOM.

    Scritture da subscription

    `subscriber.pointsWritten` e `subscriber.writeFailures`: quando Kapacitor o pipeline a valle consumano tramite subscription, è così che intercetta la loro backpressure.

    Notifiche e avvisi

    Configurabile condizioni di attivazione

    Imposta dei trigger personalizzati nella tua dashboard per ricevere una notifica non appena le metriche dell{name}e superano le soglie da te definite.

    InfluxDB pannello di controllo per la configurazione dei trigger di monitoraggio

    Throughput di scrittura

    avviso

    Si attiva su anomalie del tasso di scrittura.

    Durata delle query

    avviso

    Avvisa sulle query lente.

    Cardinalità delle serie

    critico

    Si attiva quando la cardinalità è troppo alta.

    Dimensione dello storage

    critico

    Si attiva quando lo storage supera la soglia.

    01

    Importanza del monitoraggio InfluxDB

    InfluxDB gestisce dati time-series ad alta velocità. Cardinalità elevata, pressione di scrittura e ritardi di compattazione possono degradare le prestazioni.

    • Tieni traccia del throughput di scrittura per la salute dell'ingestione
    • Monitora la cardinalità delle serie per prevenire OOM
    • Rileva in anticipo le query lente
    • Assicurati che la compattazione tenga il passo
    Monitoraggio InfluxDB
    Analisi delle serie temporali
    02

    Perché scegliere Xitoring

    Monitoraggio InfluxDB zero-config.

    • Installazione con un solo comando
    • Nodi globali
    • Dashboard unificata
    • Avvisi multicanale
    • Conservazione storica
    Panoramica
    Avvisi
    Casi d'uso

    Scenari comuni di monitoraggio di InfluxDB

    Dove InfluxDB viene tipicamente eseguito oggi — e cosa potrebbe andare storto se nessuno lo monitora.

    Il database dietro le dashboard del tuo team

    Quando le dashboard in Grafana o un altro strumento risultano lente, la causa è spesso il database sottostante — non la dashboard stessa. Mettiamo in evidenza dove risiede effettivamente la lentezza in modo che il team risolva il problema giusto invece di inseguire il sintomo.

    Dati in arrivo da sensori e dispositivi

    Dispositivi connessi, apparecchiature di fabbrica e sensori IoT inviano misurazioni ogni secondo di ogni giorno. Un backup silenzioso nella pipeline significa dati persi — e i dati persi sono persi per sempre. Monitoriamo il flusso end-to-end in modo che una singola lettura persa faccia scattare l'allarme.

    Metriche di app e infrastruttura in un unico posto

    Quando lo stesso database contiene sia le metriche dell'app che quelle del server, un problema con il database nasconde ogni segnale contemporaneamente. Monitoriamo il database stesso in modo che il monitoraggio del team non si spenga mai durante un incidente.

    Prima di iniziare

    Prerequisiti per InfluxDB

    Assicurati di avere tutto questo in posizione — la maggior parte delle installazioni dura 60 secondi una volta soddisfatte le condizioni.

    • InfluxDB 1.x o 2.x in esecuzione sul server
    • Porta HTTP di InfluxDB raggiungibile da Xitogent (predefinita 8086)
    • Opzionale: un token in sola lettura se l'autenticazione di InfluxDB 2.x è abilitata
    Guida all'installazione

    Inizia con verbali

    1

    Installa Xitogent sul tuo host InfluxDB

    Installa il leggero agente di monitoraggio Xitogent sull'host che esegue InfluxDB.

    curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY
    2

    Conferma che InfluxDB sia raggiungibile

    Verifica che InfluxDB sia in ascolto sulla sua porta HTTP (predefinita 8086) e raggiungibile dall'host che esegue Xitogent. Xitogent chiederà host e porta durante l'integrate — non sono richieste ulteriori modifiche di configurazione o esposizioni di endpoint.

    sudo xitogent integrate
    3

    Abilita l'integrazione InfluxDB

    Usa la dashboard di Xitoring o la CLI per abilitare l'integrazione InfluxDB. Xitogent rileva automaticamente la tua versione di InfluxDB e inizia a raccogliere metriche di scrittura, query e archiviazione.

    4

    Configura le soglie di allerta (opzionale)

    Imposta soglie personalizzate per Write Throughput, durata delle query o cardinalità delle serie per intercettare pressione sull'ingestion e crescita incontrollata dei tag prima che le query rallentino.

    5

    Verifica che funzioni

    Esegui questo comando sul server per confermare che Xitogent ha rilevato l'integrazione. In circa 30 secondi nuove metriche cominceranno a comparire sulla tua dashboard.

    sudo xitogent status

    Spesso domande poste

    InfluxDB 1.x e 2.x?
    Sono supportate entrambe le versioni.
    Impatto?
    Irrilevante — legge dall'endpoint /debug/vars.
    Come rilevo i problemi di cardinalità in InfluxDB?
    La cardinalità delle serie è LA modalità di fallimento di InfluxDB 1.x/2.x: troppe combinazioni univoche di tag causano OOM e query lente. Esegua `SHOW SERIES CARDINALITY` (InfluxQL) o `import "influxdata/influxdb/v1" v1.cardinality(...)` (Flux), oppure legga `database.numSeries` da `_internal`. Imposti avvisi su qualsiasi balzo del 50%+ rispetto alla baseline: si tratta quasi sempre di un'esplosione di valori di tag dovuta a un campo ad alta cardinalità non intenzionale (ID richiesta, timestamp come tag, ID utente).
    Cos'è il database _internal in InfluxDB?
    `_internal` è il database speciale su cui InfluxDB 1.x scrive le proprie metriche: stesso storage TSM dei dati utente, interrogabile tramite `USE _internal` + `SHOW MEASUREMENTS`. Contiene measurement come `write`, `queryExecutor`, `tsm1_engine`, `tsm1_cache`, `tsm1_wal`, `httpd`, `runtime`, `database`, `shard`. In InfluxDB 2.x, questo è migrato nel bucket `_monitoring` (predisposto dal template Monitoring). In 3.0, l'endpoint Prometheus `/metrics` è la superficie canonica.
    Come monitoro le compaction di InfluxDB?
    Le compaction TSM uniscono piccoli file WAL/cache in file più grandi e ottimizzati su tre livelli (L1/L2/L3) più le full compaction. Tenga d'occhio `storage.tsm1.compactions.cacheCompactionDuration`, `tsmLevel{1,2,3}CompactionQueue` (profondità della coda: un valore diverso da zero significa arretrato) e `tsmLevel{1,2,3}CompactionDuration`. Una coda in crescita con tasso di scrittura normale = compactor che rimane indietro = degrado delle query imminente. Scali in alto oppure riduca il tasso di scrittura.
    Qual è la differenza tra il monitoraggio di InfluxDB 1.x, 2.x e 3.0?
    1.x usa InfluxQL + stack TICK, espone `/debug/vars` e il database `_internal`, esegue il motore di storage TSM/TSI. 2.x usa Flux + tasks, espone `/metrics` (Prometheus) e il bucket `_monitoring`, con TSM/TSI sotto. 3.0 è la nuova architettura FDAP: motore di query DataFusion, storage Parquet su object store, limite di cardinalità rimosso del tutto, supporto a SQL insieme a InfluxQL (Flux è in modalità manutenzione). Xitogent rileva automaticamente la versione e si adatta.
    Come rilevo la lentezza delle query in InfluxDB?
    Tracci `queryExecutor.queryDurationNs` (tempo medio delle query) e `queriesActive` (query concorrenti in volo). I picchi durante i refresh delle dashboard sono attesi; una crescita sostenuta significa che le query stanno diventando più lente (spesso a causa della cardinalità o di arretrati di compaction). Abiliti il log delle slow query (`log-queries-after = '5s'` in `influxdb.conf` per 1.x) per catturare i casi specifici da analizzare.
    Come monitoro lo storage TSM di InfluxDB?
    TSM (Time-Structured Merge tree) è il motore di storage su disco per 1.x/2.x. Monitori `storage.tsm1.filestore.diskBytes` (dimensione totale su disco) e `numFiles` (conteggio file: numeri alti a parità di byte = frammentazione). Lo abbini a `storage.tsm1.cache.cachedBytes` (buffer di scrittura in memoria) e alla dimensione del WAL. Crescita sostenuta del WAL senza consolidamento TSM = problema del compactor; numFiles in aumento = retention/compaction non al passo con le scritture.
    Questa integrazione influirà sulle prestazioni di InfluxDB?
    Nessun impatto misurabile. Xitogent legge dall'endpoint Prometheus nativo `/metrics` (o dalle viste di query `_internal` / `_monitoring`) a intervalli di 1 minuto: lo stesso meccanismo leggero che usano gli strumenti di InfluxData. Nessuna strumentazione iniettata nel percorso di scrittura o nel motore di query.

    Inizia a monitorare InfluxDB oggi

    Configurazione in meno di 60 secondi. Non è richiesta alcuna carta di credito. Statistiche complete fin dal primo giorno.

    Inizia la prova gratuita

    Continua a esplorare

    Correlati Integrazioni