Sistemas de datos
    Actualizado mayo de 2026
    InfluxDB logo

    InfluxDB Seguimiento

    Supervisa el rendimiento de escritura de InfluxDB, el rendimiento de las consultas, las métricas del motor de almacenamiento y el estado de las políticas de retención en tiempo real sin necesidad de configuración.

    ¿Por qué realizar un seguimiento? InfluxDB?

    InfluxDB es la base de datos de series temporales líder para métricas, eventos y análisis en tiempo real. La supervisión de InfluxDB garantiza una ingesta de datos correcta, un rendimiento óptimo de las consultas y una gestión adecuada de la retención.

    Detección automática mediante Xitogent
    Monitorización de la tasa de escritura de puntos
    Seguimiento del tiempo de ejecución de consultas
    Métricas del motor de almacenamiento (TSM)
    Salud de las políticas de retención
    Monitorización de la cardinalidad de series
    Seguimiento de compactaciones
    Intervalos de recolección de 1 minuto
    Umbrales de alerta personalizables para cada métrica
    Intervalos de recolección de métricas de 1 minuto de forma predeterminada
    ¿Qué es el monitoreo de InfluxDB?

    Monitoreo de InfluxDB, explicado

    El monitoreo de InfluxDB detecta estancamientos en el rendimiento de escritura, cardinalidad de series desbocada (el clásico modo de fallo de InfluxDB 1.x/2.x), acumulaciones en la compactación TSM, ralentizaciones de consultas y crecimiento de WAL antes de que provoquen pérdida de ingesta o timeouts de consulta en sus dashboards de Grafana. Para pipelines de sensores IoT, backends de métricas de aplicación y cualquier despliegue del stack TICK, la visibilidad por base de datos es lo que separa una alerta de 60 segundos de un incidente de varias horas persiguiendo puntos de datos perdidos. Xitoring autodescubre su InfluxDB, lee el endpoint nativo Prometheus /metrics y enruta las alertas a Slack, PagerDuty, Telegram o su guardia existente.

    Métricas

    Lo que monitorizamos

    Puntos escritos/s

    Tasa de escritura de puntos de datos.

    Duración de consultas

    Tiempo medio de ejecución de consultas.

    Cardinalidad de series

    Total de series temporales únicas.

    Tamaño del almacenamiento

    Almacenamiento TSM en disco.

    Tasa de compactación

    Throughput de compactación TSM.

    Tamaño del caché

    Uso del caché de escritura en memoria.

    Bytes en disco del WAL

    `storage.tsm1.wal.currentSegmentDiskBytes` + `oldSegmentsDiskBytes`. El crecimiento del WAL sin consolidación TSM significa que el tiempo de recuperación se disparará al reiniciar.

    Tamaño de almacenamiento en disco

    `storage.tsm1.filestore.diskBytes` + numFiles por shard. Rastréelo frente a su política de retención — un alto número de archivos para el mismo tamaño de datos señala fragmentación.

    Tasa de HTTP 4xx / 5xx

    `httpd.clientError` + `httpd.serverError` (o el Prometheus `http_api_request_errors_total`). Los picos de 4xx señalan bugs de esquema/autenticación del cliente; los 5xx señalan fallos en el lado del servidor.

    Conexiones / Fallos de autenticación

    `httpd.req` (total de solicitudes HTTP), `httpd.authFail` (intentos de autenticación fallidos), `httpd.pingReq`. Los picos de fallos de autenticación indican Telegraf mal configurado o rotación de credenciales mal hecha.

    Runtime — Goroutines y GC

    Estadísticas del runtime de Go: `runtime.NumGoroutine` (detección de fugas de goroutines), `runtime.HeapAlloc` (heap activo), `runtime.NumGC`/`PauseTotalNs` (presión del GC). Detecte fugas y regresiones en los tiempos de pausa antes del OOM.

    Escrituras de suscripción

    `subscriber.pointsWritten` y `subscriber.writeFailures` — cuando Kapacitor o pipelines descendentes consumen vía suscripciones, así es como detecta su backpressure.

    Desencadenantes y alertas

    Configurables condiciones de activación de alertas

    Configura alertas personalizadas en tu panel de control para recibir una notificación en cuanto las métricas de «InfluxDB» superen los umbrales que hayas definido.

    InfluxDB panel de control de la configuración de los desencadenantes de supervisión

    Throughput de escritura

    advertencia

    Se dispara ante anomalías en la tasa de escritura.

    Duración de consultas

    advertencia

    Alerta sobre consultas lentas.

    Cardinalidad de series

    crítico

    Se activa cuando la cardinalidad es demasiado alta.

    Tamaño del almacenamiento

    crítico

    Se dispara cuando el almacenamiento supera el umbral.

    01

    Importancia de la monitorización de InfluxDB

    InfluxDB maneja datos de series temporales a alta velocidad. La alta cardinalidad, la presión de escritura y los retrasos en la compactación pueden degradar el rendimiento.

    • Realice un seguimiento del throughput de escritura para la salud de ingestión
    • Monitorice la cardinalidad de series para prevenir OOM
    • Detecte de forma temprana las consultas lentas
    • Asegúrese de que la compactación se mantiene al día
    Monitorización de InfluxDB
    Analítica de series temporales
    02

    Por qué elegir Xitoring

    Monitorización InfluxDB sin configuración.

    • Instalación con un solo comando
    • Nodos globales
    • Panel unificado
    • Alertas multicanal
    • Retención histórica
    Vista general
    Alertas
    Casos de uso

    Escenarios habituales de monitoreo de InfluxDB comunes

    Dónde suele ejecutarse InfluxDB hoy en día, y qué podría salir mal si nadie está vigilando.

    La base de datos detrás de los paneles de control de su equipo

    Cuando los paneles de control en Grafana u otra herramienta se sienten lentos, la causa suele ser la base de datos subyacente, no el propio panel. Sacamos a la luz dónde reside realmente la lentitud para que el equipo arregle lo correcto en lugar de perseguir el síntoma.

    Datos que fluyen desde sensores y dispositivos

    Los dispositivos conectados, el equipo de fábrica y los sensores IoT envían mediciones cada segundo de cada día. Un respaldo silencioso en la tubería significa datos perdidos, y los datos perdidos se pierden para siempre. Vigilamos el flujo de principio a fin para que una sola lectura perdida active la alarma.

    Métricas de aplicaciones e infraestructura en un solo lugar

    Cuando la misma base de datos contiene métricas de aplicaciones y métricas de servidor, un problema con la base de datos oculta todas las señales a la vez. Vigilamos la base de datos en sí para que el propio monitoreo del equipo nunca se apague durante un incidente.

    Antes de empezar

    Requisitos previos para InfluxDB

    Asegúrate de tener todo esto en su sitio — la mayoría de las instalaciones tardan 60 segundos una vez listo.

    • InfluxDB 1.x o 2.x ejecutándose en el servidor
    • Puerto HTTP de InfluxDB accesible desde Xitogent (predeterminado 8086)
    • Opcional: un token de solo lectura si la autenticación de InfluxDB 2.x está habilitada
    Guía de configuración

    Empieza con minutos

    1

    Instalar Xitogent en tu host InfluxDB

    Instala el agente de monitorización ligero Xitogent en el host que ejecuta InfluxDB.

    curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY
    2

    Confirmar que InfluxDB es accesible

    Verifica que InfluxDB está escuchando en su puerto HTTP (predeterminado 8086) y es accesible desde el host que ejecuta Xitogent. Xitogent preguntará por el host y el puerto durante el integrate — no se requieren ediciones de configuración adicionales ni exposición de endpoints.

    sudo xitogent integrate
    3

    Habilitar la integración de InfluxDB

    Usa el panel de Xitoring o la CLI para habilitar la integración de InfluxDB. Xitogent detecta automáticamente tu versión de InfluxDB y comienza a recolectar métricas de escritura, consulta y almacenamiento.

    4

    Configurar umbrales de alerta (opcional)

    Define umbrales personalizados para throughput de escritura, duración de consultas o cardinalidad de series para detectar presión de ingesta y crecimiento descontrolado de tags antes de que las consultas se ralenticen.

    5

    Verifica que funciona

    Ejecuta este comando en el servidor para confirmar que Xitogent ha detectado la integración. En unos 30 segundos comenzarán a llegar métricas nuevas a tu panel.

    sudo xitogent status

    Con frecuencia preguntas formuladas

    ¿InfluxDB 1.x y 2.x?
    Ambas versiones son compatibles.
    ¿Qué repercusión tiene?
    Insignificante: lee desde el punto final /debug/vars.
    ¿Cómo detecto problemas de cardinalidad en InfluxDB?
    La cardinalidad de series es EL modo de fallo de InfluxDB 1.x/2.x — demasiadas combinaciones únicas de etiquetas causan OOM y consultas lentas. Ejecute `SHOW SERIES CARDINALITY` (InfluxQL) o `import "influxdata/influxdb/v1" v1.cardinality(...)` (Flux), o lea `database.numSeries` desde `_internal`. Alerte ante cualquier salto del 50%+ respecto a la línea base — casi siempre es una explosión de valores de etiqueta por un campo no intencionado de alta cardinalidad (IDs de solicitud, timestamps como etiquetas, IDs de usuario).
    ¿Qué es la base de datos _internal en InfluxDB?
    `_internal` es la base de datos especial donde InfluxDB 1.x escribe sus propias métricas — mismo almacenamiento TSM que los datos de usuario, consultable mediante `USE _internal` + `SHOW MEASUREMENTS`. Contiene mediciones como `write`, `queryExecutor`, `tsm1_engine`, `tsm1_cache`, `tsm1_wal`, `httpd`, `runtime`, `database`, `shard`. En InfluxDB 2.x, se trasladó al bucket `_monitoring` (configurado por la plantilla Monitoring). En 3.0, el endpoint `/metrics` Prometheus es la superficie canónica.
    ¿Cómo monitoreo las compactaciones de InfluxDB?
    Las compactaciones TSM fusionan pequeños archivos WAL/caché en archivos optimizados más grandes en tres niveles (L1/L2/L3) además de compactaciones completas. Vigile `storage.tsm1.compactions.cacheCompactionDuration`, `tsmLevel{1,2,3}CompactionQueue` (profundidad de cola — distinto de cero significa acumulación) y `tsmLevel{1,2,3}CompactionDuration`. Una cola creciente con tasa de escritura normal = el compactor se está quedando atrás = degradación de consultas inminente. Escale o reduzca la tasa de escritura.
    ¿Cuál es la diferencia entre el monitoreo de InfluxDB 1.x, 2.x y 3.0?
    1.x usa InfluxQL + stack TICK, expone `/debug/vars` y la base de datos `_internal`, ejecuta el motor de almacenamiento TSM/TSI. 2.x usa Flux + tasks, expone `/metrics` (Prometheus) y el bucket `_monitoring`, mismo TSM/TSI por debajo. 3.0 es la nueva arquitectura FDAP — motor de consultas DataFusion, almacenamiento Parquet en object stores, eliminó por completo el límite de cardinalidad, admite SQL junto con InfluxQL (Flux está en modo de mantenimiento). Xitogent detecta automáticamente la versión y se adapta.
    ¿Cómo detecto lentitud en las consultas de InfluxDB?
    Rastree `queryExecutor.queryDurationNs` (tiempo medio de consulta) y `queriesActive` (consultas concurrentes en vuelo). Los picos durante refrescos de dashboard son esperables; un crecimiento sostenido significa que las consultas se están volviendo más lentas (a menudo por cardinalidad o por acumulación de compactación). Habilite el log de consultas lentas (`log-queries-after = '5s'` en `influxdb.conf` para 1.x) para capturar infractores específicos para investigación.
    ¿Cómo monitoreo el almacenamiento TSM de InfluxDB?
    TSM (Time-Structured Merge tree) es el motor de almacenamiento en disco para 1.x/2.x. Monitoree `storage.tsm1.filestore.diskBytes` (tamaño total en disco) y `numFiles` (número de archivos — números altos con los mismos bytes = fragmentación). Combine con `storage.tsm1.cache.cachedBytes` (buffer de escritura en memoria) y el tamaño del WAL. Crecimiento sostenido del WAL sin consolidación TSM = problema del compactor; numFiles disparándose = la retención/compactación no está al día con las escrituras.
    ¿Esta integración afectará al rendimiento de InfluxDB?
    Sin impacto medible. Xitogent lee desde el endpoint nativo `/metrics` Prometheus (o las vistas de consulta `_internal` / `_monitoring`) en un intervalo de 1 minuto — el mismo mecanismo ligero que usan las propias herramientas de InfluxData. No se inyecta instrumentación en la ruta de escritura ni en el motor de consultas.

    Empieza a seguir a InfluxDB hoy

    Se configura en menos de 60 segundos. No se necesita tarjeta de crédito. Estadísticas completas desde el primer día.

    Empieza tu prueba gratuita

    Sigue explorando

    Relacionado Integraciones