Sistemas de datos

Actualizado mayo de 2026

InfluxDB Seguimiento

Supervisa el rendimiento de escritura de InfluxDB, el rendimiento de las consultas, las métricas del motor de almacenamiento y el estado de las políticas de retención en tiempo real sin necesidad de configuración.

Empieza tu prueba gratuita Ver documentos

¿Por qué realizar un seguimiento? InfluxDB?

InfluxDB es la base de datos de series temporales líder para métricas, eventos y análisis en tiempo real. La supervisión de InfluxDB garantiza una ingesta de datos correcta, un rendimiento óptimo de las consultas y una gestión adecuada de la retención.

Detección automática mediante Xitogent

Monitorización de la tasa de escritura de puntos

Seguimiento del tiempo de ejecución de consultas

Métricas del motor de almacenamiento (TSM)

Salud de las políticas de retención

Monitorización de la cardinalidad de series

Seguimiento de compactaciones

Intervalos de recolección de 1 minuto

Umbrales de alerta personalizables para cada métrica

Intervalos de recolección de métricas de 1 minuto de forma predeterminada

¿Qué es el monitoreo de InfluxDB?

Monitoreo de InfluxDB, explicado

El monitoreo de InfluxDB detecta estancamientos en el rendimiento de escritura, cardinalidad de series desbocada (el clásico modo de fallo de InfluxDB 1.x/2.x), acumulaciones en la compactación TSM, ralentizaciones de consultas y crecimiento de WAL antes de que provoquen pérdida de ingesta o timeouts de consulta en sus dashboards de Grafana. Para pipelines de sensores IoT, backends de métricas de aplicación y cualquier despliegue del stack TICK, la visibilidad por base de datos es lo que separa una alerta de 60 segundos de un incidente de varias horas persiguiendo puntos de datos perdidos. Xitoring autodescubre su InfluxDB, lee el endpoint nativo Prometheus /metrics y enruta las alertas a Slack, PagerDuty, Telegram o su guardia existente.

Métricas

Lo que monitorizamos

Puntos escritos/s

Tasa de escritura de puntos de datos.

Duración de consultas

Tiempo medio de ejecución de consultas.

Cardinalidad de series

Total de series temporales únicas.

Tamaño del almacenamiento

Almacenamiento TSM en disco.

Tasa de compactación

Throughput de compactación TSM.

Tamaño del caché

Uso del caché de escritura en memoria.

Bytes en disco del WAL

`storage.tsm1.wal.currentSegmentDiskBytes` + `oldSegmentsDiskBytes`. El crecimiento del WAL sin consolidación TSM significa que el tiempo de recuperación se disparará al reiniciar.

Tamaño de almacenamiento en disco

`storage.tsm1.filestore.diskBytes` + numFiles por shard. Rastréelo frente a su política de retención — un alto número de archivos para el mismo tamaño de datos señala fragmentación.

Tasa de HTTP 4xx / 5xx

`httpd.clientError` + `httpd.serverError` (o el Prometheus `http_api_request_errors_total`). Los picos de 4xx señalan bugs de esquema/autenticación del cliente; los 5xx señalan fallos en el lado del servidor.

Conexiones / Fallos de autenticación

`httpd.req` (total de solicitudes HTTP), `httpd.authFail` (intentos de autenticación fallidos), `httpd.pingReq`. Los picos de fallos de autenticación indican Telegraf mal configurado o rotación de credenciales mal hecha.

Runtime — Goroutines y GC

Estadísticas del runtime de Go: `runtime.NumGoroutine` (detección de fugas de goroutines), `runtime.HeapAlloc` (heap activo), `runtime.NumGC`/`PauseTotalNs` (presión del GC). Detecte fugas y regresiones en los tiempos de pausa antes del OOM.

Escrituras de suscripción

`subscriber.pointsWritten` y `subscriber.writeFailures` — cuando Kapacitor o pipelines descendentes consumen vía suscripciones, así es como detecta su backpressure.

Desencadenantes y alertas

Configurables condiciones de activación de alertas

Configura alertas personalizadas en tu panel de control para recibir una notificación en cuanto las métricas de «InfluxDB» superen los umbrales que hayas definido.

InfluxDB panel de control de la configuración de los desencadenantes de supervisión

Throughput de escritura

advertencia

Se dispara ante anomalías en la tasa de escritura.

Duración de consultas

advertencia

Alerta sobre consultas lentas.

Cardinalidad de series

crítico

Se activa cuando la cardinalidad es demasiado alta.

Tamaño del almacenamiento

crítico

Se dispara cuando el almacenamiento supera el umbral.

Importancia de la monitorización de InfluxDB

InfluxDB maneja datos de series temporales a alta velocidad. La alta cardinalidad, la presión de escritura y los retrasos en la compactación pueden degradar el rendimiento.

Realice un seguimiento del throughput de escritura para la salud de ingestión
Monitorice la cardinalidad de series para prevenir OOM
Detecte de forma temprana las consultas lentas
Asegúrese de que la compactación se mantiene al día

Por qué elegir Xitoring

Monitorización InfluxDB sin configuración.

Instalación con un solo comando
Nodos globales
Panel unificado
Alertas multicanal
Retención histórica

Casos de uso

Escenarios habituales de monitoreo de InfluxDB comunes

Dónde suele ejecutarse InfluxDB hoy en día, y qué podría salir mal si nadie está vigilando.

La base de datos detrás de los paneles de control de su equipo

Cuando los paneles de control en Grafana u otra herramienta se sienten lentos, la causa suele ser la base de datos subyacente, no el propio panel. Sacamos a la luz dónde reside realmente la lentitud para que el equipo arregle lo correcto en lugar de perseguir el síntoma.

Datos que fluyen desde sensores y dispositivos

Los dispositivos conectados, el equipo de fábrica y los sensores IoT envían mediciones cada segundo de cada día. Un respaldo silencioso en la tubería significa datos perdidos, y los datos perdidos se pierden para siempre. Vigilamos el flujo de principio a fin para que una sola lectura perdida active la alarma.

Métricas de aplicaciones e infraestructura en un solo lugar

Cuando la misma base de datos contiene métricas de aplicaciones y métricas de servidor, un problema con la base de datos oculta todas las señales a la vez. Vigilamos la base de datos en sí para que el propio monitoreo del equipo nunca se apague durante un incidente.

Antes de empezar

Requisitos previos para InfluxDB

Asegúrate de tener todo esto en su sitio — la mayoría de las instalaciones tardan 60 segundos una vez listo.

InfluxDB 1.x o 2.x ejecutándose en el servidor
Puerto HTTP de InfluxDB accesible desde Xitogent (predeterminado 8086)
Opcional: un token de solo lectura si la autenticación de InfluxDB 2.x está habilitada

Guía de configuración

Empieza con minutos

Instalar Xitogent en tu host InfluxDB

Instala el agente de monitorización ligero Xitogent en el host que ejecuta InfluxDB.

curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY

Confirmar que InfluxDB es accesible

Verifica que InfluxDB está escuchando en su puerto HTTP (predeterminado 8086) y es accesible desde el host que ejecuta Xitogent. Xitogent preguntará por el host y el puerto durante el integrate — no se requieren ediciones de configuración adicionales ni exposición de endpoints.

sudo xitogent integrate

Habilitar la integración de InfluxDB

Usa el panel de Xitoring o la CLI para habilitar la integración de InfluxDB. Xitogent detecta automáticamente tu versión de InfluxDB y comienza a recolectar métricas de escritura, consulta y almacenamiento.

Configurar umbrales de alerta (opcional)

Define umbrales personalizados para throughput de escritura, duración de consultas o cardinalidad de series para detectar presión de ingesta y crecimiento descontrolado de tags antes de que las consultas se ralenticen.

Verifica que funciona

Ejecuta este comando en el servidor para confirmar que Xitogent ha detectado la integración. En unos 30 segundos comenzarán a llegar métricas nuevas a tu panel.

sudo xitogent status

Comparar

¿Estás considerando alternativas?

Mira cómo se compara Xitoring frente a las alternativas para la supervisión de InfluxDB: precios planos, integraciones más profundas y un solo agente que cubre todo tu stack.

Xitoring vs

Datadog

El precio por host se vuelve caro rápidamente a escala. Descubre cómo Xitoring ofrece la misma cobertura con una tarifa plana.

Xitoring vs

New Relic

Observabilidad full-stack sin niveles empresariales, tarifas de ingesta ni licencias por usuario.

Xitoring vs

Grafana Cloud

Una herramienta con un solo precio, en lugar de unir Prometheus, Loki y Grafana en un stack que también tienes que supervisar.

Ver todas las comparaciones

Con frecuencia preguntas formuladas

¿InfluxDB 1.x y 2.x?

Ambas versiones son compatibles.

¿Qué repercusión tiene?

Insignificante: lee desde el punto final /debug/vars.

¿Cómo detecto problemas de cardinalidad en InfluxDB?

La cardinalidad de series es EL modo de fallo de InfluxDB 1.x/2.x — demasiadas combinaciones únicas de etiquetas causan OOM y consultas lentas. Ejecute `SHOW SERIES CARDINALITY` (InfluxQL) o `import "influxdata/influxdb/v1" v1.cardinality(...)` (Flux), o lea `database.numSeries` desde `_internal`. Alerte ante cualquier salto del 50%+ respecto a la línea base — casi siempre es una explosión de valores de etiqueta por un campo no intencionado de alta cardinalidad (IDs de solicitud, timestamps como etiquetas, IDs de usuario).

¿Qué es la base de datos _internal en InfluxDB?

`_internal` es la base de datos especial donde InfluxDB 1.x escribe sus propias métricas — mismo almacenamiento TSM que los datos de usuario, consultable mediante `USE _internal` + `SHOW MEASUREMENTS`. Contiene mediciones como `write`, `queryExecutor`, `tsm1_engine`, `tsm1_cache`, `tsm1_wal`, `httpd`, `runtime`, `database`, `shard`. En InfluxDB 2.x, se trasladó al bucket `_monitoring` (configurado por la plantilla Monitoring). En 3.0, el endpoint `/metrics` Prometheus es la superficie canónica.

¿Cómo monitoreo las compactaciones de InfluxDB?

Las compactaciones TSM fusionan pequeños archivos WAL/caché en archivos optimizados más grandes en tres niveles (L1/L2/L3) además de compactaciones completas. Vigile `storage.tsm1.compactions.cacheCompactionDuration`, `tsmLevel{1,2,3}CompactionQueue` (profundidad de cola — distinto de cero significa acumulación) y `tsmLevel{1,2,3}CompactionDuration`. Una cola creciente con tasa de escritura normal = el compactor se está quedando atrás = degradación de consultas inminente. Escale o reduzca la tasa de escritura.

¿Cuál es la diferencia entre el monitoreo de InfluxDB 1.x, 2.x y 3.0?

1.x usa InfluxQL + stack TICK, expone `/debug/vars` y la base de datos `_internal`, ejecuta el motor de almacenamiento TSM/TSI. 2.x usa Flux + tasks, expone `/metrics` (Prometheus) y el bucket `_monitoring`, mismo TSM/TSI por debajo. 3.0 es la nueva arquitectura FDAP — motor de consultas DataFusion, almacenamiento Parquet en object stores, eliminó por completo el límite de cardinalidad, admite SQL junto con InfluxQL (Flux está en modo de mantenimiento). Xitogent detecta automáticamente la versión y se adapta.

¿Cómo detecto lentitud en las consultas de InfluxDB?

Rastree `queryExecutor.queryDurationNs` (tiempo medio de consulta) y `queriesActive` (consultas concurrentes en vuelo). Los picos durante refrescos de dashboard son esperables; un crecimiento sostenido significa que las consultas se están volviendo más lentas (a menudo por cardinalidad o por acumulación de compactación). Habilite el log de consultas lentas (`log-queries-after = '5s'` en `influxdb.conf` para 1.x) para capturar infractores específicos para investigación.

¿Cómo monitoreo el almacenamiento TSM de InfluxDB?

TSM (Time-Structured Merge tree) es el motor de almacenamiento en disco para 1.x/2.x. Monitoree `storage.tsm1.filestore.diskBytes` (tamaño total en disco) y `numFiles` (número de archivos — números altos con los mismos bytes = fragmentación). Combine con `storage.tsm1.cache.cachedBytes` (buffer de escritura en memoria) y el tamaño del WAL. Crecimiento sostenido del WAL sin consolidación TSM = problema del compactor; numFiles disparándose = la retención/compactación no está al día con las escrituras.

¿Esta integración afectará al rendimiento de InfluxDB?

Sin impacto medible. Xitogent lee desde el endpoint nativo `/metrics` Prometheus (o las vistas de consulta `_internal` / `_monitoring`) en un intervalo de 1 minuto — el mismo mecanismo ligero que usan las propias herramientas de InfluxData. No se inyecta instrumentación en la ruta de escritura ni en el motor de consultas.

Empieza a seguir a InfluxDB hoy

Se configura en menos de 60 segundos. No se necesita tarjeta de crédito. Estadísticas completas desde el primer día.

Empieza tu prueba gratuita

Sigue explorando

Relacionado Integraciones

PostgreSQL

Redis

Elasticsearch