Serveur DNS

Mis à jour le mai 2026

CoreDNS Suivi

Surveillez en temps réel le nombre de requêtes CoreDNS, les taux de réussite du cache, le temps de résolution et les taux d'erreur, sans aucune configuration.

Commencer l'essai gratuit Consulter les documents

Pourquoi surveiller ? CoreDNS?

CoreDNS est le serveur DNS par défaut pour Kubernetes et les environnements cloud natifs. La surveillance de CoreDNS garantit une résolution DNS rapide, des performances de cache optimales et une découverte de services fiable pour votre infrastructure.

Détection automatique via Xitogent

Surveillance du taux de requêtes

Ratio cache hit/miss

Suivi de la latence de résolution

Taux d'erreurs et de SERVFAIL

Métriques par zone

Surveillance au niveau des plugins

Intervalles de collecte d'1 minute

Seuils d'alerte personnalisables pour chaque métrique

Intervalles de collecte des métriques d'une minute par défaut

Qu'est-ce que le monitoring CoreDNS ?

Le monitoring CoreDNS, expliqué

Le monitoring CoreDNS détecte les pics de SERVFAIL, les baisses du taux de hit du cache, la latence du plugin forward et les redémarrages liés à des panics avant qu'ils ne se transforment en cascade de défaillances de résolution DNS à l'échelle du cluster. Comme chaque microservice dépend du DNS pour la découverte de service, un CoreDNS non surveillé est un mode de défaillance non surveillé pour tout votre cluster Kubernetes — les problèmes de DNS apparaissent comme des « connection refused aléatoires » partout. Xitoring découvre automatiquement votre CoreDNS, scrape :9153/metrics et achemine les alertes vers Slack, PagerDuty, Telegram ou votre astreinte existante.

Indicateurs

Ce que nous surveillons

Requêtes/sec

Taux de requêtes DNS.

Ratio de hits du cache

Pourcentage de requêtes servies depuis le cache.

Latence de résolution

Temps moyen de résolution DNS.

Taux SERVFAIL

Pourcentage de résolutions en échec.

Taux NXDOMAIN

Taux de requêtes pour domaines inexistants.

Latence en amont

Temps de réponse des requêtes transférées.

Latence du plugin Forward

`coredns_forward_request_duration_seconds` par résolveur amont. Sépare la latence interne à CoreDNS de la latence du résolveur amont — essentiel pour diagnostiquer une lenteur côté 8.8.8.8 vs une lenteur côté CoreDNS lui-même.

Taux de requêtes Forward

`coredns_forward_request_count_total` par amont. Combiné au ratio de hit du cache, montre quelle part du trafic quitte effectivement CoreDNS pour la résolution amont.

Cache des connexions Proxy

`coredns_proxy_conn_cache_hits_total` / `_misses_total`. Suit la réutilisation des connexions TCP vers les résolveurs amont — un faible taux de hit signifie un churn de connexions, augmentant la latence amont.

Échecs du plugin Health

`coredns_health_request_failures_total` — le nombre d'échecs propre au plugin `health:8080`. Une valeur non nulle signifie que la liveness probe échoue par intermittence.

Panics

`coredns_panics_total` — toute valeur non nulle est un bug CoreDNS ou un crash de plugin ayant déclenché une panic de goroutine. À combiner avec le compteur de redémarrages pour un contexte post-mortem complet.

Runtime Go

`process_resident_memory_bytes` (RSS), `go_goroutines` (nombre de goroutines — détecte les fuites), `go_gc_duration_seconds` (temps de pause GC). Croissance mémoire sans redémarrages = fuite ; croissance du nombre de goroutines = plugin ou amont bloqué.

Déclencheurs et alertes

Configurables déclencheurs d'alerte

Configurez des déclencheurs personnalisés dans votre tableau de bord pour être averti dès que les indicateurs d{name}s dépassent les seuils que vous avez définis.

CoreDNS tableau de bord de configuration des déclencheurs de surveillance

Taux SERVFAIL

crucial

Se déclenche en cas de taux élevé d'échecs de résolution.

Ratio de hits du cache

avertissement

Alerte lorsque l'efficacité du cache chute.

Latence de résolution

avertissement

Se déclenche en cas de résolution DNS lente.

Taux de requêtes

avertissement

Se déclenche sur un volume de requêtes inhabituel.

Importance de la surveillance CoreDNS

Le DNS est la base de la connectivité réseau. Une résolution DNS lente ou défaillante impacte chaque service de votre infrastructure.

Garantir une résolution DNS rapide
Détecter immédiatement les pics de SERVFAIL
Surveiller le cache pour des performances optimales
Suivre la santé des résolveurs en amont

Pourquoi choisir Xitoring

Surveillance CoreDNS sans configuration.

Installation en une commande
Nœuds mondiaux
Tableau de bord unifié
Alertes multicanaux

Cas d'usage

Scénarios courants de monitoring CoreDNS

Où CoreDNS fonctionne généralement aujourd'hui — et ce qui pourrait mal tourner si personne ne surveille.

DNS au sein d'une application Kubernetes

Chaque partie d'une application Kubernetes utilise CoreDNS pour trouver toutes les autres parties. Lorsqu'il ralentit ou commence à échouer, les utilisateurs voient des erreurs étranges et intermittentes sur l'ensemble de l'application. Nous détectons le ralentissement dès qu'il commence, afin qu'un petit hoquet DNS ne se manifeste pas aux clients comme une panne mystérieuse.

Grands clusters avec caches DNS locaux

Les grandes configurations Kubernetes placent un petit cache DNS sur chaque serveur pour accélérer les choses. Lorsqu'un de ces caches se comporte mal, seule une partie du trafic est interrompue — ce qui le rend difficile à repérer. Nous nous assurons que chacun fait son travail afin qu'un seul nœud défectueux ne puisse pas dégrader silencieusement une fraction de vos utilisateurs.

DNS public pour votre domaine

Lorsque CoreDNS est ce qui répond aux requêtes DNS pour votre domaine sur l'internet ouvert, une panne signifie que les gens ne peuvent pas du tout atteindre votre site. Nous surveillons les signaux qui prouvent que le service est sain et répond, afin que la marque et les revenus ne saignent pas silencieusement pendant que le DNS échoue en silence.

Avant de commencer

Prérequis pour CoreDNS

Assurez-vous d'avoir tout cela en place — la plupart des installations sont une affaire de 60 secondes une fois ces conditions réunies.

CoreDNS 1.x tournant sur le serveur
Plugin Prometheus activé dans votre Corefile (port par défaut 9153)
Accessibilité réseau de Xitogent vers l'endpoint metrics

Guide d'installation

Commencez par procès-verbal

Installer Xitogent sur votre serveur

Si ce n'est pas déjà fait, installez l'agent de monitoring léger Xitogent sur l'hôte qui exécute CoreDNS.

curl -s https://xitoring.com/install.sh | sudo bash -s -- --key=YOUR_API_KEY

Activer le plugin prometheus dans CoreDNS

CoreDNS expose des métriques au format Prometheus via son plugin prometheus (endpoint par défaut :9153/metrics). Ajoutez `prometheus :9153` à votre Corefile, rechargez CoreDNS, puis confirmez que l'endpoint metrics est accessible depuis l'hôte de l'agent.

sudo xitogent integrate

Activer l'intégration CoreDNS

Utilisez le tableau de bord Xitoring ou la CLI pour activer l'intégration CoreDNS. Xitogent détecte automatiquement l'endpoint metrics et commence à collecter les métriques de requêtes, cache et latence.

Configurer les seuils d'alerte (facultatif)

Définissez des seuils personnalisés pour le taux de SERVFAIL, le taux de cache hit ou la latence de résolution pour être notifié dès que la fiabilité ou les performances DNS se dégradent.

Vérifier que tout fonctionne

Exécutez cette commande sur le serveur pour confirmer que Xitogent a bien détecté l'intégration. De nouvelles métriques apparaîtront sur votre tableau de bord dans environ 30 secondes.

sudo xitogent status

Comparer

Vous envisagez des alternatives ?

Découvrez comment Xitoring se positionne face aux alternatives pour la surveillance de CoreDNS — tarifs forfaitaires, intégrations plus poussées et un seul agent pour couvrir tout votre stack.

Xitoring vs

Datadog

La tarification à l'hôte devient vite onéreuse à grande échelle. Découvrez comment Xitoring offre la même couverture avec un forfait fixe.

Xitoring vs

New Relic

Une observabilité full-stack sans paliers entreprise, frais d'ingestion ni licences par utilisateur.

Xitoring vs

Grafana Cloud

Un seul outil à un seul prix, plutôt que d'assembler Prometheus, Loki et Grafana dans un stack que vous devez aussi surveiller.

Voir toutes les comparaisons

Souvent a posé des questions

CoreDNS de Kubernetes ?

Oui, CoreDNS est entièrement pris en charge dans Kubernetes.

Les indicateurs Prometheus ?

Xitogent lit le point de terminaison des métriques Prometheus de CoreDNS.

À quoi sert le plugin kubernetes ?

Le plugin `kubernetes` surveille l'API Kubernetes pour les changements de Service, Endpoint et Pod, et synthétise des enregistrements DNS pour eux — résolutions `..svc.cluster.local`, enregistrements ESS de services headless, IP des pods. Il active également les fonctionnalités de découverte de service comme les enregistrements SRV pour les ports nommés. À surveiller en parallèle de `forward` (qui gère le DNS externe) puisqu'ils partagent le pipeline de requêtes.

Comment surveiller le ratio de hit du cache CoreDNS ?

Calculez-le depuis Prometheus : `coredns_cache_hits_total / (coredns_cache_hits_total + coredns_cache_misses_total)` — visez 80 %+ pour le DNS cluster, 95 %+ pour NodeLocal DNSCache. Des ratios faibles signifient généralement que les TTL sont trop courts (le TTL du DNS cluster est de 30s par défaut — ajustable) ou que le working set de requêtes uniques dépasse la taille du cache.

Que signifie NXDOMAIN dans les métriques CoreDNS ?

`NXDOMAIN` (domaine inexistant) dans `coredns_dns_response_rcode_count_total` signifie qu'un nom interrogé n'existe pas. Un peu de NXDOMAIN est normal (fautes de frappe, scanners) ; des pics signalent des domaines de recherche mal configurés, des applications cherchant des services inexistants ou des tentatives d'amplification DNS. SERVFAIL est plus préoccupant — cela signifie que CoreDNS n'a pas pu obtenir de réponse du tout (échec amont, erreur de plugin).

Comment déboguer CoreDNS dans Kubernetes ?

Trois niveaux : (1) vérifier les logs des pods (`kubectl logs -n kube-system -l k8s-app=kube-dns`), (2) tester la résolution depuis un pod (`kubectl exec... -- nslookup kubernetes.default`), (3) lire les métriques Prometheus pour le taux de SERVFAIL par plugin. Le plugin `log` peut être ajouté temporairement au Corefile pour obtenir une sortie de log par requête. Utilisez `dnstap` pour un traçage haut volume sécurisé en production sans affecter la latence des requêtes.

Comment surveiller la latence du plugin forward de CoreDNS ?

Lisez l'histogramme `coredns_forward_request_duration_seconds`, étiqueté par adresse de résolveur amont. Suivez p95 et p99 par amont — les amonts lents apparaissent ici, indépendamment de la latence interne à CoreDNS. Le plugin `forward` expose également `coredns_forward_responses_total` par rcode pour les taux de SERVFAIL spécifiques à chaque amont. Alertez sur p99 > 500ms par amont.

Quand faut-il utiliser NodeLocal DNSCache ?

Taille de cluster > ~100 nœuds, ou tout cluster subissant des races UDP conntrack (timeouts DNS intermittents sous charge). NodeLocal DNSCache exécute un sidecar de cache CoreDNS sur chaque nœud en écoutant sur `169.254.20.10:53`, éliminant l'entrée de la table conntrack par requête. La charge sur le CoreDNS cluster baisse généralement de 70 à 90 %, et la latence p99 DNS chute à la vitesse du disque local. Surveillez le taux de hit par nœud (cible 95 %+).

Quelles versions de CoreDNS sont prises en charge ?

CoreDNS 1.11.x, 1.12.x et 1.13.x sont entièrement pris en charge. La 1.12 a ajouté la découverte de services multicluster MCS-API, la configuration de timeout au démarrage et la gestion des hostnames IPv6 dans le plugin `kubernetes`. La 1.13.2 (déc. 2025) est la stable actuelle. K8s 1.30+ embarque CoreDNS 1.11.x par défaut ; les distributions récentes embarquent la 1.12.x. Xitogent détecte automatiquement la version et s'adapte.

Commencer à surveiller CoreDNS aujourd'hui

Configuration en moins de 60 secondes. Aucune carte bancaire requise. Statistiques complètes dès le premier jour.

Commencer l'essai gratuit

Continuez à explorer

Connexes Intégrations

Nginx

HAProxy