Skip to content

Prometheus 设置指南

本指南介绍如何配置 Kite 与 Prometheus 的监控集成,以实现实时指标和监控功能。

概述

Kite 与 Prometheus 集成提供:

  • 实时集群资源指标
  • 历史数据可视化
  • Pod 和容器资源使用跟踪
  • 节点性能监控

前提条件

  • 一个运行中的 Kubernetes 集群
  • 配置了集群访问权限的 kubectl
  • 集群管理员权限(用于安装 Prometheus)

Prometheus 安装选项

选项 1:使用 kube-prometheus-stack(推荐)

kube-prometheus-stack Helm chart 提供了完整的监控解决方案,包括 Prometheus、Alertmanager 和 Grafana。

bash
# 添加 Prometheus 社区 Helm 仓库
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update

# 安装 kube-prometheus-stack
helm install prometheus prometheus-community/kube-prometheus-stack \
  --namespace monitoring \
  --create-namespace

选项 2:手动安装 Prometheus

如需对安装有更多控制,您可以手动安装 Prometheus 组件:

  1. Prometheus 服务器 - 收集并存储指标
  2. kube-state-metrics - 提供 Kubernetes 对象指标
  3. metrics-server - 提供容器资源指标
  4. Node Exporter - 收集主机系统指标

按照每个组件的官方文档获取详细的安装说明。

连接 Kite 到 Prometheus

拥有 admin 角色的用户,可在页面右上角进入设置入口,进入集群管理界面。

选中需要配置的集群,填写 Prometheus 地址。

故障排除

常见问题

  1. 未显示指标

    • 验证 Prometheus URL 是否正确
    • 检查 Prometheus 服务器是否运行
    • 确保 Prometheus 可以从目标抓取指标
  2. 指标不完整

    • 确保 kube-state-metrics 正在运行
    • 检查 Prometheus 配置是否包含所有必要的抓取任务
    • 验证目标 Pod/节点是否正确标记以供 Prometheus 发现
  3. 认证错误

    • 如果 Prometheus 需要认证,确保提供了凭据
    • 如果使用 HTTPS,检查 TLS 配置

验证 Prometheus 配置

要检查 Prometheus 是否正确抓取目标:

bash
# 端口转发到 Prometheus UI
kubectl port-forward -n monitoring svc/prometheus-server 9090:9090

# 然后在浏览器中打开:
# http://localhost:9090/targets

Released under the Apache License.