Prometheus 设置指南
本指南介绍如何配置 Kite 与 Prometheus 的监控集成,以实现实时指标和监控功能。
概述
Kite 与 Prometheus 集成提供:
- 实时集群资源指标
- 历史数据可视化
- Pod 和容器资源使用跟踪
- 节点性能监控
前提条件
- 一个运行中的 Kubernetes 集群
- 配置了集群访问权限的
kubectl
- 集群管理员权限(用于安装 Prometheus)
Prometheus 安装选项
选项 1:使用 kube-prometheus-stack(推荐)
kube-prometheus-stack Helm chart 提供了完整的监控解决方案,包括 Prometheus、Alertmanager 和 Grafana。
bash
# 添加 Prometheus 社区 Helm 仓库
helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update
# 安装 kube-prometheus-stack
helm install prometheus prometheus-community/kube-prometheus-stack \
--namespace monitoring \
--create-namespace
选项 2:手动安装 Prometheus
如需对安装有更多控制,您可以手动安装 Prometheus 组件:
- Prometheus 服务器 - 收集并存储指标
- kube-state-metrics - 提供 Kubernetes 对象指标
- metrics-server - 提供容器资源指标
- Node Exporter - 收集主机系统指标
按照每个组件的官方文档获取详细的安装说明。
连接 Kite 到 Prometheus
拥有 admin 角色的用户,可在页面右上角进入设置入口,进入集群管理界面。
选中需要配置的集群,填写 Prometheus 地址。
故障排除
常见问题
未显示指标:
- 验证 Prometheus URL 是否正确
- 检查 Prometheus 服务器是否运行
- 确保 Prometheus 可以从目标抓取指标
指标不完整:
- 确保 kube-state-metrics 正在运行
- 检查 Prometheus 配置是否包含所有必要的抓取任务
- 验证目标 Pod/节点是否正确标记以供 Prometheus 发现
认证错误:
- 如果 Prometheus 需要认证,确保提供了凭据
- 如果使用 HTTPS,检查 TLS 配置
验证 Prometheus 配置
要检查 Prometheus 是否正确抓取目标:
bash
# 端口转发到 Prometheus UI
kubectl port-forward -n monitoring svc/prometheus-server 9090:9090
# 然后在浏览器中打开:
# http://localhost:9090/targets