Prometheus + Grafana 实战入门：从一台 Linux 服务器开始搭自己的监控面板

1
cd /tmp
2
wget https://github.com/prometheus/node_exporter/releases/latest/download/node_exporter-1.9.1.linux-amd64.tar.gz
3
tar -xzf node_exporter-1.9.1.linux-amd64.tar.gz
4
cd node_exporter-1.9.1.linux-amd64

版本号以后可能会变，你可以去 GitHub Releases 页面看最新版本。

直接运行测试#

1
./node_exporter

默认它会监听：

1
0.0.0.0:9100

这时候你可以在服务器本机测试：

1
curl http://127.0.0.1:9100/metrics | head

如果能看到一堆以 node_ 开头的指标，说明它已经正常工作了。

第二步：把 `node_exporter` 做成 systemd 服务#

如果只是临时试试，前面那一步就够了。

但如果你想长期用，最好还是做成 systemd 服务。

创建用户#

1
useradd --no-create-home --shell /usr/sbin/nologin node_exporter

移动二进制文件#

1
cp ./node_exporter /usr/local/bin/node_exporter
2
chown node_exporter:node_exporter /usr/local/bin/node_exporter

写 systemd 服务文件#

创建：

1
/etc/systemd/system/node_exporter.service

内容例如：

1
[Unit]
2
Description=Prometheus Node Exporter
3
After=network.target
4

5
[Service]
6
User=node_exporter
7
Group=node_exporter
8
Type=simple
9
ExecStart=/usr/local/bin/node_exporter
10
Restart=on-failure
11

12
[Install]
13
WantedBy=multi-user.target

启动并设置开机自启#

1
systemctl daemon-reload
2
systemctl enable --now node_exporter
3
systemctl status node_exporter --no-pager

如果状态是 active (running)，说明这一步已经完成。

第三步：部署 Prometheus#

Prometheus 可以装在同一台机器，也可以装在另一台机器。

如果你只是练手，最简单的方式就是先装在同一台机器上。

下载并解压#

1
cd /tmp
2
wget https://github.com/prometheus/prometheus/releases/latest/download/prometheus-3.4.0.linux-amd64.tar.gz
3
tar -xzf prometheus-3.4.0.linux-amd64.tar.gz
4
cd prometheus-3.4.0.linux-amd64

最小配置文件#

编辑 prometheus.yml，核心内容类似这样：

1
global:
2
  scrape_interval: 15s
3

4
scrape_configs:
5
  - job_name: 'prometheus'
6
    static_configs:
7
      - targets: ['127.0.0.1:9090']
8

9
  - job_name: 'node'
10
    static_configs:
11
      - targets: ['127.0.0.1:9100']

意思其实很直白：

Prometheus 也监控自己
Prometheus 去抓本机的 node_exporter

直接运行测试#

1
./prometheus --config.file=prometheus.yml

然后访问：

1
http://你的服务器IP:9090

如果能打开 Prometheus 界面，说明它已经起来了。

先查一个最基础的指标#

在 Prometheus 页面里查：

1
up

如果你看到：

Prometheus 自己是 1
node 这个 target 也是 1

说明采集链路已经通了。

第四步：把 Prometheus 做成 systemd 服务#

这一段我这次不省略了，因为对新手来说，很多教程刚好就是省在这里，结果你手动跑通了，第二天机器一重启就没了。

1）创建用户和目录#

1
useradd --no-create-home --shell /usr/sbin/nologin prometheus
2
mkdir -p /etc/prometheus
3
mkdir -p /var/lib/prometheus
4
chown -R prometheus:prometheus /etc/prometheus /var/lib/prometheus

2）复制文件#

假设你现在还在刚才解压出来的 Prometheus 目录里：

1
cp ./prometheus /usr/local/bin/prometheus
2
cp ./promtool /usr/local/bin/promtool
3
cp ./prometheus.yml /etc/prometheus/prometheus.yml
4
chown prometheus:prometheus /usr/local/bin/prometheus /usr/local/bin/promtool
5
chown prometheus:prometheus /etc/prometheus/prometheus.yml

3）创建 systemd 服务文件#

创建：

1
/etc/systemd/system/prometheus.service

内容例如：

1
[Unit]
2
Description=Prometheus
3
After=network.target
4

5
[Service]
6
User=prometheus
7
Group=prometheus
8
Type=simple
9
ExecStart=/usr/local/bin/prometheus \
10
  --config.file=/etc/prometheus/prometheus.yml \
11
  --storage.tsdb.path=/var/lib/prometheus \
12
  --web.listen-address=0.0.0.0:9090
13
Restart=on-failure
14

15
[Install]
16
WantedBy=multi-user.target

4）启动并设置开机自启#

1
systemctl daemon-reload
2
systemctl enable --now prometheus
3
systemctl status prometheus --no-pager

如果状态是 active (running)，并且你还能正常打开 9090 页面，那说明 Prometheus 这一层已经稳定下来了。

第五步：部署 Grafana#

Grafana 的安装方式很多。

如果你用的是 Debian / Ubuntu，我更建议优先用官方软件源安装，这也是官方更推荐的方式之一。这样后面升级和维护都会更顺手。

Debian / Ubuntu 通过官方软件源安装#

先安装必要工具：

1
apt-get update
2
apt-get install -y apt-transport-https software-properties-common wget

添加 Grafana 的 GPG key：

1
mkdir -p /etc/apt/keyrings
2
wget -q -O - https://apt.grafana.com/gpg.key | gpg --dearmor -o /etc/apt/keyrings/grafana.gpg

添加软件源：

1
echo "deb [signed-by=/etc/apt/keyrings/grafana.gpg] https://apt.grafana.com stable main" | tee /etc/apt/sources.list.d/grafana.list

更新索引并安装：

1
apt-get update
2
apt-get install -y grafana

装完以后启动：

1
systemctl enable --now grafana-server
2
systemctl status grafana-server --no-pager

默认端口通常是：

1
3000

然后访问：

1
http://你的服务器IP:3000

第一次登录默认账号一般是：

用户名：admin
密码：admin

登录后它通常会要求你修改密码。

第六步：在 Grafana 里添加 Prometheus 数据源#

进入 Grafana 后，基本流程是：

打开 Data Sources
选择 Prometheus
填 Prometheus 地址

如果 Grafana 和 Prometheus 在同一台机器，通常可以填：

1
http://127.0.0.1:9090

保存并测试。

如果显示连接成功，说明：

Grafana 已经能读到 Prometheus
下一步就可以做 dashboard 了

第七步：导入一个现成的 Node Exporter Dashboard#

这是我最推荐新手做的事。

不要一开始就自己手搓面板。

先导入一个成熟模板，你会更快进入状态。

Grafana 社区里有很多现成 dashboard，最常见的就是 Node Exporter 主机监控模板。

你可以在 Grafana 官方 dashboard 网站搜：

Node Exporter Full

导入后选中你的 Prometheus 数据源，Grafana 就会自动把这些图表和数据对应起来。

这时候你通常就能看到：

CPU
内存
磁盘
网络流量
load average
文件系统使用率

都开始正常显示了。

到这一步，你其实已经完成了第一套监控闭环#

链路就是：

node_exporter 暴露主机指标
Prometheus 抓这些指标
Grafana 把它们画出来

对新手来说，这已经是一个很完整、而且很有成就感的起点了。

你接下来最适合做的几件事#

如果你已经把这套东西跑起来了，下一步可以继续做这些：

1）熟悉几个基础指标#

例如：

up
node_cpu_seconds_total
node_memory_MemAvailable_bytes
node_filesystem_avail_bytes
node_load1

2）观察一天的趋势#

不要只盯着刚部署成功那一刻。

更有价值的是：

白天和晚上有什么差异
某个服务启动时资源变化如何
磁盘是不是一直在慢慢变满

3）试着自己加一个 Panel#

哪怕只是：

复制一个现有图表
改一个查询
改个标题

这个过程都会帮助你更快理解 Grafana 和 Prometheus 的关系。

新手最常见的坑#

坑 1：Prometheus 能起来，但抓不到 node_exporter#

这种情况一般先查：

node_exporter 是否真的在监听 9100
Prometheus 配置里的 target 写得对不对
防火墙有没有拦

坑 2：Grafana 能打开，但看不到数据#

这时候优先检查：

Prometheus 数据源是否添加成功
Prometheus 里 up 是否正常
Dashboard 绑定的是不是正确的数据源

坑 3：第一次看到很多图，但不知道看什么#

这是正常的。

刚开始不用想“我要做很厉害的监控分析”，你只要先看懂：

CPU 有没有异常波动
内存是不是稳定上升
磁盘是不是在持续减少

这就已经很有用了。

如果你现在准备自己练手#

那我会建议你按这个顺序做：

先部署 node_exporter
再部署 Prometheus
确认 up 能查到
再装 Grafana
导入一个 Node Exporter Dashboard

先别急着监控太多服务。

只要把“主机监控”这一条链路跑顺，你后面再监控 Docker、Nginx、MySQL、PostgreSQL，都只是继续往上加东西。

写在最后#

Prometheus + Grafana 这套东西，第一次接触时确实容易觉得名字很多、组件很多。

但如果你把它拆开看，就会发现其实并不复杂：

node_exporter 负责提供指标
Prometheus 负责抓和存
Grafana 负责画图

对新手来说，最重要的不是一下子学全，而是先把第一套闭环搭出来。

只要你能在一台机器上看到：

CPU 曲线
内存曲线
磁盘曲线

那你对监控体系的理解就已经不再停留在概念层了。

这一步一旦走通，后面学告警、学 PromQL、学更多 exporter，都会容易很多。

Prometheus + Grafana 实战入门：从一台 Linux 服务器开始搭自己的监控面板

这篇文章要做的事#

先理解一下这三者的关系#

node_exporter#

Prometheus#

Grafana#

第一步：在目标服务器上部署 node_exporter#

下载并解压#

直接运行测试#

第二步：把 node_exporter 做成 systemd 服务#

创建用户#

移动二进制文件#

写 systemd 服务文件#

启动并设置开机自启#

第三步：部署 Prometheus#

下载并解压#

最小配置文件#

直接运行测试#

先查一个最基础的指标#

第四步：把 Prometheus 做成 systemd 服务#

1）创建用户和目录#

2）复制文件#

3）创建 systemd 服务文件#

4）启动并设置开机自启#

第五步：部署 Grafana#

Debian / Ubuntu 通过官方软件源安装#

第六步：在 Grafana 里添加 Prometheus 数据源#

第七步：导入一个现成的 Node Exporter Dashboard#

到这一步，你其实已经完成了第一套监控闭环#

你接下来最适合做的几件事#

1）熟悉几个基础指标#

2）观察一天的趋势#

3）试着自己加一个 Panel#

新手最常见的坑#

坑 1：Prometheus 能起来，但抓不到 node_exporter#

坑 2：Grafana 能打开，但看不到数据#

坑 3：第一次看到很多图，但不知道看什么#

如果你现在准备自己练手#

写在最后#

评论

`node_exporter`#

第一步：在目标服务器上部署 `node_exporter`#

第二步：把 `node_exporter` 做成 systemd 服务#