在 Linux 系统上,长时间运行的高 CPU 和内存消耗进程可能会影响系统性能,甚至导致系统变慢或无响应。为了排查和解决这些问题,系统管理员需要掌握一套全面而高效的检查方法。本篇文章将详细介绍如何在 Linux 系统上检查这些问题,从基本工具到高级分析,涵盖从命令行到脚本自动化的多种方法。
1. 基础工具
1.1 top
top
是一个实时显示系统资源使用情况的工具。以下是使用 top
检查高 CPU 和内存消耗进程的步骤:
-
1. 打开终端,输入
top
并按回车键。 -
2. 在显示的实时系统资源使用情况中,关注以下字段:
-
•
%CPU
:显示每个进程的 CPU 使用百分比。 -
•
%MEM
:显示每个进程的内存使用百分比。 -
•
TIME+
:显示进程的累计 CPU 时间。
可以通过按以下键对输出进行调整:
-
•
P
:按 CPU 使用量排序。 -
•
M
:按内存使用量排序。 -
•
q
:退出。
示例输出:
1.2 htop
htop
是 top
的增强版本,提供更友好的界面和交互功能。
-
1. 安装
htop
(如果未安装):
sudo apt install htop # 对于基于 Debian 的系统
sudo yum install htop # 对于基于 Red Hat 的系统
-
2. 运行
htop
,可以通过上下箭头快速选择进程。
-
3. 通过按
F6
键自定义排序。
1.3 ps
ps
命令用于显示当前运行的进程信息。
-
1. 查找 CPU 使用率最高的进程:
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head -n 10
-
2. 查找内存使用率最高的进程:
ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head -n 10
2. 高级工具
2.1 pidstat
pidstat
是 sysstat
工具包的一部分,用于按进程监控 CPU 和内存使用情况。
-
1. 安装
sysstat
工具包:
sudo apt install sysstat
-
2. 使用
pidstat
查看特定时间间隔的进程使用情况:
pidstat -u 2 5 # 每 2 秒采样一次,共采样 5 次
-
3. 查看内存和 IO 使用情况:
pidstat -r -d 2 5
2.2 sar
sar
也是 sysstat
工具包的一部分,可用于分析系统资源的历史使用情况。
-
1. 查看历史 CPU 使用情况:
sar -u -f /var/log/sysstat/saXX # XX 为日期
-
2. 查看内存使用情况:
sar -r -f /var/log/sysstat/saXX
2.3 iotop
如果怀疑某些高 CPU 或内存使用的进程还涉及高 IO,可以使用 iotop
。
-
1. 安装
iotop
:
sudo apt install iotop
-
2. 查看实时 IO 使用情况:
sudo iotop
3. 日志与历史记录分析
3.1 使用 dmesg
dmesg
用于检查系统内核日志。某些高负载进程可能触发内核警告。
-
1. 查看内核日志:
dmesg | tail -n 50
-
2. 过滤特定关键词:
dmesg | grep -i "oom"
3.2 检查 syslog
系统日志可能包含关于资源密集型进程的记录。
-
1. 查看系统日志:
sudo cat /var/log/syslog | grep "high load"
-
2. 结合时间戳,定位问题时间段。
4. 自动化与脚本化分析
为了节省时间,可以通过脚本实现自动化分析。
示例脚本:查找高 CPU 和内存进程
以下脚本可每隔一段时间记录高 CPU 和内存使用的进程:
#!/bin/bash
OUTPUT_FILE="high_usage.log"
INTERVAL=5
while true; do
echo "Timestamp: $(date)" >> $OUTPUT_FILE
echo "Top CPU Consuming Processes:" >> $OUTPUT_FILE
ps -eo pid,ppid,cmd,%cpu --sort=-%cpu | head -n 5 >> $OUTPUT_FILE
echo "Top Memory Consuming Processes:" >> $OUTPUT_FILE
ps -eo pid,ppid,cmd,%mem --sort=-%mem | head -n 5 >> $OUTPUT_FILE
echo "------------------------" >> $OUTPUT_FILE
sleep $INTERVAL
done
运行此脚本后,日志文件 high_usage.log
将记录高消耗进程。
5. 解决方法
在找到高 CPU 和内存消耗的进程后,可以根据情况选择以下措施:
-
1. 结束进程:
kill -9 <PID>
-
2. 调整进程优先级:
renice -n 10 -p <PID>
-
3. 分析应用:检查该进程的应用日志或配置,优化资源使用。
原文始发于微信公众号(sec0nd安全):如何检查 Linux 上长时间运行的高 CPU 和内存消耗进程?
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论