说起 top 命令可以说是服务器运维是使用频率最高的命令,明月是非常的喜欢使用,几乎每天都会用到,用来实时的监控服务器运行状态绝对是首选。今天就通过这篇教程提升你的 top 命令的知识,让你的运维工作更加的高效!

尝试找出你的机器正在运行什么程序,以及哪个进程耗尽了内存导致系统非常非常慢 —— 这是 top 命令所能胜任的工作。

top 是一个非常有用的程序,其作用类似于 Windows 任务管理器或 MacOS 的活动监视器。在 Linux 机器上运行 top 将实时显示系统上运行的进程的情况。

top

取决于你运行的 top 版本,你会看到类似如下内容:

top命令运行界面

注:你所用的 top 版本可能跟这个看起来不一样,特别是在显示的列上。

如何阅读输出的内容

你可以根据输出判断你正在运行的内容,但尝试去解释结果你可能会有些困惑。

前几行包含一堆统计信息(详细信息),后跟一个包含结果列的表(列)。让我们从后者开始吧。

这些是系统正在运行的进程。默认按 CPU 使用率降序排序。这意味着在列表顶部的程序正使用更多的 CPU 资源并对你的系统造成更重的负担。对于资源使用而言,这些程序是字面上的消耗资源最多的(top)进程。不得不说,top 这个名字起得很妙。

最右边的 COMMAND 一列报告进程名(启动它们的命令)。在这个例子里,进程名是 php-fpm、mysqld、screen、和 tcpdump 等

KmCudlZ7xg2AbRAoAAE-RuFOAFc334.png

其它列提供了关于进程的有用信息:

  • PID:进程 ID,一个用来定位进程的唯一标识符
  • USER:运行进程的用户
  • PR:任务的优先级
  • NI:Nice 值,优先级的一个更好的表现形式
  • VIRT:虚拟内存的大小,单位是 KiB(kibibytes)
  • RES:常驻内存大小,单位是 KiB(物理内存和虚拟内存的一部分)
  • SHR:共享内存大小,单位是 KiB(共享内存和虚拟内存的一部分)
  • S:进程状态,一般 I 代表空闲,R 代表运行,S 代表休眠,Z 代表僵尸进程,Tt 代表停止(还有其它更少见的选项)
  • %CPU:自从上次屏幕更新后的 CPU 使用率
  • %MEM:自从上次屏幕更新后的 RES 常驻内存使用率
  • TIME+:自从程序启动后总的 CPU 使用时间
  • COMMAND:启动命令,如之前描述那样

确切知道 VIRTRESSHR 值代表什么在日常操作中并不重要。重要的是要知道 VIRT 值最高的进程就是内存使用最多的进程。当你在用 top 排查为什么你的电脑运行无比卡的时候,那个 VIRT 数值最大的进程就是元凶。如果你想要知道共享内存和物理内存的确切意思,请查阅 top 手册的 Linux Memory Types 段落。

是的,我说的是 kibibytes 而不是 kilobytes。通常称为 kilobyte 的 1024 值实际上是 kibibyte。希腊语的 kilo(χίλιοι)意思是一千(例如一千米是 1000 米,一千克是 1000 克)。Kibi 是 kilo 和 binary 的合成词,意思是 1024 字节(或者 210 )。但是,因为这个词很难说,所以很多人在说 1024 字节的时候会说 kilobyte。top 试图在这里使用恰当的术语,所以按它说的理解就好。

屏幕更新说明

实时屏幕更新是 Linux 程序可以做的 非常酷 的事之一。这意味着程序能实时更新它们显示的内容,所以看起来是动态的,即使它们用的是文本。非常酷!在我们的例子中,更新时间间隔很重要,因为一些统计数据(%CPU%MEM)是基于上次屏幕更新的数值的。

因为我们运行在一个持久性的程序中,我们就可以输入一些命令来实时修改配置(而不是停止应用,然后用一个不同的命令行选项再次运行)。

按下 h 调用帮助界面,该界面也显示了默认延迟(屏幕更新的时间间隔)。这个值默认(大约)是 3 秒,但你可以输入 d(大概是 delay 的意思)或者 s(可能是 screenseconds 的意思)来修改它。

细节

在进程列表上面有一大堆有用的信息。有些细节看起来有点儿奇怪,让人困惑。但是一旦你花点儿时间来逐个过一遍,你会发现,在紧要关头,这些是非常有用的。

KmCudlZ7xySABR-wAAGEpL00fbc890.png

151495243AF-510K.jpg

第一行包含系统的大致信息:

  • top:我们正在运行 top!你好!top!
  • XX:YY:XX:当前时间,每次屏幕更新的时候更新
  • up(接下去是 X day, YY:ZZ):系统的 uptime,或者自从系统启动后已经过去了多长时间
  • load average(后跟三个数字):分别是过去一分钟、五分钟、15 分钟的系统负载

第二行(Task)显示了正在运行的任务的信息,不用解释。它显示了进程总数和正在运行的、休眠中的、停止的进程数和僵尸进程数。这实际上是上述 S(状态)列的总和。

第三行(%Cpu(s))显示了按类型划分的 CPU 使用情况。数据是屏幕刷新之间的值。这些值是:

  • us:用户进程
  • sy:系统进程
  • ni:nice 用户进程
  • id:CPU 的空闲时间,这个值比较高时说明系统比较空闲
  • wa:等待时间,或者消耗在等待 I/O 完成的时间
  • hi:消耗在硬件中断的时间
  • si:消耗在软件中断的时间
  • st:“虚拟机管理程序从该虚拟机窃取的时间”

你可以通过点击 t(toggle)来展开或折叠 Task%Cpu(s) 行

第四行(Kib Mem)和第五行(KiB Swap)提供了内存和交换空间的信息。这些数值是:

  • 总内存容量
  • 已用内存
  • 空闲内存
  • 内存的缓冲值
  • 交换空间的缓存值

默认它们是用 KiB 为单位展示的,但是按下 E(扩展内存缩放 extend memory scaling)可以轮换不同的单位:KiB、MiB、GiB、TiB、PiB、EiB(kilobytes、megabytes、gigabytes、terabytes、petabytes 和 exabytes)

top 用户手册有更多选项和配置项信息。你可以运行 man top 来查看你系统上的文档。还有很多 HTML 版的 man 手册,但是请留意,这些手册可能是针对不同 top 版本的。

最后修改:2018 年 09 月 12 日
如果觉得我的文章对你有用,请随意赞赏