1、lsof 简介
lsof 是 Linux 下的一个非常实用的系统级的监控、诊断工具。
它的意思是 List Open Files,很容易你就记住了它是 “ls + of”的组合~
它可以用来列出被各种进程打开的文件信息,记住:Linux 下 “一切皆文件”,
包括但不限于 pipes, sockets, directories, devices, 等等。
因此,使用 lsof,你可以获取任何被打开文件的各种信息。
只需输入 lsof 就可以生成大量的信息,因为 lsof 需要访问核心内存和各种文件,所以必须以 root 用户的身份运行它才能够充分地发挥其功能。
lsof 的示例输出:
root@YLinux:~/lab0#lsof
COMMANDPIDTIDUSERFDTYPEDEVICESIZE/OFFNODENAME
systemd1rootcwdDIR8,640962/
systemd1rootrtdDIR8,640962/
systemd1roottxtREG8,622733401834909/usr/lib/systemd/systemd
systemd1rootmemREG8,62104731700647/lib/libnss_files-2.15.s
...
2、lsof 常用用法
2.1 监控打开的文件、设备
查看文件、设备被哪些进程占用:
#lsof/dev/tty1
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
bash1770jian0uCHR4,10t01045/dev/tty1
bash1770jian1uCHR4,10t01045/dev/tty1
bash1770jian2uCHR4,10t01045/dev/tty1
bash1770jian255uCHR4,10t01045/dev/tty1
startx1845jian0uCHR4,10t01045/dev/tty1
startx1845jian1uCHR4,10t01045/dev/tty1
...
2.2 监控文件系统
指定目录、挂载点,可以看到有哪些进程打开了其下的文件:
#lsof/data/
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
bash15983jiancwdDIR8,540968252/data/backup
...
这在 umount 某个文件系统失败时非常有用(通常会报该 FS is busy)。
列出某个目录(挂载点 如 /home 也行)下被打开的文件:
#lsof+D/var/log/
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
rsyslogd488syslog1wREG8,11151268940/var/log/syslog
rsyslogd488syslog2wREG8,12405269616/var/log/auth.log
console-k144root9wREG8,110871269369/var/log/ConsoleKit/history
列出被指定进程名打开的文件:
#lsof-cssh-cinit
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
init1roottxtREG8,1124704917562/sbin/init
init1rootmemREG8,114341801442625/lib/i386-Linux-gnu/libc-2.13.so
init1rootmemREG8,1306841442694/lib/i386-Linux-gnu/librt-2.13.so
...
ssh-agent1528lakshmanan1uCHR1,30t04369/dev/null
ssh-agent1528lakshmanan2uCHR1,30t04369/dev/null
ssh-agent1528lakshmanan3uunix0xdf70e2400t010464/tmp/ssh-sUymKXxw1495/agent.1495
2.3 监控进程
指定进程号,可以查看该进程打开的文件:
#lsof-p2064
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
firefox2064jiancwdDIR8,640961571780/home/jian
firefox2064jianrtdDIR8,640962/
firefox2064jiantxtREG8,6442241985670/usr/lib/firefox-12.0/firefox
firefox2064jianmemREG8,614707012925361/usr/share/fonts/chinese/msyhbd.ttf
firefox2064jianmemREG8,615067744925362/usr/share/fonts/chinese/msyh.ttf
firefox2064jianmemREG8,6167912511701681/usr/share/fonts/wenquanyi/wqy-zenhei.ttc
firefox2064jianmemREG0,166710890410203/dev/shm/pulse-shm-3021850167
...
当你想要杀掉某个用户所有打开的文件、设备,你可以这样:
kill-9`lsof-t-ulakshmanan`
此处 -t 的作用是单独的列出 进程 id 这一列。
关于杀死进程的 4 种方式,请参考:
http://www.thegeekstuff.com/2009/12/4-ways-to-kill-a-process-kill-killall-pkill-xkill/
2.4 监控网络
查看指定端口有哪些进程在使用(lsof -i 列出所有的打开的网络连接):
#lsof-i:22
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
sshd1569root3uIPv4103030t0TCP*:ssh(LISTEN)
sshd1569root4uIPv6103050t0TCP*:ssh(LISTEN)
...
列出被某个进程打开所有的网络文件:
lsof-i-a-p234
或者:
lsof-i-a-cssh
列出所有 tcp、udp 连接:
lsof-itcp;
lsof-iudp;
列出所有 NFS 文件:
lsof-N-ulakshmanan-a
查看指定网口有哪些进程在使用:
#lsof-i@192.168.1.91
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
skype1909jian54uIPv491160t0TCP192.168.1.91:40640->64.4.23.153:40047(ESTABLISHED)
pidgin1973jian7uIPv465990t0TCP192.168.1.91:59311->hx-in-f125.1e100.net:https(ESTABLISHED)
pidgin1973jian13uIPv492600t0TCP192.168.1.91:54447->by2msg3010511.phx.gbl:msnp(ESTABLISHED)
...
3、更多使用技巧
3.1 监控用戶
查看指定用戶打开的文件(lsof -u ^lakshmanan 可以排除某用户):
#lsof-umessagebus
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
dbus-daem1805messagebuscwdDIR8,640962/
dbus-daem1805messagebusrtdDIR8,640962/
dbus-daem1805messagebustxtREG8,612353611834948/usr/bin/dbus-daemon
dbus-daem1805messagebusmemREG8,62104731700647/lib/libnss_files-2.15.so
dbus-daem1805messagebusmemREG8,61901451700642/lib/libnss_nis-2.15.so
dbus-daem1805messagebusmemREG8,64903661700636/lib/libnsl-2.15.so
...
3.2 监控应用程序
查看指定程序打开的文件:
#lsof-cfirefox
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
firefox2064jiancwdDIR8,640961571780/home/jian
firefox2064jianrtdDIR8,640962/
firefox2064jiantxtREG8,6442241985670/usr/lib/firefox-12.0/firefox
firefox2064jianmemREG8,614707012925361/usr/share/fonts/chinese/msyhbd.ttf
firefox2064jianmemREG8,615067744925362/usr/share/fonts/chinese/msyh.ttf
firefox2064jianmemREG8,6167912511701681/usr/share/fonts/wenquanyi/wqy-zenhei.ttc
...
4、命令模式技巧
4.1 组合逻辑查询条件
只有多个查询条件都满足, 用 "-a" 参数,默认是 -o 。
#lsof-a-cbash-uroot
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
bash1986rootcwdDIR8,640961701593/root/lab
bash1986rootrtdDIR8,640962/
bash1986roottxtREG8,619941571700632/bin/bash
bash1986rootmemREG8,69690800405214/usr/lib/locale/locale-archive
bash1986rootmemREG8,62104731700647/lib/libnss_files-2.15.so
4.2 lsof 命令的重复执行模式:
基于给定的参数延时多少秒重复执行 lsof:
+r 表示 当没有文件被打开的时候,repeat mode 将自行结束。
-r 表示 不管文件是否存在或者被打开,它都将执行,直到你中断它。
每个循环的输出使用 ‘=======’ 做分隔符,你也可以用 ‘-r’ | ‘+r’ 指定延时时间。
#lsof-ulakshmanan-cinit-a-r5
=======
=======
COMMANDPIDUSERFDTYPEDEVICESIZE/OFFNODENAME
inita.sh2971lakshmanancwdDIR8,14096393218/home/lakshmanan
inita.sh2971lakshmananrtdDIR8,140962/
inita.sh2971lakshmanantxtREG8,183848524315/bin/dash
inita.sh2971lakshmananmemREG8,114341801442625/lib/i386-Linux-gnu/libc-2.13.so
inita.sh2971lakshmananmemREG8,11179601442612/lib/i386-Linux-gnu/ld-2.13.so
inita.sh2971lakshmanan0uCHR136,40t07/dev/pts/4
inita.sh2971lakshmanan1uCHR136,40t07/dev/pts/4
inita.sh2971lakshmanan2uCHR136,40t07/dev/pts/4
inita.sh2971lakshmanan10rREG8,120393578/home/lakshmanan/inita.sh
=======
以上输出是前 5 秒没有输出,然后 “inita.sh” 启动后,开始有了输出。
5、最后的技巧
关于磁盘空间告警 df -h --max=1 与 du -hx --max=1 显示不一致的问题,
最常见的的还是下面这种情况:
lsof|grep-idelete
看看被删除的文件:有些删了文件,但是进程没 reload,那些空间还是占用的,你可以理解为类似 windows 下的进程句柄没释放的概念吧~ 只是 windows 下如果有文件被进程使用,你一般是删不掉的,而 Linux 虽然不做删除限制,但却要等到进程使用完文件才能完全释放,以防止进程奔溃,这是操作系统对资源的管理差异吧~
例如 nginx 会有很多临时文件占用了 /tmp 目录,删掉后,依然占用着空间,
此时你可以:
pkill-9nginx&&/etc/init.d/nginxrestart
好吧,本文到此结束了,关于 lsof 还有很多很多,不过哥常用、知道的就这些了,哥也只能帮你到这儿了,
如果你还需要其它的内容,请自行 google 吧,骚年。。。
6、refer:
使用 lsof 查找打开的文件:
http://www.ibm.com/developerworks/cn/aix/library/au-lsof.html
15 Linux lsof Command Examples (Identify Open Files):
http://www.thegeekstuff.com/2012/08/lsof-command-examples/
实用的系统工具之 lsof:
http://www.yLinux.org/forum/t/276