1.我想要让Apache为大量的连接提供服务。为了减小创建进程所需要的时间,我把Apache子进程数量配置为固定的1000。系统的性能很差,有时甚至拒绝连接。你有什么建议吗?
解答:看来你很可能遇到了一个通常称为“thundering herd”(异乎寻常地聚集)的问题。Apache和Linux的文档都详细地说明了这个问题,你可以用几种方法来解决它。
在Linux中,这种情形通常从进程“wake”(唤醒)发展而来。当一个新到达的连接要求Apache/Linux提供服务时,系统向所有正在休眠的进程发出通知。这时,所有这些进程会试图获得对新连接的控制权。但是,它们之中只有一个能够获得成功,所有其他进程都将失败并转入休眠状态。这被称为“wake all”(全部唤醒)。Linux 2.2和更早的内核都按照这种方式进行处理。
当正在休眠的Apache进程比较少时,它不会成为问题。通常,Apache会利用httpd.conf中的MinSpareServers和MaxSpareServers配置变量调整休眠进程的数量。然而,如果MaxSpareServer值高得异乎寻常,那么它可能导致性能问题。我通常把MaxSpareServer值设置为MaxClients值的百分之五到十之间。
如果你的MaxSpareServers值高得异乎寻常,只要减小这个值就可以立即提高性能。
一些内核不会遇到这个问题,因为它们具有一种利用“wake one”(唤醒一个)的能力,“wake one”允许为每个连接请求唤醒一个进程。BSD具有这个能力,Linux 2.4内核也一样。
为了利用“wake one”能力,编译Apache的时候必须指定一个特殊的选项。如果为2.4内核配置Apache,在编译之前请按照下面的示例执行命令,它将改善具有“wake one”能力的内核的性能:
# CFLAGS='-DSINGLE_LISTEN_UNSERIALIZED_ACCEPT' ./configure
为给数量巨大的网络连接提供服务,Apache提供了许多调整参数。Apache有一个固定的最大允许连接数量限制,如果要把它设置成大于256,你必须重新编译Apache。
另外,为了适应大规模服务的要求,Linux也需要进行一些文件系统方面的调整。你还要检查一下Linux通过编译方式固定的进程、系统级、用户级限制。
简而言之,当你为了巨大的Apache进程/连接数量而进行调整时,有大量的因素必须考虑。“thundering herd”也许是被忽视最多的问题,但其它需要考虑的因素还有很多。
欲知更多为了提高连接数量而调整Apache的信息,请访问http://linuxperf.nl.linux.org/webserving。
2.我得到了一个服务器上的帐号。由于管理员推荐使用ssh,这个帐号被禁止使用telnet和ftp。什么是ssh?如何使用?他们为什么要禁用telnet?
解答:ssh是“secure shell”的简称,它完全可以替代telnet。ssh也有一个文件复制命令,即scp(安全拷贝),利用这个命令可以在不同的机器之间移动文件。
由于telnet和ftp的设计不是很安全,许多管理员禁用了telnet和ftp。用telnet和ftp协议登录服务器时,密码以明文的形式发送给服务器,怀有恶意的人可能监听网络上传输的数据包,进而得到用户的登录信息。虽然发生这种事情的可能性不大,但如果使用象ssh之类的协议,我们可以完全防止这类事情发生。
在使用方法上,ssh和telnet很相似。然而,ssh不仅加密登录名字和密码,而且加密整个传输过程。因此,ssh能够防止任何在你和服务器之间的第三者看到传输内容。
有一个广受欢迎的免费ssh实现,它属于OpenBSD系统,但也可以在Linux上运行。OpenSSh可以从http://ftp.openbsd.org/pub/OpenBSD/OpenSSH下载。如果你的系统以rpm包为基础,你可以在portable/rpm目录下找到rpm包。(直到最近,OpenSSH所用的加密算法之一还有专利限制。但现在情况已经有了变化。请参见http://www.rsasecurity.com/developers/total-solution)。
安装好ssh之后,我们可以很方便地在远程服务器上利用ssh获得一个shell。例如,假设我执行:
# ssh dtype@trove.sourceforge.net
首先我看到系统提示输入密码,输入后我就在远程机器上获得了一个shell。从这里开始,ssh的会话过程和telnet会话相似。不同之处在于,我能够确信所有在我和服务器之间传输的数据都已经经过加密。
如果你很熟悉rsh和它的选项,那么你很快就可以开始使用ssh。ssh被设计成和rsh具有相同的运作方式。一般情况下,能够用rsh作为传输端口的程序都允许用ssh来替代(例如rsync)。
安全复制命令scp的用法也很简单,它的语法和cp的语法很相似。例如,要把index.php文件复制到dtype.org服务器,则我们使用如下命令:
# scp index.php dtype@dtype.org:/usr/local/apache/htdocs/
此时,我们将看到密码输入提示(正如ssh)。接下来,本地机器当前目录下的index.php文件被复制到dtype.org的/usr/local/apache/htdocs/,使用的登录名字是dtype。
要了解有关OpenSSh的更多信息,请参见http://www.openssh.com,从这里你可以找到有关安全协议的详细说明。
3.我有一台便携计算机。我想要保证便携机和台式机上都有最新的数据文件。你有何建议?
解答:有一个优秀的工具rsync能够完成这个任务。rsync提供了一种保持两组文件相同的方法。它以Andrew Tridgell(SAMBA项目的创始人)设计的算法为基础。Andrew Tridgell的算法允许只传输对文件的改动。
rsync一般被看成是一个标准的系统工具,因此你的系统上很可能已经安装了rsync。如果它还没有安装,那么你的Linux安装盘上应该有它的包文件,或者你也可以从http://rsync.samba.org下载最新的源代码。在命令行直接输入rsync将提示用法说明,你可以用这种方法测试rsync是否已经安装。
要保持文件同步,所有机器(在本例中,这是指你的便携计算机和台式机)都必须安装rsync。另外,这两台机器应该能够通过网络互相看到对方。
我强烈建议用ssh作为两台机器之间的通信机制。但还有其他几种配置rsync传输器的方法,包括rsh和rsync daemon模式,rsync文档对此有详细说明。请参见本文有关ssh的说明了解更多信息。
rsync命令的语法和cp命令很相似。从本质上看,你是在把文件从一个位置复制到另一个位置,但rsync多了几个cp命令没有的选项。和通常的文件复制相比,文件同步最大的不同之处是你必须指定一台非本地的机器(比如你的台式机)。
你应该仔细考虑哪些文件要在机器之间保持同步。最好把这些文件放到便携计算机的某个专用目录,避免同步那些不需要同步的文件。例如,你的主目录下可能有数百兆浏览器缓冲数据。通常情况下,你不会想要传输这些数据。
我在自己的台式机器上创建了一个/home/drew/data目录,用这个目录来保存所有数据文件;为了简便起见,我在便携机上也创建了同样的目录。
为了用rsync把文件从台式机同步到便携机,我在便携机上输入下面的命令:
# rsync -vazu -e ssh --delete drew@desktopname:/home/drew/data/ /home/drew/data/
这个命令告诉rsync利用ssh把台式机上的/home/drew/data目录复制到便携机的同一目录。为了让这个命令能够顺利执行,我必须能够在不依赖rsync的情况下用ssh进入drew@desktopname。如果你不能,请检查并确保ssh已经正确安装且可以运行。
下面是对上述命令的分析:-v选项告诉rsync输出详细提示信息;-a选项要求rsync以“archive”模式操作,此时rsync将复制目录、符号连接等;-z选项用于传输时压缩数据;-u选项表示“只进行更新”,防止rsync覆盖便携机上比台式机新的文件。要让这个选项能够正确发挥作用,两台机器的系统时钟必须同步。
我用-e ssh选项强制rsync用ssh作为传输机制。默认情况下,rsync将使用rsh。--delete选项有点危险,它告诉rsync删除便携机上所有在台式机上不存在的文件。刚开始使用rsync命令时,我建议你不要加上这个选项,直到你熟悉了rsync命令的语法以及该选项的后果。
要把文件从便携机同步到台式机时,我在台式机上执行一个相似的命令:
# rsync -vazu -e ssh /home/drew/data/ drew@desktop
name:/home/drew/data/
注意这次我省略了--delete选项,这是因为对于台式机,我宁愿不使用自动删除功能。你可能想要加上这个选项,但应该小心。
rsync命令还有其他许多选项,你可以通过man文档查看这些选项,或者访问http://rsync.samba.org。
4.我想要保证几台机器的系统时钟同步,有什么简便方法吗?
解答:ntpdate程序正是为这个目的设计,而且它很简单易用。它使用一种协议查询一个或多个时间服务器,然后为你的机器设置正确的系统时间。
首先你应该确定使用哪一个时间服务器。虽然你可以设置自己的某一台机器作为时间服务器,然后用这台机器同步其他机器的时钟,但我不推荐这么做。这种做法要求你自己完成额外的管理工作,而且你必须保证时间服务器的时钟精确。
我更喜欢以那些正式的时间服务器为参考,然后同步所有自己的机器。你可以从http://tycho.usno.navy.mil/ntp.html找到这些时间服务器的一个清单。
ntpdate命令的语法很简单,但必须用root身份运行它。你可以在命令行中指定一个或者多个时间服务器,下面我要使用的是USNO清单中的前面三个。这样,ntpdate将能够选择一个最好的时间服务器进行同步。
# ntpdate ntp2.usno.navy.mil tock.usno.navy.mil tick.usno.navy.mil
14 Nov 17:19:04 ntpda