前两天一直在思考一个问题,在PCI-Express总线引入Linux之后,Linux的中断处理部分会有什么变化呢?要回答这个问题首先需要分析一下Linux系统是如何调用中断服务程序的。其实,正因为Linux对中断处理部分良好的封装性,使得PCI总线向PCI-Express过渡时没有触及到框架性的变化。
其实, 几年前第一次分析Linux中断处理函数的时候就觉得非常奇怪,Linux将所有的中断处理都需要通过一个do_IRQ的函数完成。也就是说,Linux没有充分利用不同处理器体系架构在中断处理方面的不同,没有充分利用中断向量表的作用。在X86处理器上,我们都知道不同的中断号对应不同的中断向量,当一个中断发生的时候,处理器会直接跳转到对应中断向量表的位置,然后执行中断向量表处的对应函数。显然Linux没有充分利用中断向量表,一旦进入中断之后,不管是什么中断,Linux会通过中断向量表执行do_IRQ这样一个公共函数。然后在这个公共函数中再通过中断号查找对应的中断服务程序。这样的处理显然增加了中断服务程序的调用延迟。Linux的中断处理函数do_IRQ调用过程示例代码如下所示:
IRQn_interrupt: pushl $n-256 jmp common_interrupt common_interrupt: SAVE_ALL call do_IRQ jmp ret_from_intr
在do_IRQ函数中,Linux会通过事先存储的中断号(push $n-256)在irq_desc[]数组中找到对应的中断服务程序集。由于很多外部设备都是共享中断的,特别是传统的PCI设备是共享中断号的,因此,Linux会依次执行这些中断服务程序集。在中断服务程序中,首先需要读取对应设备的中断状态寄存器,来判断这个中断是否是自己的,如果是自己的,那么认领这个中断,执行中断上半部的操作,否则,将这个中断执行的机会让给其他的服务程序。Linux中的irq_desc[]和irq_action是中断处理过程中的关键结构,设备驱动程序这册中断操作也就是将中断服务程序注册到这些结构中,这两个结构的关系我们可以表示如下:
通过上述分析,我觉得Linux的这种处理不是最佳处理的,优点是对于不同体系结构的处理器具有普适性。通过do_IRQ函数可以将所有处理器在中断处理机制方面的差异给屏蔽掉,但是,的确损失了中断处理的实时性。在ARM处理器中,为了提高中断处理实时性,将中断处理分为向量中断(vector interrupt)和快速中断(fast interrupt)两类。在通常的ARM编程中,我们会对应的中断服务程序注册到一个中断向量上,当这个中断被触发的时候,ARM处理器会自动加载中断服务程序地址到一个寄存器中,该寄存器的地址会被填写到中向量表中,因此,ARM会直接调用执行中断服务程序。中断服务程序只需保存寄存器现场即可。对于快速中断,ARM的处理更加直接直接,并且硬件会自动保存寄存器现场,节省了中断服务程序调用时钟周期,提高了系统的响应能力。如果采用Linux的机制,那么硬件提供的一些优势全部付之一炬,但是换回的是可移植性。对于实时系统而言,这个地方是需要修改的。
传统的PCI总线采用的是共享中断的方式,带来的问题就是中断处理实时性不够,每次发生PCI中断的时候,注册在相同中断向量上的服务程序都需要查询自己的中断状态寄存器,以此来判断该中断是否属于自己。为了解决这个问题,PCI在演进过程中提出了SMI中断的内容,PCI设备向CPU发出中断请求时,直接向总线发送SMI消息,Root Complex中的APIC在接收到这个消息之后,有两种方式将这个中断事务上报给处理器:第一种方式是在Root Complex中的APIC上定义一个寄存器,在这个寄存器中可以存储PCI设备提交的中断向量号,当APIC接收到中断事务之后,会向处理器提交中断请求(INTX),CPU进入中断服务程序之后,会查询APIC中的寄存器得到中断向量,然后调用该中断向量对应的中断服务程序;第二种方式是APIC在接收到中断事务之后,向处理器发送一个FSB中断事务,CPU接收到这个FSB的中断事务后,会进入中断状态,并且从该事务中获得中断向量号,然后直接调用对应的中断服务程序。显然,第一种方式需要额外的寄存器访问延迟,而第二种方式采用FSB的中断事务直接将中断向量号告诉处理器,这种方式的效率会更高。
对于PCI设备端,需要实现SMI中断机制,需要利用额外的中断配置空间。在设备驱动加载的时候,会给每个PCI设备分配SMI消息发送给地址,以及对应的中断向量号,驱动程序 会将这些信息写入PCI设备配置空间。在PCI设备发送中断请求的时候,直接将分配的中断向量号通过PCI写事务写入分配的地址即可。
通过上述分析,PCI-Express的SMI中断会将中断向量号提交给CPU,不管是处理器查询APIC寄存器还是通过FSB中断事务告诉给处理器,最终,在处理器进入中断之后可以得到对应设备的中断向量号,因此,可以直接调用现有的do_IRQ来执行中断服务程序。而且,PCI-Express设备没有必要共享中断向量号,因此,中断服务程序处理的效率的确高了不少。