(完整word版)操作系统对多核处理器的支持方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随着多核处理器的发展,对软件开发有非常大的影响,而且核心的瓶颈在软件上。软件开发在多核环境下的核心是多线程开发。这个多线程不仅代表了软件实现上多线程,要求在硬件上也采用多线程技术。可以说多核提供了可以大幅提升性能的机制,多核软件就是可以真正利用这一特点的策略。只有与多核硬件相适应的软件,才能真正地发挥多核的性能。多核对软件的要求包括对多核操作系统的要求和对应用软件的要求。
多核操作系统的关注点在于进程的分配和调度。进程的分配将进程分配到合理的物理核上,因为不同的核在共享性和历史运行情况都是不同的。有的物理核能够共享二级cache,而有的却是独立的。如果将有数据共享的进程分配给有共享二级cache的核上,将大大提升性能;反之,就有可能影响性能。进程调度会涉及到比较广泛的问题,比如负载均衡、实时性等。
面向多核体系结构的操作系统调度目前多核软件的一个热点,其中研究的热点主要有下面几方面:程序的并行研究;多进程的时间相关性研究;任务的分配与调度;缓存的错误共享;一致性访问研究;进程间通信;多处理器核内部资源竞争等等。这些探讨相互独立又相互依赖。考虑一个系统的性能时必须将其中的几点同时加以考虑,有时候对一些点的优化会造成另一些点的性能下降,需要用程序进行性能优化评测,所以合适的多核系统软件方案正在形成过程中。
任务的分配是多核时代提出的新概念。在单核时代,没有核的任务分配的问题,一共只有一个核的资源可被使用。而在多核体系下,有多个核可以被使用。如果系统中有几个进程需要分配,是将他们均匀地分配到各个处理器核,还是一起分配到一个处理器核,或是按照一定的算法进行分配。并且这个分配还受底层系统结构的影响,系统是SMP构架还是CMP构架,在CMP构架中会共享二级缓存的核的数量,这是影响分配算法的因子。任务分配结束后,需要考虑任务调度。对于不同的核,每个处理器核可以有自己独立的调度算法来执行不同的任务(实时任务或者交互性任务),也可以使用一致的调度算法。此外,还可以考虑一个进程上一个时间运行在一个核上,下一个时间片是选择继续运行在这个核上,还是进行线程迁移;怎样直接调度实时任务和普通任务;系统的核资源是否要进行负载均衡等等。任务调度是目前研究的热点之一。
在单核处理器中,常见的调度策略有先到先服务(FCFS),最短作业调度(SJF),优先级调度(Priority-scheduling algorithm),轮转法调度(round-robin RR),多级队列调度(multilevel queue-schedule algorithm)等。例如在Linux操作系统中对实时任务采取FCFS和RR两种调度,普通任务调度采取优先级调度。
对于多核处理器系统的调度,目前还没有明确的标准与规范。由于系统有多个处理器核可用,必须进行负载分配,有可能为每个处理器核提供单独的队列。在这种情况下,一个具有空队列的处理器就会空闲,而另一个处理器会很忙。所以如何处理好负载均衡问题是这种调度策略的关键问题所在。为了解决这种情况,可以考虑共同就绪队列,所有处理器公用一个就绪队列。但是这无疑对进程上下文切换、锁的转换增加了执行时间,降低了性能。另外一种想法就是选择一个处理器来为其他处理器调度,因而创建了主从结构。有的系统将主从结构作进一步扩
展,采用单一处理器来处理所有调度的调度策略、I/O处理和其他系统活动只有一个处理器处理访问系统数据,减轻了数据共享需要,然而它的执行效率并不高,I/O的执行和处理系统事务的主处理器成为瓶颈。
目前为止,世界上还没有对CMP体系结构多核操作系统一个成熟的调度算法的实现。虽然Windows与Linux操作系统可以作为CMP多核体系结构的操作系统,但是它们对多核的支持并不是直接对CMP多核体系结构的支持,实际上都是针对SMP体系的支持。
Linux操作系统是开源操作系统中的主流,在2.6内核发布之前,CMP体系结构并不是市场中体系结构的主体,但是Linux2.6内核的调度策略对SMP支持得很好。Linux SMP的调度算法已经较为全面,很大程度上解决了资源利用不充分、调度时间长、解内核锁、加内核锁而引起的过多资源消耗等问题,可作为多核调度的借鉴。
2.6内核的调度算法的时间复杂度为O(1),只需要常数时间就能够完成任务的调度。具体实现的原理简要而言是这样的:
(1)系统为每个处理器都维持一个单独的就绪队列,就绪队列包括活动的就绪队列和扩展的就绪队列。活动的就绪队列包含当前时间片还有剩余的就绪任务。而扩展的就绪队列包含的是那些时间片已经用完的,重新分配时间片的就绪任务。
(2)任务的调度是基于优先级调度的。每个处理器上的任务共有140个优先级(图1-7),而每个就绪任务的优先级通过散列函数直接映射到处理器的位图这个数据结构上,通过位图的find-first-bit可以找到优先级最高的任务执行。
图1-7 Linux2.6内核的就绪
(3)当活动就绪队列中的任务全部时间片结束或者等待IO挂起,只要进行简单的指针操作,就可以相互转换活动就绪队列和扩展就绪队列。
(4)负载均衡的实现的方式有两种:当一个处理器上的任务全部结束之后,每1ms,它会使用系统调用到最忙处理器上获得任意一个任务执行;而在全部处理器都有任务在执行时,则由时钟每200ms唤起系统调用去检查,若发现在Linux 标准下不均衡,则会发生处理器之间的就绪任务迁移。
但是Linux没有考虑让一个应用程序的任务尽量在同一个处理器核上执行,尽量降低cache的缺失率;当负载不均衡发生时,并未作出迁移任务的具体决策;在调度之前并未采取合适的任务分配决策等等。
下面是几个具有代表性的多核调度算法:
(1)对任务的分配进行优化。使同一应用程序的任务尽量在一个核上执行,以便达到有共享数据的任务能够尽量在一个核上进行,而共享数据量少或者没有的任务尽量在不同核上进行。这样,可以显著得降低cache的缺失率,进而很大程度上提升了系统的整体性能。
(2)对任务的共享数据优化。由于CMP体系结构共享二级缓存,可以考虑改变任务在内存中的数据分布,使任务在执行时尽量增加二级缓存的命中率。
(3)对任务的负载均衡优化。当任务在调度时,出现了负载不均衡,考虑将较忙处理器中与其他任务最不相关的任务迁移,以达到数据的冲突量小。
1.4.2 输入输出系统
高级编程中断控制器(APIC)是基于中断控制器分散在两个基础功能单元——本地单元和I/O单元的分布式体系结构。本地和I/O单元能够通过一个叫中断控制通信(Interrupt Controller Communication即ICC)的总线互相之间通信。在多核系统中,多个本地和I/O APIC单元能够作为一个整体通过ICC总线互相操作。APIC单元主要用于从中断源传送中断到中断目标。
APIC具有如下功能:
1.减缓与中断相关的内存总线传输压力,从而似的内存总线可用程度更高。
2.帮助核之间更好的处理来自别的核的中断。
APIC发挥如下基本功能:
1.APIC接收来自处理器中断引脚的来自内部或外部I/O APIC的中断。然后将这些中断发送过处理器核处理。
2.在多核处理器系统中,APIC还能够接受发送核内中断(Interprocessor interrupt 即IPI)消息。APIC能将IPI消息发送或接收系统总线上其他的处理器核的IPI 消息。IPI消息能够用来在系统时或者系统执行的广泛功能单元中分发中断到不同的处理器核。IPI消息可以用来启动处理器核或者分配工作任务到不同的处理器核。
多核体系处理器中,必须将中断处理分发给一组核处理。当系统中有多个核在并行执行时,必须有一个能够接收中断并将接收到的中断分发给能够提供服务的核的机制。
多核处理中断如同在其他的MP系统一样。外部中断通过I/O APIC接收,并被作为中断信息分配给特定的核。处理器核也能够通过写本地APIC的ICR寄存器来发送IPI(Interprocessor Interrupt)给其他的核。高级编程中断控制器(APIC)最早由IA-32奔腾体系处理器引进。APIC也被引入P6系列,奔腾4,Intel Xeon