arm linux 从入口到start_kernel 代码详细分析2

合集下载

linux源码分析（四）－start_kernel－cgroup

linux源码分析（四）－start_kernel－cgroup前置：这⾥使⽤的linux版本是4.8，x86体系。

cgroup_init_early();聊这个函数就需要先了解cgroup。

cgroup概念这个函数就是初始化cgroup所需要的参数的。

cgroup最初是在2006年由google的⼀名⼯程师提出的，⽬的是把⼀些共同⽬标的进程放在⼀个组⾥⾯，⽽这个组⾥⾯的进程能共享指定数额的资源。

⽽后就有了cgroup这个概念了。

我们把每种资源叫做⼦系统，⽐如CPU⼦系统，内存⼦系统。

为什么叫做⼦系统呢，因为它是从整个操作系统的资源衍⽣出来的。

然后我们创建⼀种虚拟的节点，叫做cgroup，然后这个虚拟节点可以扩展，以树形的结构，有root节点，和⼦节点。

这个⽗节点和各个⼦节点就形成了层级（hierarchiy）。

每个层级都可以附带继承⼀个或者多个⼦系统，就意味着，我们把资源按照分割到多个层级系统中，层级系统中的每个节点对这个资源的占⽐各有不同。

下⾯我们想法⼦把进程分组，进程分组的逻辑叫做css_set。

这⾥的css是cgroup_subsys_state的缩写。

所以css_set和进程的关系是⼀对多的关系。

另外，在cgroup眼中，进程请不要叫做进程，叫做task。

这个可能是为了和内核中进程的名词区分开吧。

进程分组css_set，不同层级中的节点cgroup也都有了。

那么，就要把节点cgroup和层级进⾏关联，和数据库中关系表⼀样。

这个事⼀个多对多的关系。

为什么呢？⾸先，⼀个节点可以⾪属于多个css_set，这就代表这这批css_set中的进程都拥有这个cgroup所代表的资源。

其次，⼀个css_set需要多个cgroup。

因为⼀个层级的cgroup只代表⼀种或者⼏种资源，⽽⼀般进程是需要多种资源的集合体。

美团的这个图⽚描写的⾮常清晰，⼀看就了解了：task_struct⾸先先看进程的结构，⾥⾯和cgroup有关的是#ifdef CONFIG_CGROUPS// 设置这个进程属于哪个css_setstruct css_set __rcu *cgroups;// cg_list是⽤于将所有同属于⼀个css_set的task连成⼀起struct list_head cg_list;#endif我们会在代码中经常见到list_head。

arm+linux+从入口到start_kernel+代码分析

arm linux 从入口到start_kernel 代码分析本文针对arm linux, 从kernel的第一条指令开始分析,一直分析到进入start_kernel()函数. 我们当前以linux-2.6.19内核版本作为范例来分析,本文中所有的代码,前面都会加上行号以便于和源码进行对照,例:在文件init/main.c中:00478: asmlinkage void __init start_kernel(void)前面的"00478:" 表示478行,冒号后面的内容就是源码了.在分析代码的过程中,我们使用缩进来表示各个代码的调用层次.由于启动部分有一些代码是平台特定的,虽然大部分的平台所实现的功能都比较类似,但是为了更好的对code进行说明,对于平台相关的代码,我们选择at91(ARM926EJS)平台进行分析.另外,本文是以uncompressed kernel开始讲解的.对于内核解压缩部分的code,在arch/arm/boot/compressed中,一. 启动条件通常从系统上电到执行到linux kenel这部分的任务是由boot loader来完成.关于boot loader的内容,本文就不做过多介绍.这里只讨论进入到linux kernel的时候的一些限制条件,这一般是boot loader在最后跳转到kernel之前要完成的:1. CPU必须处于SVC(supervisor)模式,并且IRQ和FIQ中断都是禁止的;2. MMU(内存管理单元)必须是关闭的, 此时虚拟地址对物理地址;3. 数据cache(Data cache)必须是关闭的4. 指令cache(Instruction cache)可以是打开的,也可以是关闭的,这个没有强制要求;5. CPU 通用寄存器0 (r0)必须是0;6. CPU 通用寄存器1 (r1)必须是ARM Linux machine type (关于machine type, 我们后面会有讲解)7. CPU 通用寄存器2 (r2) 必须是kernel parameter list 的物理地址(parameter list 是由boot loader传递给kernel,用来描述设备信息属性的列表,详细内容可参考"Booting ARM Linux"文档).二. starting kernel首先，我们先对几个重要的宏进行说明(我们针对有MMU的情况)：宏位置默认值说明KERNEL_RAM_ADDR arch/arm/kernel/head.S +26 0xc0008000 kernel 在RAM中的的虚拟地址PAGE_OFFSET include/asm-arm/memeory.h +50 0xc0000000 内核空间的起始虚拟地址TEXT_OFFSET arch/arm/Makefile +137 0x00008000 内核相对于存储空间的偏移TEXTADDR arch/arm/kernel/head.S +49 0xc0008000 kernel的起始虚拟地址PHYS_OFFSET include/asm-arm/arch-xxx/memory.h 平台相关 RAM的起始物理地址内核的入口是stext,这是在arch/arm/kernel/vmlinux.lds.S中定义的:00011: ENTRY(stext)对于vmlinux.lds.S,这是ld script文件,此文件的格式和汇编及C程序都不同,本文不对ld script作过多的介绍,只对内核中用到的内容进行讲解,关于ld的详细内容可以参考这里的ENTRY(stext) 表示程序的入口是在符号stext.而符号stext是在arch/arm/kernel/head.S中定义的:下面我们将arm linux boot的主要代码列出来进行一个概括的介绍,然后,我们会逐个的进行详细的讲解.在arch/arm/kernel/head.S中72 - 94 行,是arm linux boot的主代码:00072: ENTRY(stext)00073: msr cpsr_c, #PSR_F_BIT | PSR_I_BIT | SVC_MODE @ ensure svc mode00074: @ and irqs disabled00075: mrc p15, 0, r9, c0, c0 @ get processor id 00076: bl __lookup_processor_type @ r5=procinfor9=cpuid00077: movs r10, r5 @ invalid processor (r5=0)?00078: beq __error_p @ yes, error 'p'00079: bl __lookup_machine_type @r5=machinfo00080: movs r8, r5 @ invalid machine(r5=0)?00081: beq __error_a @ yes, error 'a'00082: bl __create_page_tables00083:00084: /*00085: * The following calls CPU specific code in a position independent 00086: * manner. See arch/arm/mm/proc-*.S for details. r10 = base of 00087: * xxx_proc_info structure selected by __lookup_machine_type 00088: * above. On return, the CPU will be ready for the MMU to be 00089: * turned on, and r0 will hold the CPU control register value. 00090: */00091: ldr r13, __switch_data @ address to jump toafter00092: @ mmu has been enabled 00093: adr lr, __enable_mmu @ return (PIC)address00094: add pc, r10, #PROCINFO_INITFUNC其中,73行是确保kernel运行在SVC模式下,并且IRQ和FIRQ中断已经关闭,这样做是很谨慎的.arm linux boot的主线可以概括为以下几个步骤:1. 确定processor type (75 - 78行)2. 确定machine type (79 - 81行)3. 创建页表 (82行)4. 调用平台特定的__cpu_flush函数 (在struct proc_info_list中) (94 行)5. 开启mmu (93行)6. 切换数据 (91行)最终跳转到start_kernel (在__switch_data的结束的时候,调用了b start_kernel)下面,我们按照这个主线,逐步的分析Code.1. 确定processor typearch/arm/kernel/head.S中:00075: mrc p15, 0, r9, c0, c0 @ get processor id 00076: bl __lookup_processor_type @ r5=procinfo r9=cpuid00077: movs r10, r5 @ invalid processor (r5=0)?00078: beq __error_p @ yes, error 'p'75行: 通过cp15协处理器的c0寄存器来获得processor id的指令. 关于cp15的详细内容可参考相关的arm手册76行: 跳转到__lookup_processor_type.在__lookup_processor_type中,会把processor type 存储在r5中77,78行: 判断r5中的processor type是否是0,如果是0,说明是无效的processor type,跳转到__error_p(出错)__lookup_processor_type 函数主要是根据从cpu中获得的processor id和系统中的proc_info进行匹配,将匹配到的proc_info_list的基地址存到r5中, 0表示没有找到对应的processor type.下面我们分析__lookup_processor_type函数arch/arm/kernel/head-common.S中:00145: .type __lookup_processor_type, %function00146: __lookup_processor_type:00147: adr r3, 3f00148: ldmda r3, {r5 - r7}00149: sub r3, r3, r7 @ get offset between virt&phys00150: add r5, r5, r3 @ convert virt addresses to 00151: add r6, r6, r3 @ physical address space 00152: 1: ldmia r5, {r3, r4} @ value, mask 00153: and r4, r4, r9 @ mask wanted bits 00154: teq r3, r400155: beq 2f00156: add r5, r5, #PROC_INFO_SZ @ sizeof(proc_info_list)00157: cmp r5, r600158: blo 1b00159: mov r5, #0 @ unknown processor 00160: 2: mov pc, lr00161:00162: /*00163: * This provides a C-API version of the above function.00164: */00165: ENTRY(lookup_processor_type)00166: stmfd sp!, {r4 - r7, r9, lr}00167: mov r9, r000168: bl __lookup_processor_type00169: mov r0, r500170: ldmfd sp!, {r4 - r7, r9, pc}00171:00172: /*00173: * Look in include/asm-arm/procinfo.h and arch/arm/kernel/arch.[ch] for 00174: * more information about the __proc_info and __arch_info structures. 00175: */00176: .long __proc_info_begin00177: .long __proc_info_end00178: 3: .long .00179: .long __arch_info_begin00180: .long __arch_info_end145, 146行是函数定义147行: 取地址指令,这里的3f是向前symbol名称是3的位置,即第178行,将该地址存入r3.这里需要注意的是,adr指令取址,获得的是基于pc的一个地址,要格外注意,这个地址是3f处的"运行时地址",由于此时MMU还没有打开,也可以理解成物理地址(实地址).(详细内容可参考arm指令手册)148行: 因为r3中的地址是178行的位置的地址,因而执行完后:r5存的是176行符号__proc_info_begin的地址;r6存的是177行符号__proc_info_end的地址;r7存的是3f处的地址.这里需要注意链接地址和运行时地址的区别. r3存储的是运行时地址(物理地址),而r7中存储的是链接地址(虚拟地址).__proc_info_begin和__proc_info_end是在arch/arm/kernel/vmlinux.lds.S中:00031: __proc_info_begin = .;00032: *(.init)00033: __proc_info_end = .;这里是声明了两个变量:__proc_info_begin 和__proc_info_end,其中等号后面的"."是location counter(详细内容请参考)这三行的意思是: __proc_info_begin 的位置上,放置所有文件中的".init" 段的内容,然后紧接着是__proc_info_end 的位置.kernel 使用struct proc_info_list来描述processor type.在include/asm-arm/procinfo.h 中:00029: struct proc_info_list {00030: unsigned int cpu_val;00031: unsigned int cpu_mask;00032: unsigned long __cpu_mm_mmu_flags; /* used by head.S */00033: unsigned long __cpu_io_mmu_flags; /* used by head.S */00034: unsigned long __cpu_flush; /* used by head.S */00035: const char *arch_name;00036: const char *elf_name;00037: unsigned int elf_hwcap;00038: const char *cpu_name;00039: struct processor *proc;00040: struct cpu_tlb_fns *tlb;00041: struct cpu_user_fns *user;00042: struct cpu_cache_fns *cache;00043: };我们当前以at91为例,其processor是926的.在arch/arm/mm/proc-arm926.S 中:00464: .section ".init", #alloc, #execinstr00465:00466: .type __arm926_proc_info,#object00467: __arm926_proc_info:00468: .long 0x41069260 @ ARM926EJ-S (v5TEJ)00469: .long 0xff0ffff000470: .long PMD_TYPE_SECT | \00471: PMD_SECT_BUFFERABLE | \00472: PMD_SECT_CACHEABLE | \00473: PMD_BIT4 | \00474: PMD_SECT_AP_WRITE | \00475: PMD_SECT_AP_READ00476: .long PMD_TYPE_SECT | \00477: PMD_BIT4 | \00478: PMD_SECT_AP_WRITE | \00479: PMD_SECT_AP_READ00480: b __arm926_setup00481: .long cpu_arch_name00482: .long cpu_elf_name00483: .long HWCAP_SWP|HWCAP_HALF|HWCAP_THUMB|HW CAP_FAST_MULT|HWCAP_VFP|HWCAP_EDSP|HWCAP_JAVA00484: .long cpu_arm926_name00485: .long arm926_processor_functions00486: .long v4wbi_tlb_fns00487: .long v4wb_user_fns00488: .long arm926_cache_fns00489: .size __arm926_proc_info, . - __arm926_proc_info从464行,我们可以看到__arm926_proc_info 被放到了".init"段中.对照struct proc_info_list,我们可以看到__cpu_flush的定义是在480行,即__arm926_setup.(我们将在"4. 调用平台特定的__cpu_flush函数"一节中详细分析这部分的内容.)从以上的内容我们可以看出: r5中的__proc_info_begin是proc_info_list的起始地址, r6中的__proc_info_end是proc_info_list的结束地址.149行: 从上面的分析我们可以知道r3中存储的是3f处的物理地址,而r7存储的是3f处的虚拟地址,这一行是计算当前程序运行的物理地址和虚拟地址的差值,将其保存到r3中.150行: 将r5存储的虚拟地址(__proc_info_begin)转换成物理地址151行: 将r6存储的虚拟地址(__proc_info_end)转换成物理地址152行: 对照struct proc_info_list,可以得知,这句是将当前proc_info的cpu_val和cpu_mask分别存r3, r4中153行: r9中存储了processor id(arch/arm/kernel/head.S中的75行),与r4的cpu_mask进行逻辑与操作,得到我们需要的值154行: 将153行中得到的值与r3中的cpu_val进行比较155行: 如果相等,说明我们找到了对应的processor type,跳到160行,返回156行: (如果不相等) , 将r5指向下一个proc_info,157行: 和r6比较,检查是否到了__proc_info_end.158行: 如果没有到__proc_info_end,表明还有proc_info配置,返回152行继续查找159行: 执行到这里,说明所有的proc_info都匹配过了,但是没有找到匹配的,将r5设置成0(unknown processor)2. 确定machine typearch/arm/kernel/head.S中:00079: bl __lookup_machine_type @r5=machinfo00080: movs r8, r5 @ invalid machine(r5=0)?00081: beq __error_a @ yes, error 'a'79行: 跳转到__lookup_machine_type函数,在__lookup_machine_type中,会把struct machine_desc的基地址(machine type)存储在r5中80,81行: 将r5中的machine_desc的基地址存储到r8中,并判断r5是否是0,如果是0,说明是无效的machine type,跳转到__error_a(出错)__lookup_machine_type 函数下面我们分析__lookup_machine_type 函数:arch/arm/kernel/head-common.S中:00176: .long __proc_info_begin00177: .long __proc_info_end00178: 3: .long .00179: .long __arch_info_begin00180: .long __arch_info_end00181:00182: /*00183: * Lookup machine architecture in the linker-build list of architectures. 00184: * Note that we can't use the absolute addresses for the __arch_info00185: * lists since we aren't running with the MMU on (and therefore, we are 00186: * not in the correct address space). We have to calculate the offset. 00187: *00188: * r1 = machine architecture number00189: * Returns:00190: * r3, r4, r6 corrupted00191: * r5 = mach_info pointer in physical address space00192: */00193: .type __lookup_machine_type, %function00194: __lookup_machine_type:00195: adr r3, 3b00196: ldmia r3, {r4, r5, r6}00197: sub r3, r3, r4 @ get offset betweenvirt&phys00198: add r5, r5, r3 @ convert virt addresses to 00199: add r6, r6, r3 @ physical address space 00200: 1: ldr r3, [r5, #MACHINFO_TYPE] @ get machine type 00201: teq r3, r1 @ matches loader number?00202: beq 2f @ found00203: add r5, r5, #SIZEOF_MACHINE_DESC @ next machine_desc00204: cmp r5, r600205: blo 1b00206: mov r5, #0 @ unknown machine 00207: 2: mov pc, lr193, 194行: 函数声明195行: 取地址指令,这里的3b是向后symbol名称是3的位置,即第178行,将该地址存入r3.和上面我们对__lookup_processor_type 函数的分析相同,r3中存放的是3b处物理地址.196行: r3是3b处的地址,因而执行完后:r4存的是3b处的地址r5存的是__arch_info_begin 的地址r6存的是__arch_info_end 的地址__arch_info_begin 和__arch_info_end是在arch/arm/kernel/vmlinux.lds.S 中:00034: __arch_info_begin = .;00035: *(.init)00036: __arch_info_end = .;这里是声明了两个变量:__arch_info_begin 和__arch_info_end,其中等号后面的"."是location counter(详细内容请参考)这三行的意思是: __arch_info_begin 的位置上,放置所有文件中的".init" 段的内容,然后紧接着是__arch_info_end 的位置.kernel 使用struct machine_desc 来描述machine type.在include/asm-arm/mach/arch.h 中:00017: struct machine_desc {00018: /*00019: * Note! The first four elements are used00020: * by assembler code in head-armv.S00021: */00022: unsigned int nr; /* architecture number */00023: unsigned int phys_io; /* start of physical io */00024: unsigned int io_pg_offst; /* byte offset for io00025: * page tabe entry */ 00026:00027: const char *name; /* architecture name */00028: unsigned long boot_params; /* tagged list */00029:00030: unsigned int video_start; /* start of video RAM */00031: unsigned int video_end; /* end of video RAM */00032:00033: unsigned int reserve_lp0 :1; /* never has lp0 */00034: unsigned int reserve_lp1 :1; /* never has lp1 */00035: unsigned int reserve_lp2 :1; /* never has lp2 */00036: unsigned int soft_reboot :1; /* soft reboot */00037: void (*fixup)(struct machine_desc *,00038: struct tag *, char **,00039: struct meminfo *);00040: void (*map_io)(void);/* IO mapping function */00041: void (*init_irq)(void);00042: struct sys_timer *timer; /* system tick timer */00043: void (*init_machine)(void);00044: };00045:00046: /*00047: * Set of macros to define architecture features. This is built into 00048: * a table by the linker.00049: */00050: #define MACHINE_START(_type,_name) \00051: static const struct machine_desc __mach_desc_##_type \ 00052: __attribute_used__ \00053: __attribute__((__section__(".init")) = { \00054: .nr = MACH_TYPE_##_type, \00055: .name = _name,00056:00057: #define MACHINE_END \00058: };内核中,一般使用宏MACHINE_START来定义machine type.对于at91, 在arch/arm/mach-at91rm9200/board-ek.c 中:00137: MACHINE_START(AT91RM9200EK, "Atmel AT91RM9200-EK"00138: /* Maintainer: SAN People/Atmel */00139: .phys_io = AT91_BASE_SYS,00140: .io_pg_offst = (AT91_VA_BASE_SYS >> 1& 0xfffc, 00141: .boot_params = AT91_SDRAM_BASE + 0x100,00142: .timer = &at91rm9200_timer,00143: .map_io = ek_map_io,00144: .init_irq = ek_init_irq,00145: .init_machine = ek_board_init,00146: MACHINE_END197行: r3中存储的是3b处的物理地址,而r4中存储的是3b处的虚拟地址,这里计算处物理地址和虚拟地址的差值,保存到r3中198行: 将r5存储的虚拟地址(__arch_info_begin)转换成物理地址199行: 将r6存储的虚拟地址(__arch_info_end)转换成物理地址200行: MACHINFO_TYPE 在arch/arm/kernel/asm-offset.c 101行定义, 这里是取struct machine_desc中的nr(architecture number) 到r3中201行: 将r3中取到的machine type 和r1中的machine type(见前面的"启动条件"进行比较202行: 如果相同,说明找到了对应的machine type,跳转到207行的2f处,此时r5中存储了对应的struct machine_desc的基地址203行: (不相同), 取下一个machine_desc的地址204行: 和r6进行比较,检查是否到了__arch_info_end.205行: 如果不相同,说明还有machine_desc,返回200行继续查找.206行: 执行到这里,说明所有的machind_desc都查找完了,并且没有找到匹配的, 将r5设置成0(unknown machine).207行: 返回3. 创建页表通过前面的两步,我们已经确定了processor type 和machine type.此时,一些特定寄存器的值如下所示:r8 = machine info (struct machine_desc的基地址)r9 = cpu id (通过cp15协处理器获得的cpu id)r10 = procinfo (struct proc_info_list的基地址)创建页表是通过函数__create_page_tables 来实现的.这里,我们使用的是arm的L1主页表,L1主页表也称为段页表(section page table)L1 主页表将4 GB 的地址空间分成若干个1 MB的段(section),因此L1页表包含4096个页表项(section entry). 每个页表项是32 bits(4 bytes)因而L1主页表占用4096 *4 = 16k的内存空间.对于ARM926,其L1 section entry的格式为可参考arm926EJS TRM):下面我们来分析__create_page_tables 函数:在arch/arm/kernel/head.S 中:00206: .type __create_page_tables, %function00207: __create_page_tables:00208: pgtbl r4 @ page table address 00209:00210: /*00211: * Clear the 16K level 1 swapper page table00212: */00213: mov r0, r400214: mov r3, #000215: add r6, r0, #0x400000216: 1: str r3, [r0], #400217: str r3, [r0], #400218: str r3, [r0], #400219: str r3, [r0], #400220: teq r0, r600221: bne 1b00222:00223: ldr r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags 00224:00225: /*00226: * Create identity mapping for first MB of kernel to00227: * cater for the MMU enable. This identity mapping00228: * will be removed by paging_init(). We use our current program 00229: * counter to determine corresponding section base address. 00230: */00231: mov r6, pc, lsr #20 @ start of kernel section00232: orr r3, r7, r6, lsl #20 @ flags + kernel base 00233: str r3, [r4, r6, lsl #2] @ identity mapping 00234:00235: /*00236: * Now setup the pagetables for our kernel direct00237: * mapped region.00238: */00239: add r0, r4, #(TEXTADDR & 0xff000000) >> 18 @ start of kernel00240: str r3, [r0, #(TEXTADDR & 0x00f00000) >> 18]!00241:00242: ldr r6, =(_end - PAGE_OFFSET - 1) @ r6 = number of sections00243: mov r6, r6, lsr #20 @ needed for kernel minus 100244:00245: 1: add r3, r3, #1 << 2000246: str r3, [r0, #4]!00247: subs r6, r6, #100248: bgt 1b00249:00250: /*00251: * Then map first 1MB of ram in case it contains our boot params. 00252: */00253: add r0, r4, #PAGE_OFFSET >> 1800254: orr r6, r7, #PHYS_OFFSET00255: str r6, [r0]...00314: mov pc, lr00315: .ltorg206, 207行: 函数声明208行: 通过宏pgtbl 将r4设置成页表的基地址(物理地址)宏pgtbl 在arch/arm/kernel/head.S 中:00042: .macro pgtbl, rd00043: ldr \rd, =(__virt_to_phys(KERNEL_RAM_ADDR - 0x4000))00044: .endm可以看到,页表是位于KERNEL_RAM_ADDR 下面16k 的位置宏__virt_to_phys 是在incude/asm-arm/memory.h 中:00125: #ifndef __virt_to_phys00126: #define __virt_to_phys(x) ((x) - PAGE_OFFSET + PHYS_OFFSET)00127: #define __phys_to_virt(x) ((x) - PHYS_OFFSET + PAGE_OFFSET)00128: #endif下面从213行- 221行, 是将这16k 的页表清0.213行: r0 = r4, 将页表基地址存在r0中214行: 将r3 置成0215行: r6 = 页表基地址+ 16k, 可以看到这是页表的尾地址216 - 221 行: 循环,从r0 到r6 将这16k页表用0填充.223行: 获得proc_info_list的__cpu_mm_mmu_flags的值,并存储到r7中. (宏PROCINFO_MM_MMUFLAGS是在arch/arm/kernel/asm-offset.c中定义)231行: 通过pc值的高12位(右移20位),得到kernel的section,并存储到r6中.因为当前是通过运行时地址得到的kernel的section,因而是物理地址.232行: r3 = r7 | (r6 << 20); flags + kernel base,得到页表中需要设置的值.233行: 设置页表: mem[r4 + r6 * 4] = r3这里,因为页表的每一项是32 bits(4 bytes),所以要乘以4(<<2).上面这三行,设置了kernel的第一个section(物理地址所在的page entry)的页表项239, 240行: TEXTADDR是内核的起始虚拟地址(0xc0008000), 这两行是设置kernel起始虚拟地址的页表项(注意,这里设置的页表项和上面的231 - 233行设置的页表项是不同的) 执行完后,r0指向kernel的第2个section的虚拟地址所在的页表项./* TODO: 这两行的code很奇怪,为什么要先取TEXTADDR的高8位(Bit[31:24])0xff000000,然后再取后面的8位(Bit[23:20])0x00f00000*/242行: 这一行计算kernel镜像的大小(bytes)._end 是在vmlinux.lds.S中162行定义的,标记kernel的结束位置(虚拟地址):00158 .bss : {00159 __bss_start = .; /* BSS */00160 *(.bss)00161 *(COMMON)00162 _end = .;00163 }kernel的size = _end - PAGE_OFFSET -1, 这里减1的原因是因为_end 是location counter,它的地址是kernel镜像后面的一个byte的地址.243行: 地址右移20位,计算出kernel有多少sections,并将结果存到r6中245 - 248行: 这几行用来填充kernel所有section虚拟地址对应的页表项.253行: 将r0设置为RAM第一兆虚拟地址的页表项地址(page entry)254行: r7中存储的是mmu flags, 逻辑或上RAM的起始物理地址,得到RAM第一个MB页表项的值.255行:设置RAM的第一个MB虚拟地址的页表.上面这三行是用来设置RAM中第一兆虚拟地址的页表. 之所以要设置这个页表项的原因是RAM的第一兆内存中可能存储着boot params.这样,kernel所需要的基本的页表我们都设置完了, 如下图所示:4. 调用平台特定的__cpu_flush 函数当__create_page_tables 返回之后此时,一些特定寄存器的值如下所示:r4 = pgtbl (page table 的物理基地址)r8 = machine info (struct machine_desc的基地址)r9 = cpu id (通过cp15协处理器获得的cpu id)r10 = procinfo (struct proc_info_list的基地址)在我们需要在开启mmu之前,做一些必须的工作:清除ICache, 清除DCache, 清除Writebuffer, 清除TLB等.这些一般是通过cp15协处理器来实现的,并且是平台相关的. 这就是__cpu_flush 需要做的工作.在arch/arm/kernel/head.S中00091: ldr r13, __switch_data @ address to jump to after00092: @ mmu has been enabled 00093: adr lr, __enable_mmu @ return (PIC) address00094: add pc, r10, #PROCINFO_INITFUNC第91行: 将r13设置为__switch_data 的地址第92行: 将lr设置为__enable_mmu 的地址第93行: r10存储的是procinfo的基地址, PROCINFO_INITFUNC是在arch/arm/kernel/asm-offset.c 中107行定义.则该行将pc设为proc_info_list的__cpu_flush 函数的地址, 即下面跳转到该函数.在分析__lookup_processor_type 的时候,我们已经知道,对于ARM926EJS 来说,其__cpu_flush指向的是函数__arm926_setup下面我们来分析函数__arm926_setup在arch/arm/mm/proc-arm926.S 中:00391: .type __arm926_setup, #function00392: __arm926_setup:00393: mov r0, #000394: mcr p15, 0, r0, c7, c7 @ invalidate I,D caches on v400395: mcr p15, 0, r0, c7, c10, 4 @ drain write buffer on v400396: #ifdef CONFIG_MMU00397: mcr p15, 0, r0, c8, c7 @ invalidate I,D TLBs on v400398: #endif00399:00400:00401: #ifdef CONFIG_CPU_DCACHE_WRITETHROUGH00402: mov r0, #4 @ disable write-back on caches explicitly00403: mcr p15, 7, r0, c15, c0, 000404: #endif00405:00406: adr r5, arm926_crval00407: ldmia r5, {r5, r6}00408: mrc p15, 0, r0, c1, c0 @ get control register v4 00409: bic r0, r0, r500410: orr r0, r0, r600411: #ifdef CONFIG_CPU_CACHE_ROUND_ROBIN00412: orr r0, r0, #0x4000 @ .1.. .... .... .... 00413: #endif00414: mov pc, lr00415: .size __arm926_setup, . - __arm926_setup00416:00417: /*00418: * R00419: * .RVI ZFRS BLDP WCAM00420: * .011 0001 ..11 010100421: *00422: */00423: .type arm926_crval, #object00424: arm926_crval:00425: crval clear=0x00007f3f, mmuset=0x00003135, ucset=0x00001134第391, 392行: 是函数声明第393行: 将r0设置为0第394行: 清除(invalidate)Instruction Cache 和Data Cache.第395行: 清除(drain) Write Buffer.第396 - 398行: 如果有配置了MMU,则需要清除(invalidate)Instruction TLB 和Data TLB 接下来,是对控制寄存器c1进行配置,请参考ARM926 TRM.第401 - 404行: 如果配置了Data Cache使用writethrough方式, 需要关掉write-back. 第406行:取arm926_crval的地址到r5中, arm926_crval 在第424行第407行:这里我们需要看一下424和425行,其中用到了宏crval,crval是在arch/arm/mm/proc-macro.S 中:00053: .macro crval, clear, mmuset, ucset00054: #ifdef CONFIG_MMU00055: .word \clear00056: .word \mmuset00057: #else00058: .word \clear00059: .word \ucset00060: #endif00061: .endm配合425行,我们可以看出,首先在arm926_crval的地址处存放了clear的值,然后接下来的地址存放了mmuset的值(对于配置了MMU的情况)所以,在407行中,我们将clear和mmuset的值分别存到了r5, r6中第408行:获得控制寄存器c1的值第409行: 将r0中的clear (r5) 对应的位都清除掉第410行:设置r0中mmuset (r6) 对应的位第411 - 413行:如果配置了使用round robin方式,需要设置控制寄存器c1的Bit[16] 第412行: 取lr的值到pc中.而lr中的值存放的是__enable_mmu 的地址(arch/arm/kernel/head.S 93行),所以,接下来就是跳转到函数__enable_mmu5. 开启mmu开启mmu是又函数__enable_mmu 实现的.在进入__enable_mmu 的时候, r0中已经存放了控制寄存器c1的一些配置(在上一步中进行的设置), 但是并没有真正的打开mmu,在__enable_mmu 中,我们将打开mmu.此时,一些特定寄存器的值如下所示:r0 = c1 parameters (用来配置控制寄存器的参数)r4 = pgtbl (page table 的物理基地址)r8 = machine info (struct machine_desc的基地址)r9 = cpu id (通过cp15协处理器获得的cpu id)r10 = procinfo (struct proc_info_list的基地址)在arch/arm/kernel/head.S 中:00146: .type __enable_mmu, %function00147: __enable_mmu:00148: #ifdef CONFIG_ALIGNMENT_TRAP00149: orr r0, r0, #CR_A00150: #else00151: bic r0, r0, #CR_A00152: #endif00153: #ifdef CONFIG_CPU_DCACHE_DISABLE00154: bic r0, r0, #CR_C00155: #endif00156: #ifdef CONFIG_CPU_BPREDICT_DISABLE00157: bic r0, r0, #CR_Z00158: #endif00159: #ifdef CONFIG_CPU_ICACHE_DISABLE00160: bic r0, r0, #CR_I00161: #endif00162: mov r5, #(domain_val(DOMAIN_USER, DOMAIN_MANAGER) | \00163: domain_val(DOMAIN_KERNEL, DOMAIN_MANAGER) | \ 00164: domain_val(DOMAIN_TABLE, DOMAIN_MANAGER) | \ 00165: domain_val(DOMAIN_IO, DOMAIN_CLIENT))00166: mcr p15, 0, r5, c3, c0, 0 @ load domain access register00167: mcr p15, 0, r4, c2, c0, 0 @ load page table pointer00168: b __turn_mmu_on00169:00170: /*00171: * Enable the MMU. This completely changes the structure of the visible 00172: * memory space. You will not be able to trace execution through this. 00173: * If you have an enquiry about this, *please* check the linux-arm-kernel 00174: * mailing list archives BEFORE sending another post to the list.00175: *00176: * r0 = cp#15 control register00177: * r13 = *virtual* address to jump to upon completion00178: *00179: * other registers depend on the function called upon completion 00180: */00181: .align 500182: .type __turn_mmu_on, %function00183: __turn_mmu_on:00184: mov r0, r000185: mcr p15, 0, r0, c1, c0, 0 @ write control reg 00186: mrc p15, 0, r3, c0, c0, 0 @ read id reg 00187: mov r3, r300188: mov r3, r300189: mov pc, r13第146, 147行: 函数声明第148 - 161行: 根据相应的配置,设置r0中的相应的Bit. (r0 将用来配置控制寄存器c1)第162 - 165行: 设置domain 参数r5.(r5 将用来配置domain)第166行: 配置domain (详细信息清参考arm相关手册)第167行: 配置页表在存储器中的位置(set ttb).这里页表的基地址是r4, 通过写cp15的c2寄存器来设置页表基地址.第168行: 跳转到__turn_mmu_on. 从名称我们可以猜到,下面是要真正打开mmu了.(继续向下看,我们会发现,__turn_mmu_on就下当前代码的下方,为什么要跳转一下呢? 这是有原因的. go on)第169 - 180行: 空行和注释. 这里的注释我们可以看到, r0是cp15控制寄存器的内容, r13存储了完成后需要跳转的虚拟地址(因为完成后mmu已经打开了,都是虚拟地址了).第181行: .algin 5 这句是cache line对齐. 我们可以看到下面一行就是__turn_mmu_on, 之所以第182 - 183行: __turn_mmu_on 的函数声明. 这里我们可以看到, __turn_mmu_on是紧接着上面第168行的跳转指令的,只是中间在第181行多了一个cache line对齐.这么做的原因是: 下面我们要进行真正的打开mmu操作了, 我们要把打开mmu的操作放到一个单独的cache line上. 而在之前的"启动条件"一节我们说了,I Cache是可以打开也可以关闭的,这里这么做的原因是要保证在I Cache打开的时候,打开mmu的操作也能正常执行.第184行: 这是一个空操作,相当于nop. 在arm中,nop操作经常用指令mov rd, rd 来实现.注意: 为什么这里要有一个nop,我思考了很长时间,这里是我的猜测,可能不是正确的:因为之前设置了页表基地址(set ttb),到下一行(185行)打开mmu操作,中间的指令序列是这样的:set ttb(第167行)branch(第168行)nop(第184行)enable mmu(第185行)对于arm的五级流水线: fetch - decode - execute - memory - write他们执行的情况如下图所示:这里需要说明的是,branch操作会在3个cycle中完成,并且会导致重新取指.从这个图我们可以看出来,在enable mmu操作取指的时候, set ttb操作刚好完成.第185行: 写cp15的控制寄存器c1, 这里是打开mmu的操作,同时会打开cache等(根据r0相应的配置)第186行: 读取id寄存器.第187 - 188行: 两个nop.第189行: 取r13到pc中,我们前面已经看到了, r13中存储的是__switch_data (在arch/arm/kernel/head.S 91行),下面会跳到__switch_data.第187,188行的两个nop是非常重要的,因为在185行打开mmu操作之后,要等到3个cycle 之后才会生效,这和arm的流水线有关系.因而,在打开mmu操作之后的加了两个nop操作.6. 切换数据在arch/arm/kernel/head-common.S 中:00014: .type __switch_data, %object00015: __switch_data:00016: .long __mmap_switched00017: .long __data_loc @ r400018: .long __data_start @ r500019: .long __bss_start @ r600020: .long _end @ r700021: .long processor_id @ r400022: .long __machine_arch_type @ r500023: .long cr_alignment @ r600024: .long init_thread_union + THREAD_START_SP @ sp 00025:00026: /*00027: * The following fragment of code is executed with the MMU on in MMU mode,00028: * and uses absolute addresses; this is not position independent. 00029: *00030: * r0 = cp#15 control register00031: * r1 = machine ID00032: * r9 = processor ID00033: */00034: .type __mmap_switched, %function00035: __mmap_switched:00036: adr r3, __switch_data + 400037:00038: ldmia r3!, {r4, r5, r6, r7}00039: cmp r4, r5 @ Copy data segment if needed00040: 1: cmpne r5, r600041: ldrne fp, [r4], #400042: strne fp, [r5], #400043: bne 1b00044:00045: mov fp, #0 @ Clear BSS (and zero fp)00046: 1: cmp r6, r700047: strcc fp, [r6],#400048: bcc 1b00049:00050: ldmia r3, {r4, r5, r6, sp}00051: str r9, [r4] @ Save processor ID 00052: str r1, [r5] @ Save machine type 00053: bic r4, r0, #CR_A @ Clear 'A' bit 00054: stmia r6, {r0, r4} @ Save control register values00055: b start_kernel第14, 15行: 函数声明第16 - 24行: 定义了一些地址,例如第16行存储的是__mmap_switched 的地址, 第17行存储的是__data_loc 的地址 ......第34, 35行: 函数__mmap_switched第36行: 取__switch_data + 4的地址到r3. 从上文可以看到这个地址就是第17行的地址.第37行:依次取出从第17行到第20行的地址,存储到r4, r5, r6, r7 中. 并且累加r3的值.当执行完后, r3指向了第21行的位置.对照上文,我们可以得知:r4 - __data_locr5 - __data_startr6 - __bss_startr7 - _end这几个符号都是在arch/arm/kernel/vmlinux.lds.S 中定义的变量:00102: #ifdef CONFIG_XIP_KERNEL00103: __data_loc = ALIGN(4); /* location in binary */ 00104: . = PAGE_OFFSET + TEXT_OFFSET;00105: #else00106: . = ALIGN(THREAD_SIZE);00107: __data_loc = .;00108: #endif00109:00110: .data : AT(__data_loc) {00111: __data_start = .; /* address in memory */00112:00113: /*00114: * first, the init task union, aligned00115: * to an 8192 byte boundary.00116: */00117: *(.init.task)......00158: .bss : {00159: __bss_start = .; /* BSS */00160: *(.bss)00161: *(COMMON)00162: _end = .;00163: }对于这四个变量,我们简单的介绍一下:__data_loc 是数据存放的位置__data_start 是数据开始的位置__bss_start 是bss开始的位置_end 是bss结束的位置, 也是内核结束的位置其中对第110行的指令讲解一下: 这里定义了.data 段,后面的AT(__data_loc) 的意思是这部分的内容是在__data_loc中存储的(要注意,储存的位置和链接的位置是可以不相同的).关于AT 详细的信息请参考第38行: 比较__data_loc 和__data_start第39 - 43行: 这几行是判断数据存储的位置和数据的开始的位置是否相等,如果不相等,则需要搬运数据,从__data_loc 将数据搬到__data_start.其中__bss_start 是bss的开始的位置,也标志了data 结束的位置,因而用其作为判断数据是否搬运完成.第45 - 48行:是清除bss 段的内容,将其都置成0. 这里使用_end 来判断bss 的结束位置.第50行: 因为在第38行的时候,r3被更新到指向第21行的位置.因而这里取得r4, r5, r6, sp 的值分别是:r4 - processor_idr5 - __machine_arch_typer6 - cr_alignmentsp - init_thread_union + THREAD_START_SPprocessor_id 和__machine_arch_type 这两个变量是在arch/arm/kernel/setup.c 中第62, 63行中定义的.cr_alignment 是在arch/arm/kernel/entry-armv.S 中定义的:00182: .globl cr_alignment00183: .globl cr_no_alignment00184: cr_alignment:00185: .space 400186: cr_no_alignment:00187: .space 4init_thread_union 是init进程的基地址. 在arch/arm/kernel/init_task.c 中:00033: union thread_union init_thread_union00034: __attribute__((__section__(".init.task"))) =00035: { INIT_THREAD_INFO(init_task) };对照vmlnux.lds.S 中的的117行,我们可以知道init task是存放在 .data 段的开始8k, 并且是THREAD_SIZE(8k)对齐的第51行: 将r9中存放的processor id (在arch/arm/kernel/head.S 75行) 赋值给变量processor_id第52行: 将r1中存放的machine id (见"启动条件"一节)赋值给变量。

Arm_linux_启动分析

Arm linux 启动分析(1)王利明 walimi@ 宋振宇zhenyusong@ 2003-3-201．概述：在内核运行之前需要系统引导程序(Bootloader)完成加载内核和一些辅助性的工作，然后跳转到内核代码的起始地址并执行。

本文先分析了Bootloader 的初始化工作，接着从内核镜像的起始地址进行分析。

整个arm linux 内核的启动可分为三个阶段：第一阶段主要是进行cpu 和体系结构的检查、cpu 本身的初始化以及页表的建立等；第二阶段主要是对系统中的一些基础设施进行初始化；最后则是更高层次的初始化，如根设备和外部设备的初始化。

第一阶段的初始化是从内核入口（ENTRY(stext)）开始到start_kernel 前结束。

这一阶段的代码在/arch/arm/head_armv.S 中。

2．Bootloader 2.1简介本处介绍主要来自内核源代码下的Documentation/arm/Booting 文件，适合于arm linux 2.4.18-rmk6及以上版本。

Bootloader 主要作用是初始化一些必要的设备，然后调用内核，同时传递参数给内核。

主要完成如下工作：1．建立和初始化RAM 。

2．初始化一个串口。

3．4．建立内核的5．调用内核镜像。

2.2功能详细介绍 1．建立和初始化RAM 。

要求：必须功能：探测所有的RAM 位置和大小，并对RAM 进行初始化。

2．初始化一个串口。

要求：可选，建议功能：Bootloader 应该初始化并启动一个串口。

这可以让内核的串口驱动自动探测哪个串口作为内核的控制台。

另外也可以通过给内核传递“console=”参数完成此工作。

3．检测机器的系统结构。

要求：必须功能：Bootloader 应该通过某种方法探测机器类型，最后传递给内核一个MACH_TYPE_xxx 值，这些值参看4要求：必须功能：Bootloader 必须创建和初始化内核的tagged list 。

arm版本linux系统的启动流程

arm版本linux系统的启动流程ARM架构是一种常见的处理器架构，被广泛应用于嵌入式设备和移动设备中。

在ARM版本的Linux系统中，启动流程是非常重要的，它决定了系统如何从开机到正常运行。

本文将详细介绍ARM版本Linux系统的启动流程。

一、引导加载程序（Bootloader）引导加载程序是系统启动的第一阶段，它位于系统的固化存储器中，比如ROM或Flash。

在ARM版本的Linux系统中，常用的引导加载程序有U-Boot和GRUB等。

引导加载程序的主要功能是加载内核镜像到内存中，并将控制权转交给内核。

二、内核初始化引导加载程序将内核镜像加载到内存后，控制权被转交给内核。

内核初始化是系统启动的第二阶段，它主要完成以下几个步骤：1. 设置异常向量表：ARM架构中，异常是指硬件产生的中断或故障，比如系统调用、中断请求等。

内核需要设置异常向量表，以便正确处理异常。

2. 初始化处理器：内核对处理器进行初始化，包括设置页表、启用缓存、初始化中断控制器等。

3. 启动第一个进程：内核创建第一个用户进程（一般是init进程），并将控制权转交给它。

init进程是系统中所有其他进程的父进程，负责系统的初始化工作。

三、设备树（Device Tree）设备树是ARM版本Linux系统中的一种机制，用于描述硬件设备的相关信息。

在内核初始化过程中，内核会解析设备树，并建立设备树对象，以便后续的设备驱动程序使用。

设备树描述了硬件设备的类型、地址、中断等信息，以及设备之间的连接关系。

它使得内核能够在运行时自动识别和配置硬件设备，大大提高了系统的可移植性和灵活性。

四、启动初始化（Init）启动初始化是系统启动的第三阶段，它是用户空间的第一个进程（init进程）接管系统控制权后的操作。

启动初始化主要完成以下几个任务：1. 挂载根文件系统：启动初始化会挂载根文件系统，使得用户可以访问文件系统中的文件和目录。

2. 加载系统服务：启动初始化会加载并启动系统服务，比如网络服务、日志服务、时间同步服务等。

kernel启动代码分析

arm linux kernel 从入口到start_kernel 的代码分析（二）3. 创建页表通过前面的两步,我们已经确定了processor type 和machine type.此时,一些特定寄存器的值如下所示:r8 = machine info (struct machine_desc的基地址)r9 = cpu id (通过cp15协处理器获得的cpu id)r10 = procinfo (struct proc_info_list的基地址)创建页表是通过函数__create_page_tables 来实现的.这里,我们使用的是arm的L1主页表,L1主页表也称为段页表(section page table)L1 主页表将4 GB 的地址空间分成若干个1 MB的段(section),因此L1页表包含4096个页表项(section entry). 每个页表项是32 bits(4 bytes)因而L1主页表占用4096 *4 = 16k的内存空间.对于ARM926,其L1 section entry的格式为可参考arm926EJS TRM):下面我们来分析__create_page_tables 函数:在arch/arm/kernel/head.S 中:00206: .type __create_page_tables, %function00207: __create_page_tables:00208: pgtbl r4 @ page table address 00209:00210: /*00211: * Clear the 16K level 1 swapper page table00212: */00213: mov r0, r400214: mov r3, #000215: add r6, r0, #0x400000216: 1: str r3, [r0], #400217: str r3, [r0], #400218: str r3, [r0], #400219: str r3, [r0], #400220: teq r0, r600221: bne 1b00222:00223: ldr r7, [r10, #PROCINFO_MM_MMUFLAGS] @ mm_mmuflags 00224:00225: /*00226: * Create identity mapping for first MB of kernel to00227: * cater for the MMU enable. This identity mapping00228: * will be removed by paging_init(). We use our current program00229: * counter to determine corresponding section base address.00230: */00231: mov r6, pc, lsr #20 @ start of kernel section 00232: orr r3, r7, r6, lsl #20 @ flags + kernel base00233: str r3, [r4, r6, lsl #2] @ identity mapping00234:00235: /*00236: * Now setup the pagetables for our kernel direct00237: * mapped region.00238: */00239: add r0, r4, #(TEXTADDR & 0xff000000) >> 18 @ start of kernel 00240: str r3, [r0, #(TEXTADDR & 0x00f00000) >> 18]!00241:00242: ldr r6, =(_end - PAGE_OFFSET - 1) @ r6 = number of sections 00243: mov r6, r6, lsr #20 @ needed for kernel minus 1 00244:00245: 1: add r3, r3, #1 << 2000246: str r3, [r0, #4]!00247: subs r6, r6, #100248: bgt 1b00249:00250: /*00251: * Then map first 1MB of ram in case it contains our boot params.00252: */00253: add r0, r4, #PAGE_OFFSET >> 1800254: orr r6, r7, #PHYS_OFFSET00255: str r6, [r0]...00314: mov pc, lr00315: .ltorg206, 207行: 函数声明208行: 通过宏pgtbl 将r4设置成页表的基地址(物理地址)宏pgtbl 在arch/arm/kernel/head.S 中:00042: .macro pgtbl, rd00043: ldr \rd, =(__virt_to_phys(KERNEL_RAM_ADDR - 0x4000))00044: .endm可以看到,页表是位于KERNEL_RAM_ADDR 下面16k 的位置宏__virt_to_phys 是在incude/asm-arm/memory.h 中:00125: #ifndef __virt_to_phys00126: #define __virt_to_phys(x) ((x) - PAGE_OFFSET + PHYS_OFFSET) 00127: #define __phys_to_virt(x) ((x) - PHYS_OFFSET + PAGE_OFFSET) 00128: #endif下面从213行- 221行, 是将这16k 的页表清0.213行: r0 = r4, 将页表基地址存在r0中214行: 将r3 置成0215行: r6 = 页表基地址+ 16k, 可以看到这是页表的尾地址216 - 221 行: 循环,从r0 到r6 将这16k页表用0填充.223行: 获得proc_info_list的__cpu_mm_mmu_flags的值,并存储到r7中. (宏PROCINFO_MM_MMUFLAGS是在arch/arm/kernel/asm-offset.c中定义)231行: 通过pc值的高12位(右移20位),得到kernel的section,并存储到r6中.因为当前是通过运行时地址得到的kernel的section,因而是物理地址.232行: r3 = r7 | (r6 << 20); flags + kernel base,得到页表中需要设置的值.233行: 设置页表: mem[r4 + r6 * 4] = r3这里,因为页表的每一项是32 bits(4 bytes),所以要乘以4(<<2).上面这三行,设置了kernel的第一个section(物理地址所在的page entry)的页表项239, 240行: TEXTADDR是内核的起始虚拟地址(0xc0008000), 这两行是设置kernel起始虚拟地址的页表项(注意,这里设置的页表项和上面的231 - 233行设置的页表项是不同的)执行完后,r0指向kernel的第2个section的虚拟地址所在的页表项./* TODO: 这两行的code很奇怪,为什么要先取TEXTADDR的高8位(Bit[31:24])0xff000000,然后再取后面的8位(Bit[23:20])0x00f00000*/242行: 这一行计算kernel镜像的大小(bytes)._end 是在vmlinux.lds.S中162行定义的,标记kernel的结束位置(虚拟地址):00158 .bss : {00159 __bss_start = .; /* BSS */00160 *(.bss)00161 *(COMMON)00162 _end = .;00163 }kernel的size = _end - PAGE_OFFSET -1, 这里减1的原因是因为_end 是location counter,它的地址是kernel镜像后面的一个byte的地址.243行: 地址右移20位,计算出kernel有多少sections,并将结果存到r6中245 - 248行: 这几行用来填充kernel所有section虚拟地址对应的页表项.253行: 将r0设置为RAM第一兆虚拟地址的页表项地址(page entry)254行: r7中存储的是mmu flags, 逻辑或上RAM的起始物理地址,得到RAM第一个MB页表项的值. 255行:设置RAM的第一个MB虚拟地址的页表.上面这三行是用来设置RAM中第一兆虚拟地址的页表. 之所以要设置这个页表项的原因是RAM的第一兆内存中可能存储着boot params.这样,kernel所需要的基本的页表我们都设置完了, 如下图所示:4. 调用平台特定的__cpu_flush 函数当__create_page_tables 返回之后此时,一些特定寄存器的值如下所示:r4 = pgtbl (page table 的物理基地址)r8 = machine info (struct machine_desc的基地址)r9 = cpu id (通过cp15协处理器获得的cpu id)r10 = procinfo (struct proc_info_list的基地址)在我们需要在开启mmu之前,做一些必须的工作:清除ICache, 清除DCache, 清除Writebuffer, 清除TLB等.这些一般是通过cp15协处理器来实现的,并且是平台相关的. 这就是__cpu_flush 需要做的工作.在arch/arm/kernel/head.S中00091: ldr r13, __switch_data @ address to jump to after 00092: @ mmu has been enabled00093: adr lr, __enable_mmu @ return (PIC) address00094: add pc, r10, #PROCINFO_INITFUNC第91行: 将r13设置为__switch_data 的地址第92行: 将lr设置为__enable_mmu 的地址第93行: r10存储的是procinfo的基地址, PROCINFO_INITFUNC是在arch/arm/kernel/asm-offset.c 中107行定义.则该行将pc设为proc_info_list的__cpu_flush 函数的地址, 即下面跳转到该函数.在分析__lookup_processor_type 的时候,我们已经知道,对于ARM926EJS 来说,其__cpu_flush指向的是函数__arm926_setup下面我们来分析函数__arm926_setup在arch/arm/mm/proc-arm926.S 中:00391: .type __arm926_setup, #function00392: __arm926_setup:00393: mov r0, #000394: mcr p15, 0, r0, c7, c7 @ invalidate I,D caches on v4 00395: mcr p15, 0, r0, c7, c10, 4 @ drain write buffer on v4 00396: #ifdef CONFIG_MMU00397: mcr p15, 0, r0, c8, c7 @ invalidate I,D TLBs on v4 00398: #endif00399:00400:00401: #ifdef CONFIG_CPU_DCACHE_WRITETHROUGH00402: mov r0, #4 @ disable write-back on caches explicitly00403: mcr p15, 7, r0, c15, c0, 000404: #endif00405:00406: adr r5, arm926_crval00407: ldmia r5, {r5, r6}00408: mrc p15, 0, r0, c1, c0 @ get control register v4 00409: bic r0, r0, r500410: orr r0, r0, r600411: #ifdef CONFIG_CPU_CACHE_ROUND_ROBIN00412: orr r0, r0, #0x4000 @ .1.. .... .... ....00413: #endif00414: mov pc, lr00415: .size __arm926_setup, . - __arm926_setup00416:00417: /*00418: * R00419: * .RVI ZFRS BLDP WCAM00420: * .011 0001 ..11 010100421: *00422: */00423: .type arm926_crval, #object00424: arm926_crval:00425: crval clear=0x00007f3f, mmuset=0x00003135, ucset=0x00001134第391, 392行: 是函数声明第393行: 将r0设置为0第394行: 清除(invalidate)Instruction Cache 和Data Cache.第395行: 清除(drain) Write Buffer.第396 - 398行: 如果有配置了MMU,则需要清除(invalidate)Instruction TLB 和Data TLB接下来,是对控制寄存器c1进行配置,请参考ARM926 TRM.第401 - 404行: 如果配置了Data Cache使用writethrough方式, 需要关掉write-back.第406行:取arm926_crval的地址到r5中, arm926_crval 在第424行第407行:这里我们需要看一下424和425行,其中用到了宏crval,crval是在arch/arm/mm/proc-macro.S 中:00053: .macro crval, clear, mmuset, ucset00054: #ifdef CONFIG_MMU00055: .word \clear00056: .word \mmuset00057: #else00058: .word \clear00059: .word \ucset00060: #endif00061: .endm配合425行,我们可以看出,首先在arm926_crval的地址处存放了clear的值,然后接下来的地址存放了mmuset的值(对于配置了MMU的情况)所以,在407行中,我们将clear和mmuset的值分别存到了r5, r6中第408行:获得控制寄存器c1的值第409行: 将r0中的clear (r5) 对应的位都清除掉第410行:设置r0中mmuset (r6) 对应的位第411 - 413行:如果配置了使用round robin方式,需要设置控制寄存器c1的Bit[16]第412行: 取lr的值到pc中.而lr中的值存放的是__enable_mmu 的地址(arch/arm/kernel/head.S 93行),所以,接下来就是跳转到函数__enable_mmu5. 开启mmu开启mmu是又函数__enable_mmu 实现的.在进入__enable_mmu 的时候, r0中已经存放了控制寄存器c1的一些配置(在上一步中进行的设置), 但是并没有真正的打开mmu,在__enable_mmu 中,我们将打开mmu.此时,一些特定寄存器的值如下所示:r0 = c1 parameters (用来配置控制寄存器的参数)r4 = pgtbl (page table 的物理基地址)r8 = machine info (struct machine_desc的基地址)r9 = cpu id (通过cp15协处理器获得的cpu id)r10 = procinfo (struct proc_info_list的基地址)在arch/arm/kernel/head.S 中:00146: .type __enable_mmu, %function00147: __enable_mmu:00148: #ifdef CONFIG_ALIGNMENT_TRAP00149: orr r0, r0, #CR_A00150: #else00151: bic r0, r0, #CR_A00152: #endif00153: #ifdef CONFIG_CPU_DCACHE_DISABLE00154: bic r0, r0, #CR_C00155: #endif00156: #ifdef CONFIG_CPU_BPREDICT_DISABLE00157: bic r0, r0, #CR_Z00158: #endif00159: #ifdef CONFIG_CPU_ICACHE_DISABLE00160: bic r0, r0, #CR_I00161: #endif00162: mov r5, #(domain_val(DOMAIN_USER, DOMAIN_MANAGER) | \ 00163: domain_val(DOMAIN_KERNEL, DOMAIN_MANAGER) | \ 00164: domain_val(DOMAIN_TABLE, DOMAIN_MANAGER) | \ 00165: domain_val(DOMAIN_IO, DOMAIN_CLIENT))00166: mcr p15, 0, r5, c3, c0, 0 @ load domain access register 00167: mcr p15, 0, r4, c2, c0, 0 @ load page table pointer 00168: b __turn_mmu_on00169:00170: /*00171: * Enable the MMU. This completely changes the structure of the visible 00172: * memory space. You will not be able to trace execution through this.00173: * If you have an enquiry about this, *please* check the linux-arm-kernel 00174: * mailing list archives BEFORE sending another post to the list.00175: *00176: * r0 = cp#15 control register00177: * r13 = *virtual* address to jump to upon completion00178: *00179: * other registers depend on the function called upon completion00180: */00181: .align 500182: .type __turn_mmu_on, %function00183: __turn_mmu_on:00184: mov r0, r000185: mcr p15, 0, r0, c1, c0, 0 @ write control reg00186: mrc p15, 0, r3, c0, c0, 0 @ read id reg00187: mov r3, r300188: mov r3, r300189: mov pc, r13第146, 147行: 函数声明第148 - 161行: 根据相应的配置,设置r0中的相应的Bit. (r0 将用来配置控制寄存器c1)第162 - 165行: 设置domain 参数r5.(r5 将用来配置domain)第166行: 配置domain (详细信息清参考arm相关手册)第167行: 配置页表在存储器中的位置(set ttb).这里页表的基地址是r4, 通过写cp15的c2寄存器来设置页表基地址.第168行: 跳转到__turn_mmu_on. 从名称我们可以猜到,下面是要真正打开mmu了.(继续向下看,我们会发现,__turn_mmu_on就下当前代码的下方,为什么要跳转一下呢? 这是有原因的. go on)第169 - 180行: 空行和注释. 这里的注释我们可以看到, r0是cp15控制寄存器的内容, r13存储了完成后需要跳转的虚拟地址(因为完成后mmu已经打开了,都是虚拟地址了).第181行: .algin 5 这句是cache line对齐. 我们可以看到下面一行就是__turn_mmu_on, 之所以第182 - 183行: __turn_mmu_on 的函数声明. 这里我们可以看到, __turn_mmu_on 是紧接着上面第168行的跳转指令的,只是中间在第181行多了一个cache line对齐.这么做的原因是: 下面我们要进行真正的打开mmu操作了, 我们要把打开mmu的操作放到一个单独的cache line上. 而在之前的"启动条件"一节我们说了,I Cache是可以打开也可以关闭的,这里这么做的原因是要保证在I Cache打开的时候,打开mmu的操作也能正常执行.第184行: 这是一个空操作,相当于nop. 在arm中,nop操作经常用指令mov rd, rd 来实现.注意: 为什么这里要有一个nop,我思考了很长时间,这里是我的猜测,可能不是正确的:因为之前设置了页表基地址(set ttb),到下一行(185行)打开mmu操作,中间的指令序列是这样的: set ttb(第167行)branch(第168行)nop(第184行)enable mmu(第185行)对于arm的五级流水线: fetch - decode - execute - memory - write他们执行的情况如下图所示:这里需要说明的是,branch操作会在3个cycle中完成,并且会导致重新取指.从这个图我们可以看出来,在enable mmu操作取指的时候, set ttb操作刚好完成.第185行: 写cp15的控制寄存器c1, 这里是打开mmu的操作,同时会打开cache等(根据r0相应的配置)第186行: 读取id寄存器.第187 - 188行: 两个nop.第189行: 取r13到pc中,我们前面已经看到了, r13中存储的是__switch_data (在arch/arm/kernel/head.S 91行),下面会跳到__switch_data.第187,188行的两个nop是非常重要的,因为在185行打开mmu操作之后,要等到3个cycle之后才会生效,这和arm的流水线有关系.因而,在打开mmu操作之后的加了两个nop操作.6. 切换数据在arch/arm/kernel/head-common.S 中:00014: .type __switch_data, %object00015: __switch_data:00016: .long __mmap_switched00017: .long __data_loc @ r400018: .long __data_start @ r500019: .long __bss_start @ r600020: .long _end @ r700021: .long processor_id @ r400022: .long __machine_arch_type @ r500023: .long cr_alignment @ r600024: .long init_thread_union + THREAD_START_SP @ sp00025:00026: /*00027: * The following fragment of code is executed with the MMU on in MMU mode, 00028: * and uses absolute addresses; this is not position independent.00029: *00030: * r0 = cp#15 control register00031: * r1 = machine ID00032: * r9 = processor ID00033: */00034: .type __mmap_switched, %function00035: __mmap_switched:00036: adr r3, __switch_data + 400037:00038: ldmia r3!, {r4, r5, r6, r7}00039: cmp r4, r5 @ Copy data segment if needed 00040: 1: cmpne r5, r600041: ldrne fp, [r4], #400042: strne fp, [r5], #400043: bne 1b00044:00045: mov fp, #0 @ Clear BSS (and zero fp) 00046: 1: cmp r6, r700047: strcc fp, [r6],#400048: bcc 1b00049:00050: ldmia r3, {r4, r5, r6, sp}00051: str r9, [r4] @ Save processor ID00052: str r1, [r5] @ Save machine type00053: bic r4, r0, #CR_A @ Clear 'A' bit00054: stmia r6, {r0, r4} @ Save control register values 00055: b start_kernel第14, 15行: 函数声明第16 - 24行: 定义了一些地址,例如第16行存储的是__mmap_switched 的地址, 第17行存储的是__data_loc 的地址 ......第34, 35行: 函数__mmap_switched第36行: 取__switch_data + 4的地址到r3. 从上文可以看到这个地址就是第17行的地址.第37行:依次取出从第17行到第20行的地址,存储到r4, r5, r6, r7 中. 并且累加r3的值.当执行完后, r3指向了第21行的位置.对照上文,我们可以得知:r4 - __data_locr5 - __data_startr6 - __bss_startr7 - _end这几个符号都是在arch/arm/kernel/vmlinux.lds.S 中定义的变量:00102: #ifdef CONFIG_XIP_KERNEL00103: __data_loc = ALIGN(4); /* location in binary */00104: . = PAGE_OFFSET + TEXT_OFFSET;00105: #else00106: . = ALIGN(THREAD_SIZE);00107: __data_loc = .;00108: #endif00109:00110: .data : AT(__data_loc) {00111: __data_start = .; /* address in memory */00112:00113: /*00114: * first, the init task union, aligned00115: * to an 8192 byte boundary.00116: */00117: *(.init.task)......00158: .bss : {00159: __bss_start = .; /* BSS */ 00160: *(.bss)00161: *(COMMON)00162: _end = .;00163: }对于这四个变量,我们简单的介绍一下:__data_loc 是数据存放的位置__data_start 是数据开始的位置__bss_start 是bss开始的位置_end 是bss结束的位置, 也是内核结束的位置其中对第110行的指令讲解一下: 这里定义了.data 段,后面的AT(__data_loc) 的意思是这部分的内容是在__data_loc中存储的(要注意,储存的位置和链接的位置是可以不相同的).关于AT 详细的信息请参考第38行: 比较__data_loc 和__data_start第39 - 43行: 这几行是判断数据存储的位置和数据的开始的位置是否相等,如果不相等,则需要搬运数据,从__data_loc 将数据搬到__data_start.其中__bss_start 是bss的开始的位置,也标志了data 结束的位置,因而用其作为判断数据是否搬运完成.第45 - 48行:是清除bss 段的内容,将其都置成0. 这里使用_end 来判断bss 的结束位置.第50行: 因为在第38行的时候,r3被更新到指向第21行的位置.因而这里取得r4, r5, r6, sp的值分别是:r4 - processor_idr5 - __machine_arch_typer6 - cr_alignmentsp - init_thread_union + THREAD_START_SPprocessor_id 和__machine_arch_type 这两个变量是在arch/arm/kernel/setup.c 中第62, 63行中定义的.cr_alignment 是在arch/arm/kernel/entry-armv.S 中定义的:00182: .globl cr_alignment00183: .globl cr_no_alignment00184: cr_alignment:00185: .space 400186: cr_no_alignment:00187: .space 4init_thread_union 是init进程的基地址. 在arch/arm/kernel/init_task.c 中:00033: union thread_union init_thread_union00034: __attribute__((__section__(".init.task"))) =00035: { INIT_THREAD_INFO(init_task) };对照vmlnux.lds.S 中的的117行,我们可以知道init task是存放在 .data 段的开始8k, 并且是THREAD_SIZE(8k)对齐的第51行: 将r9中存放的processor id (在arch/arm/kernel/head.S 75行) 赋值给变量processor_id第52行: 将r1中存放的machine id (见"启动条件"一节)赋值给变量__machine_arch_type第53行: 清除r0中的CR_A 位并将值存到r4中. CR_A 是在include/asm-arm/system.h 21行定义, 是cp15控制寄存器c1的Bit[1](alignment fault enable/disable)第54行: 这一行是存储控制寄存器的值.从上面arch/arm/kernel/entry-armv.S 的代码我们可以得知.这一句是将r0存储到了cr_alignment 中,将r4存储到了cr_no_alignment 中.第55行: 最终跳转到start_kernel。

ARMlinux内核启动分析.

ARM linux内核启动分析[原创 2007-06-11 10:35:46 ] 发表者: jimmy_leehead-armv.S主支分析head-armv.S是解压后(或未压缩的内核最先执行的一个文件，这个文件位于arch/arm/kernel/head-armv.S，在与这个文件同目录下还有一个文件head-armo.S与head-armv.S 很相似，但从arch/arm/下的Makefile中可以看到区别在哪里:ifeq ($(CONFIG_CPU_26,yPROCESSOR := armoifeq ($(CONFIG_ROM_KERNEL,yDATAADDR = 0x02080000TEXTADDR = 0x03800000LDSCRIPT = arch/arm/vmlinux-armo-rom.lds.inelseTEXTADDR = 0x02080000LDSCRIPT = arch/arm/vmlinux-armo.lds.inendifendififeq ($(CONFIG_CPU_32,yPROCESSOR = armvTEXTADDR = 0xC0008000LDSCRIPT = arch/arm/vmlinux-armv.lds.inendif……HEAD :=arch/arm/kernel/head-$(PROCESSOR.o \arch/arm/kernel/init_task.o闲话少说，在进入分析head-armv.S之前，交待一下我所分析的内核版本号以及硬件平台，内核是2.4.19-rmk7-pxa2，对应的硬件平台为pxa 270。

开篇说到，head-armv.S是进入内核最先执行的文件，为什么呢？内核可执行文件由许多链接在一起的对象文件组成。

对象文件有许多节，如文本、数据、init 数据、bass 等等。

这些对象文件都是由一个称为link script的文件链接并装入的。

Linux arm 启动 c语言部分详解第二讲(Start kernel-- setup_a

[原创]Linux arm 启动c语言部分详解第二讲（Start kernel-> setup_aWritten by leeming这一讲是主要讲setup_arch中那个没有解释的函数解释完毕，完成setup_arch的函数，好让我们的start_kernel继续下去。

/** paging_init() sets up the page tables, initialises the zone memory* maps, and sets up the zero page, bad page and bad page tables.*这部分的主要工作建立页表，初始化内存。

*/void __init paging_init(struct meminfo *mi, struct machine_desc *mdesc){       void *zero_page;//这个函数主要是用来建立各种类型的页表选项(比如内存是MEMORY类型，设备室DEVICE，中断向量表是HIGH_VECTORS)       build_mem_type_table();{       struct cachepolicy *cp;       //获取cp15处理器的c1寄存器位       unsigned int cr = get_cr();       unsigned int user_pgprot, kern_pgprot;       //获取处理器架构版本       int cpu_arch = cpu_architecture();       int i;       //根据处理器版本号调整cache政策，不是写缓冲区的政策#if defined(CONFIG_CPU_DCACHE_DISABLE)       if (cachepolicy > CPOLICY_BUFFERED)              cachepolicy = CPOLICY_BUFFERED;#elif defined(CONFIG_CPU_DCACHE_WRITETHROUGH)       if (cachepolicy > CPOLICY_WRITETHROUGH)              cachepolicy = CPOLICY_WRITETHROUGH;#endif       if (cpu_arch              if (cachepolicy >= CPOLICY_WRITEALLOC)                     cachepolicy = CPOLICY_WRITEBACK;              ecc_mask = 0;//因为v5前的处理器的一级描述符没有定义第9位作为保护标志位       }       if (cpu_arch              //mem_types是一个全局数组arch/arm/mm-armv.c，里面有所有类型              for (i = 0; i                     //prot_l1 prot_sect都是一级描述符的意思                     //将一级描述符的第4位置1                     if (mem_types.prot_l1)                            mem_types.prot_l1 |= PMD_BIT4;                     if (mem_types.prot_sect)                            mem_types.prot_sect |= PMD_BIT4;              }       }       //我们的cachepolicy是3，因此相应的配置如下       //     .policy          = "writeback",       //     .cr_mask       = 0,       //     .pmd             = PMD_SECT_WB,       //     .pte        = PTE_BUFFERABLE|PTE_CACHEABLE,       cp = &cache_policies[cachepolicy];       //kern_pgprot user_pgprot是内核和用户空间的二级页表描述符       kern_pgprot = user_pgprot = cp->pte;       //以下删除了非v4t架构的高版本代码       for (i = 0; i              //这里依次获取16个默认的保护类型的值              unsigned long v = pgprot_val(protection_map);              //(L_PTE_BUFFERABLE|L_PTE_CACHEABLE)这是linux pte的定义              //内核中有linux和hardware两种定义方式，为了更好的兼容性              //这里两者间是匹配的，这里将值再加上我们的设置就是              //最新的16个值，将它写回更新              v = (v & ~(L_PTE_BUFFERABLE|L_PTE_CACHEABLE)) | user_pgprot;              protection_map = __pgprot(v);       }       mem_types[MT_LOW_VECTORS].prot_pte |= kern_pgprot;       mem_types[MT_HIGH_VECTORS].prot_pte |= kern_pgprot;       mem_types[MT_MINICLEAN].prot_sect &= ~PMD_SECT_TEX(1);       pgprot_kernel = __pgprot(L_PTE_PRESENT | L_PTE_YOUNG |                             L_PTE_DIRTY | L_PTE_WRITE |                             L_PTE_EXEC | kern_pgprot);       mem_types[MT_LOW_VECTORS].prot_l1 |= ecc_mask;       mem_types[MT_HIGH_VECTORS].prot_l1 |= ecc_mask;       mem_types[MT_MEMORY].prot_sect |= ecc_mask | cp->pmd;       mem_types[MT_ROM].prot_sect |= cp->pmd;       switch (cp->pmd) {       case PMD_SECT_WT:              mem_types[MT_CACHECLEAN].prot_sect |= PMD_SECT_WT;              break;       case PMD_SECT_WB:       case PMD_SECT_WBWA:              mem_types[MT_CACHECLEAN].prot_sect |= PMD_SECT_WB;              break;       }       //以上所有的操作都是为了给mem_types这个结构体中的各种类型中的页表参数添加上我们的要求，主要是一级页表，二级页表，ap（访问权限控制）；至于domain是利用系统初始化时的值，不用我们再进行干预。

嵌入式Linux内核启动部分代码分析

3. 内核启动地址的确定内核自解压方式 Head.S/head-XXX.S 获得内核解压后首地址 ZREALADDR，然后解压内核，并把解压后的内核放在 ZREALADDR
的位置上，最后跳转到 ZREALADDR 地址上，开始真正的内核启动。
arch/armnommu/boot/Makefile，定义 ZRELADDR 和 ZTEXTADDR。ZTEXTADDR 是自解压代码的起始地址，如果从内存启动内核，设置为 0 即可，如果从 Rom/Flash 启动，则设置 ZTEXTADDR 为相应的值。ZRELADDR 是内核解压缩后的执行地址。
__lookup_processor_type 这个函数根据芯片的 ID 从获取 proc_info_list 结构，proc_info_list 结构定义在 include/asm-armnommu/proginfo.h 中，该结构的数据定义在 arch/armnommu/mm/proc-arm*.S 文件中，ARM7TDMI 系列
说明：执行完 decompress_kernel 函数后,代码跳回 head.S/head-XXX.S 中,检查解压缩之后的 kernel 起始地址是否紧挨着 kernel image。如果是,beqcall_kernel,执行解压后的 kernel。如果解压缩之后的 kernel 起始地址不是紧挨着 kernelimage, 则执行 relocate,将其拷贝到紧接着 kernel image 的地方,然后跳转,执行解压后的 kernel。
5.2 setup_arch() setup_arch()函数做体系相关的初始化工作，函数的定义在 arch/armnommu/kernel/setup.c 文件中，主要涉及下列主

Linux_arm_启动_c语言部分详解

//这个变量初始值为"h",如果这里设置成 softboot，它会将这个初始值变为"s" if (mdesc->soft_reboot)
reboot_setup("s");
//boot_params 如果为 0 则表示 bootloader 没有传参数 //一般默认为 0x30000100 位置,我们代码也是填的这个位置，4020 的 uboot 当然也要指定这个位置
//就是查找你是什么版本的处理器架构，最后就是调用 //了 lookup_processor_type 这个函数，它在汇编部分也提到过 setup_processor();
//machine_arch_type 就是我们的机器号 0xc2 ，这里就是通过调用 lookup_machine_type 函数来得到我们在 4020.c 中写的那个 machine_start 的结构体。
if (tags->hdr.tag != ATAG_CORE) tags = (struct tag *)&init_tags;
if (mdesc->fixup) mdesc->fixup(mdesc, tags, &from, &meminfo);
//是通过标签 0x544100**来辨别的，因此 uboot 中有相应的标签字 if (tags->hdr.tag == ATAG_CORE) {
saved_command_line[COMMAND_LINE_SIZE-1] = '\0';
// 分析 command line，看这个函数的代码你会发现为什么我们的 command line 不同参数之间是通过空格来分开，同一参数之间的不同值是通过逗号来区分

ARMlinux启动分析-Nathan.Yu的专栏-CSDN博客

ARMlinux启动分析-Nathan.Yu的专栏-CSDN博客linux启动分析(1)---bootloader启动内核过程我分析的是2.4.19的内核版本，是xscale的平台，参考了网上很多有价值的帖子，也加入了自己的一些看法，陆续总结成文字，今天是第一篇：内核一般是由bootloader来引导的，通过bootloader启动内核一般要传递三个参数，第一个参数放在寄存器0中，一般都为0，r0 = 0；第二个参数放在寄存器1中，是机器类型id，r1 = Machine Type Number；第三个参数放在寄存器2中，是启动参数标记列表在ram中的起始基地址；bootloader首先要将ramdisk（如果有）和内核拷贝到ram当中，然后可以通过c语言的模式启动内核：void (*startkernel)(int zero, int arch, unsigned int params_addr) = (void(*)(int, int, unsigned int))KERNEL_RAM_BASE;startkernel(0, ARCH_NUMBER, (unsigned int)kernel_params_start);其中KERNEL_RAM_BASE为内核在ram中启动的地址，ARCH_NUMBER是Machine Type Number，kernel_params_start 是参数在ram的偏移地址。

这时候就将全力交给了内核。

linux启动分析(2)---内核启动地址的确定内核编译链接过程是依靠vmlinux.lds文件，以arm为例vmlinux.lds文件位于kernel/arch/arm/vmlinux.lds，但是该文件是由vmlinux-armv.lds.in生成的，根据编译选项的不同源文件还可以是vmlinux-armo.lds.in，vmlinux-armv-xip.lds.in。

Start_kernel函数分析

early_boot_irqs_disabled= true;
//系统中断关闭标志，当early_init完毕后，会恢复中断设置标志为false。
/* Interrupts are still disabled. Do necessary setups, then enable them */
tick_init();
3、kmem_cache_init()；初始化slab分配器
4、percpu_init_late()；PerCPU变量系统后期初始化
5、pgtable_cache_init()；也表缓存初始化，arm中是个空函数
6、vmalloc_init()；初始化虚拟内存分配器
】
/*
* Set up the scheduler prior starting any interrupts (such as the
debug_objects_early_init();
//初始化哈希桶(hash buckets)并将static object和pool object放入poll列表，这样堆栈就可以完全操作了
【这个函数的主要作用就是对调试对象进行早期的初始化，就是HASH锁和静态对象池进行初始化，执行完后，object tracker已经开始完全运作了】
setup_log_buf(0);
//使用bootmeme分配一个记录启动信息的缓冲区
pidhash_init();
//进程ID的HASH表初始化，用bootmem分配并初始化PID散列表，由PID分配器管理空闲和已指派的PID，这样可以提供通PID进行高效访问进程结构的信息。LINUX里共有四种类型的PID，因此就有四种HASH表相对应。
setup_arch(&command_line);

arm-linux启动流程分析

arm-linux启动流程分析arm-linux启动流程分析一．概述 (1)二．init进程 (1)三．inittab文件简要说明 (1)四．arm-linux系统的启动分析 (3)一．概述本文将讲述arm-linux内核启动后到进入用户shell模式这段时间的启动流程，从上电到进入kernel的过程请参见sourcesafe下“personal/yangxiyuan/资料”目录下的“ARM-linux启动流程.htm”文档。

二．init进程init进程是内核启动后的第一个用户级进程，是系统中所有进程的父进程，init进程的主要任务是按照inittab文件所提供的信息创建进程，init进程繁衍出完成通常操作所需的子进程，这些操作包括：设置机器名、检查和安装磁盘及文件系统、启动系统日志、配置网络接口并启动网络和邮件服务，启动打印服务等。

三．inittab文件简要说明inittab文件中每一记录都从新的一行开始，每个记录项最多可有512个字符，每一项的格式通常如下：id: run level:action:process，解释如下：id字段：是最多4个字符的字符串，用来唯一标志表项。

run level字段：定义该记录项被调用时的运行级别，run level可以由一个或多个运行级别构成，也可以是空，空则代表运行级别0～6。

# 0 - halt (Do NOT set initdefault to this)# - 关闭计算机，安全关闭电源# 1 - Single user mode# - 进入单用户维护模式，卸下除root以外的所有文件系统并杀死所有用户进程# 2 - Multiuser, without NFS (The same as 3, if you do not have networking)# - 多用户模式，无网络连接# 3 - Full multiuser mode# - 多用户模式，并以文本方式作为登陆方式# 4 - unused# 5 - X11# - 多用户模式，并以图形方式作为登陆方式# 6 - reboot (Do NOT set initdefault to this)# - 停止linux系统，并按照/etc/inittab默认的登记项重新引导系统。

ARM Linux内核启动流程

ARM Linux 内核启动流程操作ARM Linux 内核主要分为哪几个步骤，下面杭州硕数就为大家讲解一下这个启动的流程。

ARM Linux 内核综述启动分两步，首先是硬件相关部分，入口是arch/arm/kernel/head.S 代码文件中的ENTRY(stext)函数；然后是硬件无关部分，入口函数是init/main.c 代码文件中的start_kernel 函数。

ARM Linux 内核硬件相关部分 1. 我们平台是arm，自然硬件相关部分代码在arch/arm/里面。

2. 平台相关部分的核心代码自然在arch/arm/kernel/里面。

3. 找入口函数，必须从对应目录的Makefile 和链接脚本*.lds 入手！# ls arch/arm/kernel/得到一个Makefile 文件和一个vmlinux.lds 文件# vim arch/arm/kernel/Makefile看到有一句extra-y := $(head-y) init_task.o vmlinux.lds，则说明其使用链接脚本为vmlinux.lds还有一句head-y := head$(MMUEXT).o# vim arch/arm/kernel/vmlinux.lds看到有一句ENTRY(stext)，则说明入口函数为stext4. 结合上面3 句关键的代码，可以推测stext 函数在arch/arm/kernel/head*.S 或arch/arm/kernel/head*.c# ls arch/arm/kernel/head*得到arch/arm/kernel/head-common.S arch/arm/kernel/head-nommu.S arch/arm/kernel/head.o arch/arm/kernel/head.S再结合Makefile 的默认规则%.o : %.S 或%.o : %.c可以知道arch/arm/kernel/head.o 与arch/arm/kernel/head.S 对应。

内核启动过程分析(自解压后到start_kernel)

内核启动过程分析在学习过程中“行走的流云”的博文给了我很大的帮助，我也复制了很多他的总结，在这里感谢他！本文件的代码主要是讲内核开始工作前的准备工作，其工作主要有一下几点：1.进入管理模式，判断处理器ID是否匹配，判断机器ID是否匹配，判断atags指针是否合法。

2.建立页表，实现虚拟地址和物理地址的映射。

3.关闭Icache、Dcache、清空write buffer、使TLB无效4.使能MMU、使能cache跳转到start kernel开始真正的内核运行。

对于经过压缩的内核(zIm age),先运行解压缩decom press_kernel，然后还需要重定位,然后调用内核,就象跳到未压缩的内核中的开始处,内核的s tartup在arch/arm/kernel/head.S中,进行页表初始化和处理器缓存初始化等工作,然后跳到C代码init/main.c中的s tart_kernel,接下来的事情就是大众化工作了,在这里，我们继续分析解压缩后的工作，即是arch/arm/kernel/head.S的工作内容。

首先先说下内核的启动条件：1. CPU必须处于SVC(s upervis or)模式,并且IRQ和FIQ中断都是禁止的;2. MMU(内存管理单元)必须是关闭的, 此时虚拟地址对物理地址;3. 数据cache(Data cache)必须是关闭的4. 指令cache(Ins truction cache)可以是打开的,也可以是关闭的,这个没有强制要求;5. CPU 通用寄存器0 (r0)必须是0;6. CPU 通用寄存器1 (r1)必须是ARM Linux m achine type7. CPU 通用寄存器2 (r2) 必须是kernel param eter lis t 的物理地址/** linux/arch/arm/kernel/head.S** Copyright (C) 1994-2002 Russell King* Copyright (c) 2003 ARM Limited* All Rights Reserved** This program is free software; you can redistribute it and/or modify* it under the terms of the GNU General Public License version 2 as* published by the Free Software Foundation.** Kernel startup code for all 32-bit CPUs*/#include <linux/linkage.h>#include <linux/init.h>#include <asm/assembler.h>#include <asm/domain.h>#include <asm/ptrace.h>#include <asm/asm-offsets.h>#include <asm/memory.h>#include <asm/thread_info.h>#include <asm/system.h>#if (PHYS_OFFSET & 0x001fffff)#error "PHYS_OFFSET must be at an even 2MiB boundary!"//boundary(分界线)#endif#define KERNEL_RAM_V ADDR (PAGE_OFFSET + TEXT_OFFSET)#define KERNEL_RAM_PADDR (PHYS_OFFSET + TEXT_OFFSET)/** swapper_pg_dir is the virtual address of the initial page* We place the page tables 16K below KERNEL_RAM_V ADDR. Therefore, we must* make sure that KERNEL_RAM_V ADDR is correctly set. Currently, we expect* the least significant 16 bits to be 0x8000, but we could probably* relax this restriction to KERNEL_RAM_V ADDR >= PAGE_OFFSET + 0x4000.*/swapper_pg_dir 是初始页表的虚拟地址.我们将页表放在KERNEL_RAM_VADDR以下16K的空间中.因此我们必须保证KERNEL_RAM_VADDR已经被正常设置.当前,我们期望的是这个地址的最后16 bits为0x8000,但我们或许可以放宽这项限制到KERNEL_RAM_VADDR >=PAGE_OFFSET + 0x4000.#if (KERNEL_RAM_V ADDR & 0xffff) != 0x8000#error KERNEL_RAM_V ADDR must start at 0xXXXX8000 //内核的起始地址必须是32k对齐#endif.globl swapper_pg_dir //定义一个全局变量.equ swapper_pg_dir, KERNEL_RAM_V ADDR - 0x4000/*页表的起始地址，大小为16kb*/.macro pgtbl, rd /*定义一个宏，在建页表时用到*/ldr \rd, =(KERNEL_RAM_PADDR - 0x4000).endm#ifdef CONFIG_XIP_KERNEL#define KERNEL_ST ART XIP_VIRT_ADDR(CONFIG_XIP_PHYS_ADDR)#define KERNEL_END _edata_loc#else#define KERNEL_ST ART KERNEL_RAM_V ADDR#define KERNEL_END _end /*内核镜像的结束地址（虚拟地址，在vmlinux.lds.S 中定义）*/#endif/** Kernel startup entry point.* ---------------------------*这些参数同通常是由解压代码传进来的* This is normally called from the decompressor code. The requirements* are: MMU = off, D-cache = off, I-cache = dont care, r0 = 0,* r1 = machine nr, r2 = atags pointer.** This code is mostly position independent, so if you link the kernel at* 0xc0008000, you call this at __pa(0xc0008000).** See linux/arch/arm/tools/mach-types for the complete list of machine* numbers for r1. r1中放的是机器ID** We're trying to keep crap to a minimum; DO NOT add any machine specific* crap here - that's what the boot loader (or in extreme极度的, well justified合理的* circumstances事件，详细事件,zImage) is for.不要随意的添加机器ID，要和bootloard 提供的相匹配。

ARM linux的启动部分源代码简略分析

ARM linux的启动部分源代码简略分析ARM linux的启动部分源代码简略分析以友善之臂的mini2440开发板为平台，以较新的内核linux-2.6.32.7版本为例，仅作说明之用。

当内核映像被加载到RAM之后，Bootloader的控制权被释放。

内核映像并不是可直接运行的目标代码，而是一个压缩过的zImage（小内核）。

但是，也并非是zImage映像中的一切均被压缩了，映像中包含未被压缩的部分，这部分中包含解压缩程序，解压缩程序会解压缩映像中被压缩的部分。

zImage使用gzip压缩的，它不仅仅是一个压缩文件，而且在这个文件的开头部分内嵌有gzip解压缩代码。

当zImage被调用时它从arch/arm/boot/compressed/head.S的start汇编例程开始执行。

这个例程进行一些基本的硬件设置，并调用arch/arm/boot/compressed/misc.c中的decompress_kernel()解压缩内核。

arch/arm/kernel/head.S文件是内核真正的启动入口点，一般是由解压缩内核的程序来调用的。

首先先看下对于运行这个文件的要求：MMU = off；D-cache = off；I-cache = 无所谓，开也可以，关也可以；r0 = 0；r1 = 机器号；r2 = atags 指针。

这段代码是位置无关的，所以，如果以地址0xC0008000来链接内核，那么就可以直接用__pa(0xc0008000)地址来调用这里的代码。

其实，在这个（Linux内核中总共有多达几十个的以head.S命名的文件）head.S文件中的一项重要工作就是设置内核的临时页表，不然mmu开起来也玩不转，但是内核怎么知道如何映射内存呢？linux的内核将映射到虚地址0xCxxx xxxx处，但他怎么知道在4GB的地址空间中有哪一片ram是可用的，从而可以映射过去呢？因为不同的系统有不通的内存映像，所以，LINUX约定，要调用内核代码，一定要满足上面的调用要求，以为最初的内核代码提供一些最重要的关于机器的信息。

ARM_Linux启动代码分析

首先，porting linux的时候要规划内存影像，如小弟的系统有64m SDRAM,地址从0x 0800 0000 -0x0bff ffff,32m flash,地址从0x0c00 0000-0x0dff ffff.规划如下：bootloader, linux kernel, rootdisk放在flash里。

具体从0x0c00 0000开始的第一个1M放bootloader，0x0c10 0000开始的2m放linux kernel,从0x0c30 0000开始都给rootdisk。

启动：首先，启动后arm920T将地址0x0c00 0000映射到0（可通过跳线设置），实际上从0x0c00 0000启动，进入我们的bootloader，但由于flash速度慢，所以bootloader前面有一小段程序把bootloader拷贝到SDRAM 中的0x0AFE0100，再从0x 0800 0000 运行bootloader，我们叫这段小程序为flashloader,flashloader必须要首先初始化SDRAM,不然往那放那些东东：.equ SOURCE, 0x0C000100 bootloader的存放地址.equ TARGET, 0x0AFE0100 目标地址.equ SDCTL0, 0x221000 SDRAM控制器寄存器// size is stored in location 0x0C0000FC.global _start_start: //入口点//;***************************************//;* Init SDRAM//;***************************************// ;***************// ;* SDRAM// ;***************LDR r1, =SDCTL0 //// ; Set Precharge CommandLDR r3, =0x92120200//ldr r3,=0x92120251STR r3, [r1]// ; Issue Precharge All CommadLDR r3, =0x8200000LDR r2, [r3]// ; Set AutoRefresh CommandLDR r3, =0xA2120200STR r3, [r1]// ; Issue AutoRefresh CommandLDR r3, =0x8000000LDR r2, [r3]LDR r2, [r3]LDR r2, [r3]LDR r2, [r3]LDR r2, [r3]LDR r2, [r3]LDR r2, [r3]LDR r2, [r3]// ; Set Mode RegisterLDR r3, =0xB2120200STR r3, [r1]// ; Issue Mode Register CommandLDR r3, =0x08111800 //; Mode Register V alue LDR r2, [r3]// ; Set Normal ModeLDR r3, =0x82124200STR r3, [r1]//;*************************************** //;* End of SDRAM and SyncFlash Init *//;***************************************// copy code from FLASH to SRAM_CopyCodes:ldr r0,=SOURCEldr r1,=TARGETsub r3,r0,#4ldr r2,[r3]_CopyLoop:ldr r3,[r0]str r3,[r1]add r0,r0,#4add r1,r1,#4sub r2,r2,#4teq r2,#0beq _EndCopyb _CopyLoop_EndCopy:ldr r0,=TARGETmov pc,r0欲知后事如何，下回分解：长篇连载--arm linux演艺---第二回--------------------------------------------------------------------------------上回书说到flashloader把bootloader load到0x0AFE0100，然回跳了过去，其实0x0AFE0100 就是烧在flash 0x0C000100中的真正的bootloader:bootloader 有几个文件组成，先是START.s，也是唯一的一个汇编程序，其余的都是C写成的，START.s 主要初始化堆栈：_start:ldr r1,=StackInitldr sp,[r1]b main//此处我们跳到了C代码的main函数，当C代码执行完后，还要调用//下面的JumpToKernel0x跳到LINXU kernel运行.equ StackInitV alue, __end_data+0x1000 // 4K __end_data在连结脚本中指定StackInit:.long StackInitV alue.global JumpToKernelJumpToKernel:// jump to the copy code (get the arguments right)mov pc, r0.global JumpToKernel0x// r0 = jump address// r1-r4 = arguments to use (these get shifted)JumpToKernel0x:// jump to the copy code (get the arguments right)mov r8, r0mov r0, r1mov r1, r2mov r2, r3mov r3, r4mov pc, r8.section ".data.boot".section ".bss.boot"欲知bootloader中的c代码如何运行，请看下集书接上回：下面让我们看看bootloader的c代码干了些什么。