<stdarg.h> 标准参数头文件。以宏的形式定义变量参数列表。 主要说明了-个类型(va_list)和三个宏(va_start, va_arg 和 va_end),用于vsprintf、vprintf、vfprintf 函数。 <stddef.h> 标准定义头文件。定义了NULL, offsetof(TYPE, MEMBER)。 <string.h> 字符串头文件。主要定义了一些有关字符串操作的 嵌入函数。 <termios.h> 终端输入输出函数头文件。主要定义控制异步通信 口的终端接口。 <time.h> 时间类型头文件。其中最主要定义了tm 结构和一些有 关时间的函数原形。 <unistd.h> Linux 标准头文件。定义了各种符号常数和类型,并 申明了各种函数。如定义了__LIBRARY__,则还包括系统调 用号和内嵌汇编_syscall0()等。 <utime.h> 用户时间头文件。定义了访问和修改时间结构以及 utime()原型。
<sys/stat.h> 文件状态头文件。含有文件或文件 系统状态结构stat{}和常量。 <sys/times.h> 定义了进程中运行时间结构tms 以及times()函数原型。 <sys/types.h> 类型头文件。定义了基本的系统 数据类型。 <sys/utsname.h> 系统名称结构头文件。 <sys/wait.h> 等待调用头文件。定义系统调用 wait()核waitpid()及相关常数符号。
Linux 内核专用头文件子目录include/linux
linux内核原理Linux内核是一个开放源代码的操作系统内核,它是由林纳斯·托瓦兹(Linus Torvalds)在上世纪90年代初开发而来。
Linux 源码介绍说明文档
源码说明一、什么是源码包软件;顾名思义,源码包就是源代码的可见的软件包,基于Linux和BSD系统的软件最常见;在国内源可见的软件几乎绝迹;大多开源软件都是国外出品;在国内较为出名的开源软件有fcitx;lumaqq;Lumaqq及scim等;但软件的源代码可见并不等于软件是开源的,我们还要以软件的许可为准;比如有些软件是源码可见的,但他约定用户只能按他约定的内容来修改;比如vbb论坛程序;所以一个软件是否是开源软件,得具备两个条件;一是源代码可见;二是要有宽松的许可证书,比如GPL 证书等;在GNU Linux或BSD社区中,开发人员在放出软件的二进制软件包的同时,也会为我们提供源代码软件包;二、源代码有何用?一个软件的如果有源码,是任何人都能看到他是怎么开发而来的,就像一个瓶子,比如瓶子制作的模具是什么;需要什么材料;具体的用途以及瓶子的详细说明书等等。
软件的开放源码就是类似,开发者在给我们软件的同时,也会告诉我们软件是怎么开发出来的;只要我们的水平足够的高,所有的代码都在那里,我们就可以修改和定制软件,以适合我们的需要;如果Windows开放源代码,并以GPL发布,一样是有人能造出来N多的Windows发行版;遗憾的是Windows并不是开源系统;所以软件的源代码的用处无非是以下两点;1、软件根据用户的需要加以定制;2、二次开发;注:要根据软件的许可证书约定为准,开发者许可二次开发才行;三、怎样安装以源码包打包的软件;1、源码包的打包格式;源代码一般以file.tar.gz file.tar.bz2或file.src.rpm 打包;file.tar.gz和file.tar.bz2格式的解包命令如下;[root@localhost beinan]# tar jxvf file.tar.bz2[root@localhost beinan]# tar zxvf file.tar.gz至于file.src.rpm 的用法,请参见:/set/39788.html">《file.src.rpm 使用方法的简介》2、如何编译安装源码包;(大多数)1)解开软件包查看帮助文档;我们解开一个包后,进入解压包,一般都能发现README(或reame)和INSTALL( 或install);或doc(或DOC)目录;看名字就知道个差不多;比如我们下载一个比较新的fcitx 的软件包,比如是 fcitx-3.2-050827.tar.bz2我们在解开这个软件包会会发现如下的文件;[root@localhost fcitx]# tar jxvf fcitx-3.2-050827.tar.bz2[root@localhost fcitx]#cd fcitx[root@localhost fcitx]# lsaclocal.m4 config.guess configure debian INSTALL src xpmAUTHORS depcomp install-sh missing config.rpath COPYING doc lib mkinstalldirs TODOChangeLog config.sub data README tools所以我们就可以看fcitx的INSTALL 和doc目录的安装文档了;里面都告诉我们如何安装;有时安装文档也会在开发者的主页上有详细的说明,及常见问题的处理等;比如/info/38307.html" target=_blank>LumaQQ2)编译安装软件的条件;首先我们在Linux系统中至少得把开发工具安装上,比如gcc ;perl;python;glibc;gtk;make ;automake 等开发工具或基础包;还要安装一些相应的开发包,一般是文件名包括dev的,比如kernel-devel;还有一些开发库,比如以lib开头的;如果您在编译软件时,有时提示缺少什么东西之类的,大多少的是这些开发工具和开发库等;从光盘中找出安装就是了;有时光盘没有提供,请用google搜索相应的软件包,有时可能也会用到源码包编译安装所依赖的包;有时本来系统中已经安装了所依赖的包,但系统提示找不到应该怎么办?这时需要我们设置一下PKG_CONFIG_PATH的环境变量就行了;#export PKG_CONFIG_PATH=/usr/lib/pkgconfig或#export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig然后我们再来运行编译的./configure ;make ;make install ,尝试着来吧;以java开发的工具开发的程序,要用到 jre或者jdk ;jdk已经包括jre了,所以如果我们只是要求有一个java程序运行的环境,只需要安装jre就行了;安装好jre,配置一下java 的环境变量就可以用了。
目标是帮助对Linux 不甚了解的有经验的C程序员对整个Linux的设计有所了解。
Bootsect.s(1-9)!! SYS_SIZE is the number of clicks (16 bytes) to be loaded.! 0x3000 is 0x30000 bytes = 196kB, more than enough for current! versions of linux ! SYS_SIZE 是要加载的节数(16 字节为1 节)。
0x3000 共为1 2 3 4 5 60x7c000x00000x900000x100000xA0000system 模块代码执行位置线路0x90200! 0x30000 字节=192 kB(上面Linus 估算错了),对于当前的版本空间已足够了。
!SYSSIZE = 0x3000 ! 指编译连接后system 模块的大小。
参见列表1.2 中第92 的说明。
! 这里给出了一个最大默认值。
!! bootsect.s (C) 1991 Linus Torvalds!! bootsect.s is loaded at 0x7c00 by the bios-startup routines, and moves! iself out of the way to address 0x90000, and jumps there.!! It then loads 'setup' directly after itself (0x90200), and the system! at 0x10000, using BIOS interrupts.!! NOTE! currently system is at most 8*65536 bytes long. This should be no! problem, even in the future. I want to keep it simple. This 512 kB! kernel size should be enough, especially as this doesn't contain the! buffer cache as in minix!! The loader has been made as simple as possible, and continuos! read errors will result in a unbreakable loop. Reboot by hand. It! loads pretty fast by getting whole sectors at a time whenever possible.!! 以下是前面这些文字的翻译:! bootsect.s (C) 1991 Linus Torvalds 版权所有!! bootsect.s 被bios-启动子程序加载至0x7c00 (31k)处,并将自己! 移到了地址0x90000 (576k)处,并跳转至那里。
Linux也在系统内核和文件系统之间提供了一种叫做VFS(virtual file system)的标准接口。
这些函数主要包括:* 管理缓冲区(buffer. c)。
* 响应系统调用fcntl() 和ioctl()(fcntl.c and ioctl.c)。
* 将管道和文件输入/输出映射到索引节点和缓冲区(fifo.c, pipe.c)。
* 锁定和不锁定文件和记录(locks.c)。
* 映射名字到索引节点(namei.c, open.c)。
* 实现select( )函数(select . c)。
* 提供各种信息(stat.c)。
* 挂接和卸载文件系统(super.c)。
* 调用可执行代码和转存核心(exec.c)。
* 装入各种二进制格式(bin_fmt*.c)。
其中最主要的结构有inode_operations 和file_operations。
--------------------------------------------------------------------------------源码导读*Linux 如何维护它支持的文件系统中的文件*描述了虚拟文件系统(Virtual File System VFS )*解释了Linux 核心中真实的文件系统如何被支持Linux 的一个最重要的特点之一使它可以支持许多不同的文件系统。
Linux系统的好处 Linux的运行及相关基本概念
Linux是一个类Unix(Unix-like)的操作系统, 在1991年发行了它的第一个版本 在Linux内核维护网站上,“What is Linux?”
Portable Operating System Interface Standard 可移植操作系统接口标准 由IEEE制订,并由ISO接受为国际标准。 Institute for Electrical and Electronic Engineers 电气电子工程师学会[美] International Organization for Standardization 国际标准化组织 制定各行各业各种产品和服务的技术规范(国际标准)
什么是Linux? “Linux”在不同的语境下的含义 Linux发展简史 Linux操作系统的主要内容 Linux版本
内核版本 发行版本
Linux系统的好处 Linux的运行及相关基本概念
在不同的语境下,“Linux”具有不同的内涵,例 如:
1991年11月,芬兰赫尔辛基大学的学生 Linus Torvalds写了个小程序,后来取名为Linux,放在 互联网上。他表达了一个愿望,希望借此搞出一 个操作系统的“内核”来,这完全是一个偶然事 件 1993,在一批高水平黑客的参与下,诞生了Linux 1.0 版 1994年,Linux 的第一个商业发行版 Slackware 问 世
基于I386的Linux使用int 0x80进行系统调用
代码的运行 堆栈的概念 内核态与用户态 中断/异常/系统调用 虚拟内存
同时,公开的核心源码也吸引着无数的电脑爱好者和程序员;他们把解读和分析Linux的核心源码作为自己的最大兴趣,把修改Linux 源码和改造Linux系统作为自己对计算机技术追求的最大目标。
linux 内核空间 用户空间 跨空间回调函数
linux 内核空间用户空间跨空间回调函数Linux 内核空间、用户空间及跨空间回调函数Linux 是一个开源的操作系统内核,它将操作系统的核心功能实现为内核空间和用户空间两个部分。
在 Linux 操作系统中,内核空间和用户空间是通过上下文切换来进行交互的。
Linux 源代码分析
Linux内核(源代码分析苗彦超摘要:1系统启动1.1汇编代码head.S及以前设置CPU状态初值,创建进程0,建立进程堆栈:movq init_rsp(%rip), %rsp,init_rsp定义.globl init_rspinit_rsp:.quad init_thread_union+THREAD_SIZE-8即将虚地址init_thread_union+THREAD_SIZE-8作为当前进程(进程0)核心空间堆栈栈底,init_thread_union定义于文件arch/x86_64/kernel/init_task.c中:union thread_union init_thread_union __attribute__((__section__(".data.init_task"))) ={INIT_THREAD_INFO(init_task)};INIT_THREAD_INFO定义于文件include/asm-x86_64/thread_info.h中,初始化init_thread_union.task = &init_task,init_task同样定义于文件init_task.c中,初始化为:struct task_struct init_task = INIT_TASK(init_task);INIT_TASK宏在include/linux/init_task.h中定义。
全部利用编译时静态设置的初值,将进程0的控制结构设置完成,使进程0可以按普通核心进程访问。 = NULL; init_task.active_mm = INIT_MM(init_mm), init_m = “swapper”INIT_MM将init_mm.pgd初始化为swapper_pg_dir,即init_level4_pgt,定义与head.S中。
linux trace原理
linux trace原理
Linux Trace是一个Linux内核跟踪机制,它可以记录系统中发生的各种事件和操作,如系统调用、进程创建、文件操作等。
Linux Trace的原理可以分为以下几个方面:
1. 事件源:Linux Trace利用内核中的tracepoint机制来实现跟踪。
2. 事件记录:当事件发生时,Linux Trace会生成一个事件记录(trace event)。
3. 缓冲区管理:Linux Trace通过创建一个循环缓冲区来管理事件记录。
缓冲区分为多个段(buffer segment),每个段包含多个事件记录。
当一个段被填满时,Linux Trace会自动切换到下一个段,最后将填满的段写入到磁盘中。
4. 用户空间工具:为了方便用户使用和分析跟踪数据,Linux Trace提供了一些用户空间的工具,如trace-cmd和perf。
总的来说,Linux Trace的原理就是通过tracepoint机制捕获内核中的关键事件,将事件记录保存到缓冲区中,最后通过用户空间工具进行分析和可视化。
源码的版本号有一个非常简单的编号约定:任何偶数的核心(例如2.0.30)都是一个稳定地发行的核心,而任何奇数的核心(例如 2.1.42)都是一个开发中的核心。
核心源程序的文件按树形结构进行组织,在源程序树的最上层你会看到这样一些目录:· Arch :arch子目录包括了所有和体系结构相关的核心代码。
它的每一个子目录都代表一种支持的体系结构,例如i386就是关于intel cpu及与之相兼容体系结构的子目录。
PC机一般都基于此目录;· Include: include子目录包括编译核心所需要的大部分头文件。
与平台无关的头文件在 include/linux 子目录下,与 intel cpu相关的头文件在include/asm-i386子目录下,而include/scsi目录则是有关 scsi设备的头文件目录;· Init:这个目录包含核心的初始化代码(注:不是系统的引导代码),包含两个文件main.c和Version.c,这是研究核心如何工作的一个非常好的起点。
· Mm :这个目录包括所有独立于 cpu 体系结构的内存管理代码,如页式存储管理内存的分配和释放等;而和体系结构相关的内存管理代码则位于arch/*/mm/,例如arch/i386/mm/Fault.c· Kernel:主要的核心代码,此目录下的文件实现了大多数linux系统的内核函数,其中最重要的文件当属sched.c;同样,和体系结构相关的代码在arch/*/kernel中;· Drivers:放置系统所有的设备驱动程序;每种驱动程序又各占用一个子目录:如,/block 下为块设备驱动程序,比如ide(ide.c)。
kimage_entry_t *entry; kimage_entry_t *last_entry; unsigned long destination; unsigned long start; struct page *control_code_page; struct page *swap_page; unsigned long nr_segments; struct kexec_segment segment[KEXEC_SEGMENT_MAX]; /*段数组*/ struct list_head control_pages; struct list_head dest_pages; struct list_head unuseable_pages; /* 分配给崩溃内核的下一个控制页的地址*/ unsigned long control_page; /* 指定特殊处理的标识*/ unsigned int type : 1; #define KEXEC_TYPE_DEFAULT 0 #define KEXEC_TYPE_CRASH 1 unsigned int preserve_context : 1; };
内核 kexec 接口函数说明如下:
extern void machine_kexec(struct kimage *image); /*启动内核映像*/ extern int machine_kexec_prepare(struct kimage *image); /*建立内核映 像所需要的控制页*/ extern void machine_kexec_cleanup(struct kimage *image); extern asmlinkage long sys_kexec_load(unsigned long entry, unsigned long nr_segments, struct kexec_segment __user *segments, unsigned long flags); /*装 载内核的系统调用*/ extern int kernel_kexec(void); /*启动内核*/
进入源码所在目录,可以看到目录树顶层通常包含如下目录和文件:arch/ crypto/ fs/Kbuild MAINTAINERS README security/ virt/ block/ Documentation/ include/ Kconfig MakefileREPORTING-BUGSsound/ COPYING drivers/init/kernel/ mm/ samples/ tools/CREDITS firmware/ ipc/ lib/ net/ scripts/ usr/ 各个目录文件的简要说明如表1所列。
表1 Linux源码顶层目录简要说明目录内容arch/包含各体系结构特定的代码,如arm、x86、ia64、mips等,在每个体系结构目录下通常都有:-boot 内核需要的特定平台代码-kernel 体系结构特有的代码-lib 通用函数在特定体系结构的实现-math-emu 模拟FPU的代码,在ARM中,使用mach-xxx代替-mm 特定体系结构的内存管理实现-include 特定体系的头文件block/存放块设备相关代码crypto/存放加密、压缩、CRC校验等算法相关代码Documentation/存放相关说明文档,很多实用文档,包括驱动编写等drivers/存放Linux内核设备驱动程序源码。
[重点]linux源码分析linux源码分析Linux内核源代码中的C语言代码Linux 内核的主体是以 GNU的 C 语言编写的,GNU为此提供了编译工具gcc。
GNU对 C 语言本身(在 ANSI C 基础上)做了不少扩充,可能是读者尚未见到过的。
本书并非介绍 GNU C语言的专著,也非技术手册,所以不在这里一一列举和详细讨论这些扩充和技巧。
所以,我们在这里只是对可能会影响读者阅读 Linux 内核源程序,或使读者感到困惑的一些扩充和技巧先作一些简单的介绍。
首先,gcc 从 C++语言中吸收了“inline”和“const”。
其实,GNU 的 C 和C++是合为一体的,gcc既是 C 编译又是 C++编译,所以从 C++中吸收一些东西到 C 中是很自然的。
从功能上说,inline 函数的使用与#define 宏定义相似,但更有相对的独立性,也更安全。
使用 inline函数也有利于程序调试。
如果编译时不加优化,则这些inline 就是普通的、独立的函数,更便于调试。
调试好了以后,再采用优化重新编译一次,这些 inline函数就像宏操作一样融入了引用处的代码中,有利于提高运行效率。
由于 inline 函数的大量使用,相当一部分的代码从.c 文件移入了.h 文件中。
还有,为了支持 64 位的CPU结构(Alpha 就是 64 位的),gcc 增加了一种新的基本数据类型“longlong int”,该类型在内核代码中常常用到。
许多 C 语言都支持一些“属性描述符”(attribute),如“aligned”、“packed”等等;gcc 也支持不少这样的描述符。
这些描述符的使用等于是在 C 语言中增加了一些新的保留字。
Linux内核编程目录1.HELLO, WORLD ................................................................................................ 一EXHELLO.C .............................................................................................................. 一1.1内核模块的编译文件........................................................................................................ 二1.2多文件内核模块.................................................................................................................. 三2.字符设备文件 ....................................................................................................... 六2.1多内核版本源文件........................................................................................................ 十四3./PROC文件系统 .............................................................................................. 十五4.使用/PROC进行输入 ...................................................................................... 二十5.和设备文件对话(写和IOCTLS) ........................................................... 二十八6.启动参数 ....................................................................................................... 四十二7.系统调用 ....................................................................................................... 四十五8.阻塞进程 ....................................................................................................... 五十一9.替换PRINTK’S ........................................................................................... 六十一10.调度任务 ..................................................................................................... 六十四11.中断处理程序.............................................................................................. 六十九11.1I NTEL 结构上的键盘 ......................................................................................... 六十九12.对称多处理 ................................................................................................. 七十三常见的错误 ......................................................................................................... 七十四2.0和2.2版本的区别 ........................................................................................ 七十四除此以外.............................................................................................................. 七十四其他...................................................................................................................... 七十六G OODS AND S ERVICES..................................................................................................... 七十六GNU GENERAL PUBLIC LICENSE........................................................................ 七十六注.......................................................................................................................... 八十二1.Hello, world当第一个穴居的原始人程序员在墙上凿出第一个“洞穴计算机”的程序时,那是一个打印出用羚羊角上的图案表示的“Hello world”的程序。
一般来讲,在安装的linux 系统下,/usr/src/linux目录下的东西就是内核源代码。
对于linux内核源代码来讲,基本要求是:⑴操作系统的基本知识;⑵对C语言比较熟悉,最好要有汇编语言的知识和GNUC 对标准C的扩展的知识的了解。
在处理了分, 尤其是:
设置内存边界和调用 paging_init(); 初始化中断、IRQ 通道和调度; 分析(解析)命令行; 如果需要,就分配一个数据缓冲区(profiling buffer)以及其它一些小部分; 校正延迟循环(计算“ BogoMips” 数); 检查中断 16 是否能与协处理器工作。 最后,为了生成初始进程,内核准备好了移
至 move_to_user_mode(),它的代码也是在 同一个源代码文件中的。然后,所谓的空闲任务,进程号 0 就进入无限的空闲循环中运 行。 接着初始进程(init process)尝试着运行/etc/init、/bin/init 或者/sbin/init。 如果它们没有一个运行成功的,就会去执行代码“ /bin/sh /etc/rc” 并且在第一个终 端上生成一个根命令解释程序(root shell)。这段代码回溯至 Linux 0.01,当时操作系 统只有一个内核,并且没有登录进程。 在从一个标准的地方(让我们假定我们有)用 exec()执行了 init 初始化程序之后,内 核就对程序的执行没有了直接的控制。 从现在起它的规则是提供对系统调用的处理, 以及为 异步事件服务比如硬件中断等)任务的环境已经建立,现在起是 init 程序通过 fork() 派 ( 多 。 从 生出的系统进程和登录进程来管理多用户的访问了。 由于内核是负责提供服务的, 这个漫游文章将通过观察这些服务 “ 系统调用” ) ( 以及 通过提供基本数据结构的原理和代码的组织结构继续讨论下去。
第 1 9 页 页 共
Linux 内核源代码漫游
创建时间:2001-10-11 21 时 13 分
因为我对相应的代码不是很熟],在那里,所有 32 比特的设置启动被完成: IDT、GDT 以 及 LDT 被加载,处理器和协处理器也已确认,分页工作也设置好了;最终调用 start_kernel 子程序。 述操作的源代码是在 boot/head.S 中的,可能是整个内核中最有诀窍 上 这 的代码了。 注意如果在前述任何一步中出了错, 计算机就会死锁。 在操作系统还没有完全运转 之前 是处理不了出错的。 start_kernel()是位于 init/main.c 中的, 并且没有任何返回结果。 从现在起的任何代 码都是用 C 语言编制的,除了中断管理和系统调用的入/出代码(当然,还有大多数的宏 都 嵌入了汇编代码)。
第 2 9 页 页 共
Linux 内核源代码漫游
创建时间:2001-10-11 21 时 13 分
过在 kernel/sched.c 中的调度程序来改变。然而,由于所有的进程都必须访问它,所以使 用了宏 for_each_task。当系统负荷很轻时,它要比数组的顺序扫描快得多。 进程总是运行于“ 用户模式” 或“ 内核模式” 。用户程序的主体是运行于用户模式而其 中的系统调用则运行于内核模式中。 在这两种执行模式中进程所用的堆栈是不一样的 -- 常 规的堆栈段用于用户模式, 而一个固定大小的堆栈 (一页, 由该进程所有) 则用于内核模式。 内核堆栈页是从不交换出去的,因为每当一个系统调用进入时它就必须存在着。 内核中的系统调用(system calls)是作为 C 语言函数存在的,它们的‘ 正规’ 名称是 以‘ sys_’ 开头的。例如一个名为 burnout 的系统调用将调用内核函数 sys_burnout()。 系统调用机制在本手册的第三章中进行了讨论。观看在 include/linux/sched.h 中的 for_each_task 和 SET_LINKS 能够帮助理解进程表中的列表和树结构。
Linux 内核源代码漫游
创建时间:2001-10-11 21 时 13 分
Linux 内核源代码漫游
Alessandro Rubini 著, 赵 炯 译,gohigh@ ()
本章试图以顺序的方式来解释 Linux 源代码, 以帮助读者对源代码的体系结构以及很多 相关的 unix 特性的实现有一个很好的理解。目标是帮助对 Linux 不甚了解的有经验的 C 程 序员对整个 Linux 的设计有所了解。 这也就是为什么内核漫游的入点选择为内核本身的 启始 点:系统引导(启动)。 这份材料需要对 C 语言以及对 Unix 的概念和 PC 机的结构有很好的了解, 而本章中 然 并 没有出现任何的 C 代码, 而是直接参考 (指向) 实际的代码的。 有关内核设计的最佳篇 幅是 在本手册的其它章节中,而本章仍趋向于是一个非正式的概述。 本章中所参阅的任何文件的路径名都是指主源代码目录树,通常是/usr/src/linux。 这里所给出的大多数信息都是取之于 Linux 发行版 1.0 的源代码。虽然如此, 有 时也会提供对后期版本的参考。 这篇漫游中开头有 图标的任何小节都是强调 1.0 版 本 后对内核的新的改动。如果没有这样的小节存在,则表示直到版本 1.0.9-1.1.76,没 有作 过改动。 有时候本章中会有象这样的小节,这是指向正确的代码以对刚讨论过的主题取得 更多信息的指示符。当然,这里是指源代码。
当 PC 的电源打开后,80x86 结构的 CPU 将自动进入实模式,并从地址 0xFFFF0 开 始自 动执行程序代码,这个地址通常是 ROM-BIOS 中的地址。PC 机的 BIOS 将执行某些 系统的检 测, 在物理地址 0 处开始初始化中断向量。 此后, 它将可启动设备的第一个扇区 读入内存地 址 0x7C00 处,并跳转到这个地方。启动设备通常是软驱或是硬盘。这里的叙 述是非常简单 的,但这已经足够理解内核初始化的工作过程了。 Linux 的最最前面部分是用 8086 汇编语言编写的(boot/bootsect.S),它将由 BIOS 读 入到内存 0x7C00 处,当它被执行时就会把自己移到绝对地址 0x90000 处,并将启 动设备 (boot/setup.S)的下 2kB 字节的代码读入内存 0x90200 处, 而内核的其它部分则被读入到地 址 0x10000 处 。 在 系 统 加 载 期 间 将 显 示 信 息 "Loading..." 。 然 后 控 制 权 将 传 递 给 boot/Setup.S 中的代码,这是另一个实模式汇编语言程序。 启动部分识别主机的某些特性以及 vga 卡的类型。 如果需要, 它会要求用户为控制台选 择显示模式。然后将整个系统从地址 0x10000 移至 0x1000 处,进入保护模式并跳转至系 统 的余下部分(在 0x1000 处)。 下一步是内核的解压缩。0x1000 处的代码来自于 zBoot/head.S,它初始化寄存器并调 用 decompress_kernel(), 它们依次是由 zBoot/inflate.c、 zBoot/unzip.c 和 zBoot/misc.c 组 成。 被解压的数据存放到了地址 0x10000 处(1 兆), 这也是为什么 Linux 不能运行于少于 2 兆内存的主要原因。[在 1 兆内存中解压内核的工作已经完成,见 Memory Savers--ED] 将内核封装在一个 gzip 文件中的工作是由 zBoot 目录中的 Makefile 以及工具 完 成的。它们是值得一看的有趣的文件。 内核发行版 1.1.75 将 boot 和 zBoot 目录下移到了 arch/i386/boot 中了, 这个 改 动意味着对不同的体系结构允许真正的内核建造,不过我将仍然只讲解有关 i386 的信 息。 解压过的代码是从地址 0x10100 处开始执行的[这里我可能忘记了具体的物理地址 了,
在调用了 fork()之后, 有同一个程序的两个拷贝在运行了, 常一个程序使用 exec() 就 通 执行另一个程序。 exec()系统调用必须定位该执行文件的二进制映像, 加载并执行它。 词语 ‘ 加载’ 并不一定意味着 将二进制映像拷贝进内存” , “ 因为 Linux 支持按需加载。 exec() 的 Linux 实现支持不同的二进制格式。这是通过 linux_binfmt 结构来达到的,其中内嵌了 两个指向函数的指针--一个是用于加载可执行文件的, 另一个用于加载库函数, 每种二进制 格式都实现有这两个函数。共享库的加载是在 exec()同一个源程序中实现的,但我们只讨 论 exec()本身。 Unix 系统提供了六种 exec()函数。除了一个以外,所有都是以库函数 的 形式实现的, 并且, Linux 内核是单独实现 sys_execve()调用的。 它执行一个非常简单 的任 务:加载可执行文件的头部,并试着去执行它。如果头两个字节是“ #!” ,那么就会解 析该 可执行文件的第一行并调用一个解释器来执行它, 否则的话, 就会顺序地试用各个注册 过的 二进制格式。 Linux 本身的格式是由 fs/exec.c 直接支持的,并且相关的函数是
unix 系统是通过 fork()系统调用创建一个进程的,而进程的终止是通过 exit()或收到 一个信号来完成的。它们的 Linux 实现位于 kernel/fork.c 和 kernel/exit.c 中。 派生 出 一个进程是很容易的,所以 fork.c 程序很短并易于理解。它的主要任务是为新的进程 填写 数据结构。除了填写各个字段以外,相关的步骤有: 取得一个空闲内存页面来保存 task_struct 找到一个空闲的进程槽(find_empty_process()) 为内存堆栈页 kernel_stack_page 取得另一个空闲的内存页面 将父辈的 LDT 拷贝到子进程 复制父进程的 mmap 信息 sys_fork() 同样也管理文件描述符和 inode。 1.0 的内核也对线程提供某些不够完善的支持, 所以 fork()系统调用对此也给出了 某些示意。内核的线程是主流内核以外的过程产品。 从一个进程中退出是比较有窍门的,因为父进程必须被通告有关任何子进程的退出。而 且,一个进程可以由另外一个进程使用 kill()而退出(这些是 Unix 的特性),所以除了 sys_exit()之外,sys_kill()以及 sys_wait()的各种特性也存在于 exit.c 之中了。 这里不对 exit.c 的代码加以讨论---因为它一点也不令人感兴趣。 为了以一致的状态退 出系统, 它涉及到许多细节。 POSIX 标准对于信号则是要求相当严格的, 而 所以这里必须对 其加以叙述。