linux内核分析---系统调用实现代码分析
作者:e4gle
by e4gle
from http://e4gle.org
2001年6月5日
启动早就读完,现在为了写笔记再从启动之后粗略的大体读一遍,基本就是几个大模块:启动和初始化,
中断信号,进程及调度,内存管理,文件系统,网络,驱动和模块等,我主要也从这几块入手。由于启动
部分在start_kernel之前牵涉到大量的x86体系相关的汇编知识,需要大量的时间,于是我跳过,先把握
整个系统的大体脉络,然后做二次,三次分析。网络部分的分析,我会从4.4BSD-Lite的代码中分析。
系统调用:
先说一下系统调用,奇怪的很,所有的读核资料都没有把系统调用单独提出来说,我觉得还是比较重要的
。用户和系统内核通信的关键的枢纽,不过分吧,呵呵。仔细研究一下它的机制,准备花三天时间,手头
有些书和资料,帮助我理解。
概念:(明晰一下基本概念)
系统调用发生在用户进程,通过一些特殊的函数(如open)来请求内核提供服务,这时,用户进程挂起,
内核验证用户请求,尝试之行,并把结果反馈给用户进程,接着用户进程重新启动。这些机制在一般的编
程书里都有,我就是来通过源代码的实现来讨论这种机制。
具体实现代码:arch/i386/kernel/entry.S(内核版本2.2.14)
从entry.S的第171行,就是system_call开始,171-248行代码贴出来,分析以注释形式:
ENTRY(system_call) \\所有系统调用的入口点,参数system_call是所希望激活的系统调用的数
pushl %eax# 保存orig_eax,这个值就是希望系统调用数
SAVE_ALL
/*SAVE_ALL宏定义如下:
#define SAVE_ALL cld; pushl %es; pushl %ds; pushl %eax; pushl %ebp; pushl %edi; pushl %esi; pushl %edx; pushl %ecx; pushl %ebx; movl $(__KERNEL_DS),%edx; movl %dx,%ds; movl %dx,%es;
他的作用是先把所有寄存器的值压栈,然后在system_call返回之前使用RESTORE_ALL把栈从栈中弹出
,在这其中system_call可以根据需要子去使用寄存器的值。任何它调用的c函数都可以从栈中查找到所希
望的参数,因为SAVE_ALL已经把所有寄存器的值都压入栈中了 */
--------------------------------------------------------------------------------------------
GET_CURRENT(%ebx) /*利用GET_CURRENT宏从ebx中取得当前任务指针,GET_CURRENT宏定义
如下:
#define GET_CURRENT(reg) movl %esp, reg; andl $-8192, reg;这段代码应该很好理解,把esp指移到reg变量,减去8129得到当前任务地址
*/
--------------------------------------------------------------------------------------------
cmpl $(NR_syscalls),%eax /*察看保存在eax中的系统调用数是否超过最大数(常数NR_syscalls代表系统调用的最大数)如果确实超过了,请看下面一句:jae badsys,程序则跳转到badsys
。*/
jae badsys
testb $0x20,flags(%ebx)# PF_TRACESYS/*检查系统调用是否正在被跟踪*/
jne tracesys /*如果系统调用被跟踪,则程序跳转到tracesys*/
call *SYMBOL_NAME(sys_call_table)(,%eax,4)/*调用系统函数*/
/*SYMBOL_NAME宏不处理任何工作,只是简单的被文本参数(也就是系统调用名)所替换,所以可以忽略
sys_call_table也定义在entry.S(373行)中,是一张由指向实现各种系统调用的内核函数的函数指针组
成的表:
ENTRY(sys_call_table)
.long SYMBOL_NAME(sys_ni_syscall)/* 0 - old "setup()" system call*/
.long SYMBOL_NAME(sys_exit)
.long SYMBOL_NAME(sys_fork)
.long SYMBOL_NAME(sys_read)
.long SYMBOL_NAME(sys_write)
.long SYMBOL_NAME(sys_open)/* 5 */
.long SYMBOL_NAME(sys_close)
.long SYMBOL_NAME(sys_waitpid)
.long SYMBOL_NAME(sys_creat)
.long SYMBOL_NAME(sys_link)
.long SYMBOL_NAME(sys_unlink)/* 10 */
.long SYMBOL_NAME(sys_execve)
.long SYMBOL_NAME(sys_chdir)
.long SYMBOL_NAME(sys_time)
.long SYMBOL_NAME(sys_mknod)
.long SYMBOL_NAME(sys_chmod)/* 15 */
.long SYMBOL_NAME(sys_lchown)
.long SYMBOL_NAME(sys_ni_syscall)/* old break syscall holder */
.long SYMBOL_NAME(sys_stat)
.long SYMBOL_NAME(sys_lseek)
.long SYMBOL_NAME(sys_getpid)/* 20 */
.long SYMBOL_NAME(sys_mount)
.long SYMBOL_NAME(sys_oldumount)
.long SYMBOL_NAME(sys_setuid)
.long SYMBOL_NAME(sys_getuid)
.long SYMBOL_NAME(sys_stime)/* 25 */
.long SYMBOL_NAME(sys_ptrace)
.long SYMBOL_NAME(sys_alarm)
.long SYMBOL_NAME(sys_fstat)
.long SYMBOL_NAME(sys_pause)
.long SYMBOL_NAME(sys_utime)/* 30 */
.long SYMBOL_NAME(sys_ni_syscall)/* old stty syscall holder */
.long SYMBOL_NAME(sys_ni_syscall)/* old gtty syscall holder */
.long SYMBOL_NAME(sys_access)
.long SYMBOL_NAME(sys_nice)
.long SYMBOL_NAME(sys_ni_syscall)/* 35 */ /* old ftime syscall holder */
.long SYMBOL_NAME(sys_sync)
.long SYMBOL_NAME(sys_kill)
.long SYMBOL_NAME(sys_rename)
.long SYMBOL_NAME(sys_mkdir)
.long SYMBOL_NAME(sys_rmdir)/* 40 */
.long SYMBOL_NAME(sys_dup)
.long SYMBOL_NAME(sys_pipe)
.long SYMBOL_NAME(sys_times)
.long SYMBOL_NAME(sys_ni_syscall)/* old prof syscall holder */
.long SYMBOL_NAME(sys_brk)/* 45 */
.long SYMBOL_NAME(sys_setgid)
.long SYMBOL_NAME(sys_getgid)
.long SYMBOL_NAME(sys_signal)
.long SYMBOL_NAME(sys_geteuid)
.long SYMBOL_NAME(sys_getegid)/* 50 */
.long SYMBOL_NAME(sys_acct)
.long SYMBOL_NAME(sys_umount)/* recycled never used phys() */
.long SYMBOL_NAME(sys_ni_syscall)/* old lock syscall holder */
.long SYMBOL_NAME(sys_ioctl)
.long SYMBOL_NAME(sys_fcntl)/* 55 */
.long SYMBOL_NAME(sys_ni_syscall)/* old mpx syscall holder */
.long SYMBOL_NAME(sys_setpgid)
.long SYMBOL_NAME(sys_ni_syscall)/* old ulimit syscall holder */
.long SYMBOL_NAME(sys_olduname)
.long SYMBOL_NAME(sys_umask)/* 60 */
.long SYMBOL_NAME(sys_chroot)
.long SYMBOL_NAME(sys_ustat)
.long SYMBOL_NAME(sys_dup2)
.long SYMBOL_NAME(sys_getppid)
.long SYMBOL_NAME(sys_getpgrp)/* 65 */
.long SYMBOL_NAME(sys_setsid)
.long SYMBOL_NAME(sys_sigaction)
.long SYMBOL_NAME(sys_sgetmask)
.long SYMBOL_NAME(sys_ssetmask)
.long SYMBOL_NAME(sys_setreuid)/* 70 */
.long SYMBOL_NAME(sys_setregid)
.long SYMBOL_NAME(sys_sigsuspend)
.long SYMBOL_NAME(sys_sigpending)
.long SYMBOL_NAME(sys_sethostname)
.long SYMBOL_NAME(sys_setrlimit)/* 75 */
.long SYMBOL_NAME(sys_getrlimit)
.long SYMBOL_NAME(sys_getrusage)
.long SYMBOL_NAME(sys_gettimeofday)
.long SYMBOL_NAME(sys_settimeofday)
.long SYMBOL_NAME(sys_getgroups)/* 80 */
.long SYMBOL_NAME(sys_setgroups)
.long SYMBOL_NAME(old_select)
.long SYMBOL_NAME(sys_symlink)
.long SYMBOL_NAME(sys_lstat)
.long SYMBOL_NAME(sys_readlink)/* 85 */
.long SYMBOL_NAME(sys_uselib)
.long SYMBOL_NAME(sys_swapon)
.long SYMBOL_NAME(sys_reboot)
.long SYMBOL_NAME(old_readdir)
.long SYMBOL_NAME(old_mmap)/* 90 */
.long SYMBOL_NAME(sys_munmap)
.long SYMBOL_NAME(sys_truncate)
.long SYMBOL_NAME(sys_ftruncate)
.long SYMBOL_NAME(sys_fchmod)
.long SYMBOL_NAME(sys_fchown)/* 95 */
.long SYMBOL_NAME(sys_getpriority)
.long SYMBOL_NAME(sys_setpriority)
.long SYMBOL_NAME(sys_ni_syscall)/* old profil syscall holder */
.long SYMBOL_NAME(sys_statfs)
.long SYMBOL_NAME(sys_fstatfs)/* 100 */
.long SYMBOL_NAME(sys_ioperm)
.long SYMBOL_NAME(sys_socketcall)
.long SYMBOL_NAME(sys_syslog)
.long SYMBOL_NAME(sys_setitimer)
.long SYMBOL_NAME(sys_getitimer)/* 105 */
.long SYMBOL_NAME(sys_newstat)
.long SYMBOL_NAME(sys_newlstat)
.long SYMBOL_NAME(sys_newfstat)
.long SYMBOL_NAME(sys_uname)
.long SYMBOL_NAME(sys_iopl)/* 110 */
.long SYMBOL_NAME(sys_vhangup)
.long SYMBOL_NAME(sys_idle)
.long SYMBOL_NAME(sys_vm86old)
.long SYMBOL_NAME(sys_wait4)
.long SYMBOL_NAME(sys_swapoff)/* 115 */
.long SYMBOL_NAME(sys_sysinfo)
.long SYMBOL_NAME(sys_ipc)
.long SY