亚洲成a人片在线观,亚洲无码不需下载安装免费视频

在《漫畫(huà)解說(shuō)內(nèi)存映射》一文中介紹過(guò) 虛擬內(nèi)存 與 物理內(nèi)存 映射的原理與過(guò)程，虛擬內(nèi)存與物理內(nèi)存進(jìn)行映射的過(guò)程被稱(chēng)為 內(nèi)存映射。內(nèi)存映射是硬件（內(nèi)存管理單元）級(jí)別的功能，必須按照硬件的規(guī)范設(shè)置好內(nèi)存映射的關(guān)系，進(jìn)程才能正常運(yùn)行。

但內(nèi)存映射并不能區(qū)分內(nèi)存的用途，比如我們想知道虛擬內(nèi)存區(qū)間 0 ~ 2MB 是用作存儲(chǔ)數(shù)據(jù)還是存儲(chǔ)指令，這就很難從內(nèi)存映射中獲取到相關(guān)信息。所以，Linux 根據(jù)功能上的差異，來(lái)對(duì)虛擬內(nèi)存空間進(jìn)行管理。

今天，我們來(lái)介紹一下 Linux 對(duì)虛擬內(nèi)存空間管理的細(xì)節(jié)。

段

之前我們說(shuō)過(guò)，在 32 位的操作系統(tǒng)中，每個(gè)進(jìn)程都擁有 4GB 的虛擬內(nèi)存空間。Linux 根據(jù)功能上的差異，把整個(gè)虛擬內(nèi)存空間劃分為多個(gè)不同區(qū)間，稱(chēng)為 段。

我們先來(lái)看看 Linux 進(jìn)程虛擬內(nèi)存空間的布局圖，如圖 1 所示：

上圖展示了 Linux 進(jìn)程的虛擬內(nèi)存空間布局情況，我們只關(guān)注 用戶空間 的布局。

從上圖可以看出，進(jìn)程的用戶空間大小為 3GB。Linux 按照功能上的差異，把一個(gè)進(jìn)程的用戶空間劃分為多個(gè)段，下面介紹一下各個(gè)段的作用：

代碼段：用于存放程序中可執(zhí)行代碼的段。
數(shù)據(jù)段：用于存放已經(jīng)初始化的全局變量或靜態(tài)變量的段。如在 C 語(yǔ)言中，使用語(yǔ)句 int global = 10; 定義的全局變量。
未初始化數(shù)據(jù)段：用于存放未初始化的全局變量或靜態(tài)變量的段。如在 C 語(yǔ)言中，使用語(yǔ)句 int global; 定義的全局變量。
堆：用于存放使用 malloc 函數(shù)申請(qǐng)的內(nèi)存。
mmap區(qū)：用于存放使用 mmap 函數(shù)映射的內(nèi)存區(qū)。
棧：用于存放函數(shù)局部變量和函數(shù)參數(shù)。

虛擬內(nèi)存區(qū)

從上面的介紹可知，Linux 按照功能上的差異，把虛擬內(nèi)存空間劃分為多個(gè) 段。那么在內(nèi)核中，是通過(guò)什么結(jié)構(gòu)來(lái)管理這些段的呢？

答案就是：vm_area_struct。

內(nèi)核通過(guò) vm_area_struct 結(jié)構(gòu)（虛擬內(nèi)存區(qū)）來(lái)管理各個(gè) 段，其定義如下：

 1struct?vm_area_struct?{
 2????struct?mm_struct?*vm_mm;?/*?The?address?space?we?belong?to.?*/
 3????unsigned?long?vm_start;??/*?Our?start?address?within?vm_mm.?*/
 4????unsigned?long?vm_end;????/*?The?first?byte?after?our?end?address?within?vm_mm.?*/
 5
 6????/*?linked?list?of?VM?areas?per?task,?sorted?by?address?*/
 7????struct?vm_area_struct?*vm_next;
 8
 9????pgprot_t?vm_page_prot;???/*?Access?permissions?of?this?VMA.?*/
10????unsigned?long?vm_flags;??/*?Flags,?see?mm.h.?*/
11????struct?rb_node?vm_rb;
12????...
13????/*?Function?pointers?to?deal?with?this?struct.?*/
14????const?struct?vm_operations_struct?*vm_ops;
15????...
16};

下面介紹一下各個(gè)字段的作用：

vm_mm：指向進(jìn)程的內(nèi)存管理對(duì)象，每個(gè)進(jìn)程都有一個(gè)類(lèi)型為 mm_struct 的內(nèi)存管理對(duì)象，用于管理進(jìn)程的虛擬內(nèi)存空間和內(nèi)存映射等。
vm_start：虛擬內(nèi)存區(qū)的起始虛擬內(nèi)存地址。
vm_end：虛擬內(nèi)存區(qū)的結(jié)束虛擬內(nèi)存地址。
vm_next：Linux 會(huì)通過(guò)鏈表把進(jìn)程的所有虛擬內(nèi)存區(qū)連接起來(lái)，這個(gè)字段用于指向下一個(gè)虛擬內(nèi)存區(qū)。
vm_page_prot：主要用于保存當(dāng)前虛擬內(nèi)存區(qū)所映射的物理內(nèi)存頁(yè)的讀寫(xiě)權(quán)限。
vm_flags：標(biāo)識(shí)當(dāng)前虛擬內(nèi)存區(qū)的功能特性。
vm_rb：某些場(chǎng)景中需要通過(guò)虛擬內(nèi)存地址查找對(duì)應(yīng)的虛擬內(nèi)存區(qū)，為了加速查找過(guò)程，內(nèi)核以虛擬內(nèi)存地址作為key，把進(jìn)程所有的虛擬內(nèi)存區(qū)保存到一棵紅黑樹(shù)中，而這個(gè)字段就是紅黑樹(shù)的節(jié)點(diǎn)結(jié)構(gòu)。
vm_ops：每個(gè)虛擬內(nèi)存區(qū)都可以自定義一套操作接口，通過(guò)操作接口，能夠讓虛擬內(nèi)存區(qū)實(shí)現(xiàn)一些特定的功能，比如：把虛擬內(nèi)存區(qū)映射到文件。而 vm_ops 字段就是虛擬內(nèi)存區(qū)的操作接口集，一般在創(chuàng)建虛擬內(nèi)存區(qū)時(shí)指定。

我們通過(guò)圖 2 來(lái)展示內(nèi)核是怎么通過(guò) vm_area_struct 結(jié)構(gòu)來(lái)管理進(jìn)程中的所有 段：

從上圖可以看出，內(nèi)核通過(guò)一個(gè)鏈表和一棵紅黑樹(shù)來(lái)管理進(jìn)程中所有的 段。mm_struct 結(jié)構(gòu)的 mmap 字段就是鏈表的頭節(jié)點(diǎn)，而 mm_rb 字段就是紅黑樹(shù)的根節(jié)點(diǎn)。

加載程序鏡像

前面我們介紹了 Linux ?會(huì)把虛擬內(nèi)存地址劃分為多個(gè) 段，并且使用 vm_area_struct 結(jié)構(gòu)來(lái)管理這些段。那么，這些虛擬內(nèi)存區(qū)是怎么建立起來(lái)的呢？

在介紹進(jìn)程虛擬內(nèi)存區(qū)建立的過(guò)程前，我們先來(lái)簡(jiǎn)單介紹一下 ELF文件格式。

1. ELF文件

ELF 全稱(chēng) Executable and Linkable Format，即可執(zhí)行可鏈接文件格式。在 Linux 系統(tǒng)中，就是使用這種文件格式來(lái)存儲(chǔ)一個(gè)可執(zhí)行的應(yīng)用程序。讓我們來(lái)看一下 ELF 文件格式由哪些結(jié)構(gòu)組成：

一般一個(gè) ELF 文件由以下三部分組成：

ELF 頭（ELF header）：描述應(yīng)用程序的類(lèi)型、CPU架構(gòu)、入口地址、程序頭表偏移和節(jié)頭表偏移等等；
程序頭表（Program header table）：列舉了所有有效的段（segments）和他們的屬性，程序頭表需要加載器將文件中的段加載到虛擬內(nèi)存段中；
節(jié)頭表（Section header table）：包含對(duì)節(jié)（sections）的描述。

ELF 文件的結(jié)構(gòu)大概如圖3所示：

當(dāng)內(nèi)核加載一個(gè)應(yīng)用程序時(shí)，就是通過(guò)讀取 ELF 文件的信息，然后把文件中所有的段加載到虛擬內(nèi)存的段中。ELF 文件通過(guò) 程序頭表 來(lái)描述應(yīng)用程序中所有的段，表中的每一個(gè)項(xiàng)都描述一個(gè)段的信息。我們先來(lái)看看 程序頭表 項(xiàng)的結(jié)構(gòu)定義：

 1typedef?struct?elf64_phdr?{
 2???Elf64_Word?p_type;?????//?段的類(lèi)型
 3???Elf64_Word?p_flags;????//?可讀寫(xiě)標(biāo)志
 4???Elf64_Off?p_offset;????//?段在ELF文件中的偏移量
 5???Elf64_Addr?p_vaddr;????//?段的虛擬內(nèi)存地址
 6???Elf64_Addr?p_paddr;????//?段的物理內(nèi)存地址
 7???Elf64_Xword?p_filesz;??//?段占用文件的大小
 8???Elf64_Xword?p_memsz;???//?段占用內(nèi)存的大小
 9???Elf64_Xword?p_align;???//?內(nèi)存對(duì)齊
10}?Elf64_Phdr;

所以，程序加載器可以通過(guò) ELF 頭中獲取到程序頭表的偏移量，然后通過(guò)程序頭表的偏移量讀取到程序頭表的數(shù)據(jù)，再通過(guò)程序頭表來(lái)獲取到所有段的信息。

我們可以通過(guò) readelf -S file 命令來(lái)查看 ELF 文件的段（節(jié)）信息，如下圖所示：

上面列出了 代碼段、數(shù)據(jù)段、未初始化數(shù)據(jù)段 和 注釋段 的信息。

2. 加載過(guò)程

要加載一個(gè)程序，需要調(diào)用 execve 系統(tǒng)調(diào)用來(lái)完成。我們來(lái)看看 execve 系統(tǒng)調(diào)用的調(diào)用棧：

1sys_execve
2└→?do_execve
3??└→?do_execveat_common
4?????└→?__do_execve_file
5????????└→?exec_binprm
6???????????└→?search_binary_handler
7??????????????└→?load_elf_binary

從上面的調(diào)用者可以看出，execve 系統(tǒng)調(diào)用最終會(huì)調(diào)用 load_elf_binary 函數(shù)來(lái)加載程序的 ELF 文件。

由于 load_elf_binary 函數(shù)的實(shí)現(xiàn)比較復(fù)雜，所以我們分段來(lái)解說(shuō)：

（1）讀取并檢查ELF頭

 1static?int?load_elf_binary(struct?linux_binprm?*bprm,?struct?pt_regs?*regs)
 2{
 3?? ...
 4???struct?{
 5???????struct?elfhdr?elf_ex;
 6???????struct?elfhdr?interp_elf_ex;
 7?? }?*loc;
 8
 9???loc?=?kmalloc(sizeof(*loc),?GFP_KERNEL);
10???if?(!loc)?{
11???????retval?=?-ENOMEM;
12???????goto?out_ret;
13? ?}
14
15???//?1.?獲取ELF頭
16???loc->elf_ex?=?*((struct?elfhdr?*)bprm->buf);
17
18???retval?=?-ENOEXEC;
19???//?2.?檢查ELF簽名是否正確
20???if?(memcmp(loc->elf_ex.e_ident,?ELFMAG,?SELFMAG)?!=?0)
21???????goto?out;
22
23???//?3.?是否是可執(zhí)行文件或者動(dòng)態(tài)庫(kù)
24???if?(loc->elf_ex.e_type?!=?ET_EXEC?&&?loc->elf_ex.e_type?!=?ET_DYN)
25???????goto?out;
26
27???//?4.?檢查系統(tǒng)架構(gòu)是否正確
28???if?(!elf_check_arch(&loc->elf_ex))
29???????goto?out;
30?? ...

上面這段代碼主要是讀取應(yīng)用程序的 ELF 頭，然后檢查 ELF 頭信息是否合法。

（2）讀取程序頭表

 1???size?=?loc->elf_ex.e_phnum?*?sizeof(struct?elf_phdr);?//?程序頭表的大小
 2???retval?=?-ENOMEM;
 3
 4???elf_phdata?=?kmalloc(size,?GFP_KERNEL);?//?申請(qǐng)一塊內(nèi)存來(lái)保存程序頭表
 5???if?(!elf_phdata)
 6???????goto?out;
 7
 8//?從ELF文件中讀取程序頭表的數(shù)據(jù),?并且保存到?elf_phdata?變量中
 9???retval?=?kernel_read(bprm->file,?loc->elf_ex.e_phoff,?(char?*)elf_phdata,?size);
10???if?(retval?!=?size)?{
11???????if?(retval?>=?0)
12???????????retval?=?-EIO;
13???????goto?out_free_ph;
14??}
15??...

上面的代碼主要完成以下幾個(gè)工作：

從 ELF 頭的信息中獲取到程序頭表的大小。
調(diào)用 kmalloc 函數(shù)申請(qǐng)一塊內(nèi)存來(lái)保存程序頭表。
調(diào)用 kernel_read 函數(shù)從 ELF 文件中讀取程序頭表的數(shù)據(jù)，保存到 elf_phdata 變量中，程序頭表的偏移量可以通過(guò) ELF 頭的 e_phoff 字段獲取。

（3）加載段到虛擬內(nèi)存

 1???//?遍歷程序頭表所有的段
 2???for?(i?=?0,?elf_ppnt?=?elf_phdata;?i?elf_ex.e_phnum;?i++,?elf_ppnt++)?{
 3???????int?elf_prot?=?0,?elf_flags;
 4???????unsigned?long?k,?vaddr;
 5
 6???????if?(elf_ppnt->p_type?!=?PT_LOAD)??//?判斷段是否需要加載
 7???????????continue;
 8??????...
 9???????//?段的可讀寫(xiě)權(quán)限
10???????if?(elf_ppnt->p_flags?&?PF_R)
11???????????elf_prot?|=?PROT_READ;
12???????if?(elf_ppnt->p_flags?&?PF_W)
13???????????elf_prot?|=?PROT_WRITE;
14???????if?(elf_ppnt->p_flags?&?PF_X)
15???????????elf_prot?|=?PROT_EXEC;
16
17???????elf_flags?=?MAP_PRIVATE?|?MAP_DENYWRITE?|?MAP_EXECUTABLE;
18
19???????vaddr?=?elf_ppnt->p_vaddr;??//?獲取段的虛擬內(nèi)存地址
20??????...
21???????//?把段加載到虛擬內(nèi)存
22???????error?=?elf_map(bprm->file,?load_bias?+?vaddr,?elf_ppnt,?elf_prot,?elf_flags,?0);
23??????...
24??}

上面這段代碼主要完成的工作是：

遍歷程序頭表所有的段。
判斷段是否需要加載。
獲取段的可讀寫(xiě)權(quán)限和段的虛擬內(nèi)存地址。
調(diào)用 elf_map 函數(shù)把段加載到虛擬內(nèi)存。

所以，把段加載到虛擬內(nèi)存主要通過(guò) elf_map 函數(shù)完成。我們來(lái)看看 elf_map 函數(shù)的調(diào)用棧：

1elf_map
2└→?do_mmap
3???└→?do_mmap_pgoff
4??????└→?mmap_region

從上面的調(diào)用者可以看出，elf_map 函數(shù)最終會(huì)調(diào)用 mmap_region 來(lái)完成加載段到虛擬內(nèi)存。我們分析一下 mmap_region 函數(shù)的實(shí)現(xiàn)：

 1unsigned?long
 2mmap_region(struct?file?*file,?unsigned?long?addr,?unsigned?long?len,
 3???????????unsigned?long?flags,?unsigned?int?vm_flags,?unsigned?long?pgoff)
 4{
 5???struct?mm_struct?*mm?=?current->mm;
 6???struct?vm_area_struct?*vma,?*prev;
 7??...
 8???//?申請(qǐng)一個(gè)?vm_area_struct?結(jié)構(gòu)
 9???vma?=?kmem_cache_zalloc(vm_area_cachep,?GFP_KERNEL);
10???if?(!vma)?{
11???????error?=?-ENOMEM;
12???????goto?unacct_error;
13??}
14
15???//?設(shè)置?vm_area_struct?結(jié)構(gòu)各個(gè)字段的值
16???vma->vm_mm?=?mm;
17???vma->vm_start?=?addr;????????//?段的開(kāi)始虛擬內(nèi)存地址
18???vma->vm_end?=?addr?+?len;????//?段的結(jié)束虛擬內(nèi)存地址
19???vma->vm_flags?=?vm_flags;????//?段的功能特性
20???vma->vm_page_prot?=?vm_get_page_prot(vm_flags);
21???vma->vm_pgoff?=?pgoff;
22
23??...
24???//?把?vm_area_struct?結(jié)構(gòu)連接到虛擬內(nèi)存區(qū)鏈表和紅黑樹(shù)中
25???vma_link(mm,?vma,?prev,?rb_link,?rb_parent);
26??...
27
28???return?addr;
29}

上面代碼對(duì) mmap_region 函數(shù)進(jìn)行了精簡(jiǎn)，精簡(jiǎn)后的工作主要有：

調(diào)用 kmem_cache_zalloc 函數(shù)申請(qǐng)一個(gè) vm_area_struct（虛擬內(nèi)存區(qū)）結(jié)構(gòu)。
設(shè)置 vm_area_struct 結(jié)構(gòu)各個(gè)字段的值。
調(diào)用 vma_link 函數(shù)把 vm_area_struct 結(jié)構(gòu)連接到虛擬內(nèi)存區(qū)鏈表和紅黑樹(shù)中。

通過(guò)上面的過(guò)程，內(nèi)核就把應(yīng)用程序的所有段加載到虛擬內(nèi)存中。

總結(jié)

本文主要介紹了 Linux 內(nèi)核是怎么加載應(yīng)用程序，并且在虛擬內(nèi)存中建立各個(gè)段的布局。本文主要關(guān)注的是虛擬內(nèi)存布局的建立過(guò)程，但加載應(yīng)用程序的很多細(xì)節(jié)都忽略了（如怎么設(shè)置進(jìn)程入口），有興趣可以自行查閱相關(guān)的資料和書(shū)籍。

完全剖析 - Linux虛擬內(nèi)存空間管理

段

虛擬內(nèi)存區(qū)

加載程序鏡像

1. ELF文件

2. 加載過(guò)程

總結(jié)