深入理解Linux中内存管理

作者：网络转载发布时间：[ 2013/6/24 10:29:01 ] 推荐标签：

　　前一段时间看了《深入理解Linux内核》对其中的内存管理部分花了不少时间，但是还是有很多问题不是很清楚，近又花了一些时间复习了一下，在这里记录下自己的理解和对Linux中内存管理的一些看法和认识。

　　我比较喜欢搞清楚一个技术本身的发展历程，简而言之是这个技术是怎么发展而来的，在这个技术之前存在哪些技术，这些技术有哪些特点，为什么会被目前的技术所取代，而目前的技术又解决了之前的技术所存在的哪些问题。弄清楚了这些，我们才能比较清晰的把握某一项技术。有些资料在介绍某个概念的时候直接介绍这个概念的意义，原理，而对其发展过程和背后的原理丝毫不提，仿佛这个技术从天上掉下来的一样。介于此，还是以内存管理的发展历程来讲述的主题。

　　首先，我必须要阐述一下这篇文章的主题是Linux内存管理中的分段和分页技术。

　　让我们来回顾一下历史，在早期的计算机中，程序是直接运行在物理内存上的。换句话说，是程序在运行的过程中访问的都是物理地址。如果这个系统只运行一个程序，那么只要这个程序所需的内存不要超过该机器的物理内存不会出现问题，我们也不需要考虑内存管理这个麻烦事了，反正你一个程序，这么点内存，吃不吃得饱那是你的事情了。然而现在的系统都是支持多任务，多进程的，这样CPU以及其他硬件的利用率会更高，这个时候我们要考虑到将系统内有限的物理内存如何及时有效的分配给多个程序了，这个事情本身我们称之为内存管理。

　　下面举一个早期的计算机系统中，内存分配管理的例子，以便于大家理解。

　　加入我们有三个程序，程序1，2，3.程序1运行的过程中需要10M内存，程序2运行的过程中需要100M内存，而程序3运行的过程中需要20M内存。如果系统同时需要运行程序A和B，那么早期的内存管理过程大概是这样的，将物理内存的前10M分配给A，接下来的10M-110M分配给B。这种内存管理的方法比较直接，好了，假设我们这个时候想让程序C也运行，同时假设我们系统的内存只有128M，显然按照这种方法程序C由于内存不够是不能够运行的。大家知道可以使用虚拟内存的技术，内存空间不够的时候可以将程序不需要用到的数据交换到磁盘空间上去，已达到扩展内存空间的目的。下面我们来看看这种内存管理方式存在的几个比较明显的问题。像文章一开始提到的，要很深层次的把握某个技术好搞清楚其发展历程。

　　1、进程地址空间不能隔离

　　由于程序直接访问的是物理内存，这个时候程序所使用的内存空间不是隔离的。举个例子，像上面说的A的地址空间是0-10M这个范围内，但是如果A中有一段代码是操作10M-128M这段地址空间内的数据，那么程序B和程序C很可能会崩溃（每个程序都可以系统的整个地址空间）。这样很多恶意程序或者是木马程序可以轻而易举的破快其他的程序，系统的安全性也得不到保障了，这对用户来说也是不能容忍的。

　　2、内存使用的效率低

　　如上面提到的，如果我们要像让程序A、B、C同时运行，那么的方法是使用虚拟内存技术将一些程序暂时不用的数据写到磁盘上，在需要的时候再从磁盘读回内存。这里程序C要运行，将A交换到磁盘上去显然是不行的，因为程序是需要连续的地址空间的，程序C需要20M的内存，而A只有10M的空间，所以需要将程序B交换到磁盘上去，而B足足有100M，可以看到为了运行程序C我们需要将100M的数据从内存写到磁盘，然后在程序B需要运行的时候再从磁盘读到内存，我们知道IO操作比较耗时，所以这个过程效率将会十分低下。

　　3、程序运行的地址不能确定

　　程序每次需要运行时，都需要在内存中非配一块足够大的空闲区域，而问题是这个空闲的位置是不能确定的，这会带来一些重定位的问题，重定位的问题确定是程序中引用的变量和函数的地址，如果有不明白童鞋可以去查查编译愿意方面的资料。

　　内存管理无非是想办法解决上面三个问题，如何使进程的地址空间隔离，如何提高内存的使用效率，如何解决程序运行时的重定位问题？

　　这里引用计算机界一句无从考证的名言：“计算机系统里的任何问题都可以靠引入一个中间层来解决。”

　　现在的内存管理方法是在程序和物理内存之间引入了虚拟内存这个概念。虚拟内存位于程序和屋里内存之间，程序只能看见虚拟内存，再也不能直接访问物理内存。每个程序都有自己独立的进程地址空间，这样做到了进程隔离。这里的进程地址空间是指虚拟地址。顾名思义既然是虚拟地址，也是虚的，不是现实存在的地址空间。

　　既然我们在程序和物理地址空间之间增加了虚拟地址，那么要解决怎么从虚拟地址映射到物理地址，因为程序终肯定是运行在物理内存中的，主要有分段和分页两种技术。

　　分段（Segmentation）：这种方法是人们开始使用的一种方法，基本思路是将程序所需要的内存地址空间大小的虚拟空间映射到某个物理地址空间。

段映射机制

　　每个程序都有其独立的虚拟的独立的进程地址空间，可以看到程序A和B的虚拟地址空间都是从0x00000000开始的。我们将两块大小相同的虚拟地址空间和实际物理地址空间一一映射，即虚拟地址空间中的每个字节对应于实际地址空间中的每个字节，这个映射过程由软件来设置映射的机制，实际的转换由硬件来完成。

　　这种分段的机制解决了文章一开始提到的3个问题中的进程地址空间隔离和程序地址重定位的问题。程序A和程序B有自己独立的虚拟地址空间，而且该虚拟地址空间被映射到了互相不重叠的物理地址空间，如果程序A访问虚拟地址空间的地址不在0x00000000-0x00A00000这个范围内，那么内核会拒绝这个请求，所以它解决了隔离地址空间的问题。我们应用程序A只需要关心其虚拟地址空间0x00000000-0x00A00000，而其被映射到哪个物理地址我们无需关心，所以程序永远按照这个虚拟地址空间来放置变量，代码，不需要重新定位。

本文内容不用于商业目的，如涉及知识产权问题，请权利人联系SPASVO小编(021-61079698-8054)，我们将立即处理，马上删除。