你的C#代码是怎么跑起来的（2）

作者：网络转载发布时间：[ 2016/5/31 10:04:16 ] 推荐标签：测试开发技术 C#

　　通过上篇文章知道了EXE文件的结构，现在来看看双击后是怎样运行的：

　　双击文件后OS Loader加载PE文件并解析，在PE Optional Header里找到基地址和RVA，通过这两个确定了程序的入口地址，这个地址指向MsCorEE.dll的_CorExeMain()，执行它。_CorExeMain()开始执行，选择加载合适版本的CLR，CLR开始运行，CLR运行时会分配一个连续的地址空间用作托管堆，并用一个指针NextObjPtr指到开始位置，下次分配内存时从指针指的位置开始。
　　CLR运行后从CLR头里找到应用程序入口标识，也是Main()方法的MethodDefToken，通过这个标识在元数据表MethodDef里找到Main方法的偏移位置，这样可以找到Main()的IL代码。
　　CLR检查Main方法里面是否有没加载的类型，没有的话加载进来并在托管堆上建一个类型对象，类型对象包含静态字段，方法，基类的引用。然后给类型的方法表里每个方法一个存根，存根是用于标识是否被JIT编译过。
　　JIT: just-in-time Compiler，即时编译器。
　　JIT编译之前CLR会对Main方法的代码进行验证，确保类型安全且元数据正确，一切没问题后先检查类型方法表里这个方法的存根，不为空的话表示已经编译过不需要再次编译，没有的话JIT把这段IL代码编译成本地代码保存到内存中并方法表的存根做上标记，然后JIT返回编译前的位置并把原来CLR指向JIT的地址修改为指向本地代码的地址，这样函数的本地代码开始执行。程序执行到哪里编译到哪里，没有执行到的不会加载和编译，同样的代码再次执行的话直接在内存里拿了，这也是为什么第一次运行C#时比较慢而后面快的原因。这样开始陆续执行所有的代码，程序也跑起来了。
　　在内存上，运行线程会把函数的参数和局部变量压入线程栈上，栈上的空间默认是1M，方法的参数和局部变量都会压到函数的栈帧上，方法里的对象在托管堆NextObjPtr指向的位置分配内存并把内存地址存到栈上的局部变量里。CLR会给托管堆上的每个对象包括对象类型都添加两个字段，一个对象类型指针，一个同步块索引。
　　说起栈帧，大家在调试代码时应该都喜欢用CallStack吧，这可以通过看调用栈很方便来定位出问题的具体原因，这个CallStack也是方法的栈帧的具体显示，一级一级的。
　　对象类型指针从字面上很容易知道跟类型有关。CLR刚开始运行时分配了一个Type的对象类型，他的对象类型指针指向自己，后面创建的对象类型的对象类型指针指针指向这个Type，而new出来的对象的对象类型指针指向它的类型，这样所有对象都能找到自己的类型使CLR在运行时能确保类型安全。
　　同步块索引的格式是前6个标志位加后面26位内容（32位系统），作用则有好几个。
　　1. 调用对象的gethashcode()后标志位改变一位，后26位会存储对象的hashcode，保证对象生命周期内hashcode的；
　　2. lock时用到，CLR会维护一个同步块数组，每项由一个指向同步块的指针和对象指针组成，lock时同样改变标识位，然后去同步块数组找一个闲置项，后26则变成这项在数组中的索引，有人要问了，刚才hashcode不是用了这26位吗，现在变了，hashcode岂不是丢了。确实，hashcode在lock之后不能直接存到索引了，不过同步块中专门准备了一个字段用来存hashcode，所以可以转移到同步块中，这样设计是为了节省内存，因为大部分情况下是不用lock的，也不需要增加多余的同步块。
　　另外为什么是索引而不是地址呢，因为同步块数组的大小不是固定的，随着对象的增多而变大，在内存上的位置可能会发生变化，所以用索引不用管数组在哪个位置了。
　　当线程进入lock后检查同步块的m_motion，发现没有标识则进入lock区域并把标识改变，如果已经有同一个线程进去则把计数器加1，如果已经有其他线程则等待。
　　3. 垃圾回收时的标识，GC触发时首先认为所有的对象都是垃圾，由局部变量，寄存器，静态变量这些根向上找，凡是包含的对象都认为还有引用，在同步块索引上修改一位标识，当所有对象都遍历过后没有标识的对象会被清掉，然后再是整理内存、修改引用地址等。