由App的启动说起

jaminzzhang 2016-02-11 22:39:52 累计浏览 2,322 次

本机暂存

内容概览

这篇讲的是从用户点击App图标到程序真正运行起来，这电光火石的一瞬间里到底发生了什么。作者从“我是谁”的哲学拷问切入，带我们深入App的“新生儿”阶段，探寻那些看不见的启动奥秘。

文章把焦点对准了构成iOS应用的核心——Mach-O文件格式。它细致地拆解了App Bundle的结构，解释了Universal Binary（胖二进制）如何通过一个巧妙的Fat Header将支持不同CPU架构的代码打包在一起，以兼顾兼容性和性能。比如，文中就提到新浪微博的执行文件支持多种架构，而QQ和微信为了控制包体积则没有支持全部新架构。

作者的解读从文件组成到加载机制，层层递进。核心在于揭示那个从二进制文件到活生生应用的“炼金”过程，帮你理解Xcode编译、链接、打包之后，系统是如何接手并启动这个程序的。这种对底层机制的梳理，能让开发者超越日常编码，更透彻地理解App的运行本质。

“你是谁？从哪里来？到哪里去？”，这三个富有哲学气息的问题，是每一个人在不断解答的问题。我们Code，Build，Run，一个活生生的App跃然方寸屏上，这一切是如何发生的？从用户点击App到执行main函数这短短的瞬间发生了多少事呢？探寻App的启动新生，可以帮助我们更了解App开发本身。

下图是App启动流程的关键节点展示：

App启动流程

下面我们就来一一解读。

1. App文件的组成

在详细研究启动流程之前，首先我们需要了解下iOS/OSX的App执行文件

一个应用，通常都是经过“编译-》链接-》打包”几个步骤之后，生成一个可在某平台上运行应用。应用文件在不同的平台上以不同的格式存在，如Windows上的exe，Android上的pkg，以及我们接下来要说的ipa。

iOS系统是由OS X发展而来，而OS X是由NeXTSTEP与Mac OS Classic的融合。因此iOS/OS X系统很多的特性都是源于NeXTSTEP系统，如Objective-C、Cocoa、Mach、XCode等，其中还有应用/库的组成——Bundle。Bundle的官方解释是a standardized hierarchical structure that holds executable code and the resources used by that code.，也就是包含执行代码和相关资源的标准层次结构；可以简单地理解为包（Package）。

OS X应用和iOS应用两者的bundle结构有些许差别，OS X的应用程序的层次结构比较规范，而iOS的App则相对来说比较散乱，而且与OS不同的是，iOS只有Apple原生的应用才会在/Applications目录下，从App Store上购买的应用会安装在/var/mobile/Applications目录下；OSX的应用不再本文讨论范围之内，所以我们先来看看iOS的App Bundle的层次结构:

128-bit GUID/        xxxx.app/        Documents/        iTunesArtwork        iTunesMetaData.plist        Library/        tmp/

其中xxx.app就是我们的app应用程序，主要包含了执行文件（xxx.app/xxx， xxx为应用名称）、NIB和图片等资源文件。接下来就主要看看本节的主角： Mach-O

1.1 Universal Binary

大部分情况下，xxx.app/xxx文件并不是Mach-O格式文件，由于现在需要支持不同CPU架构的iOS设备，所以我们编译打包出来的执行文件是一个Universal Binary格式文件（通用二进制文件，也称胖二进制文件），其实Universal Binary只不过将支持不同架构的Mach-O打包在一起，再在文件起始位置加上Fat Header来说明所包含的Mach-O文件支持的架构和偏移地址信息；

Fat Header的数据结构在<mach-o/fat.h>头文件上有定义：

#define FAT_MAGIC   0xcafebabe#define FAT_CIGAM  0xbebafeca  /* NXSwapLong(FAT_MAGIC) */structfat_header{uint32_tmagic;/* FAT_MAGIC */uint32_tnfat_arch;/* number of structs that follow */};structfat_arch{cpu_type_tcputype;/* cpu specifier (int) */cpu_subtype_tcpusubtype;/* machine specifier (int) */uint32_toffset;/* file offset to this object file */uint32_tsize;/* size of this object file */uint32_talign;/* alignment as a power of 2 */};

结构struct fat_header：

1). magic字段就是我们常说的魔数（与UNIX的ELF文件一样），加载器通过这个魔数值来判断这是什么样的文件，胖二进制文件的魔数值是0xcafebabe；
2). nfat_arch字段是指当前的胖二进制文件包含了多少个不同架构的Mach-O文件；

fat_header后会跟着fat_arch，有多少个不同架构的Mach-O文件，就有多少个fat_arch，用于说明对应Mach-O文件大小、支持的CPU架构、偏移地址等；

可以用file命令来查看下执行文件的信息，如新浪微博：

file查看新浪微博

ps：上述说“大部分情况”是因为还有一部分，由于业务比较复杂，代码量巨大，如果支持多种CPU架构而打包多个Mach-O文件的话，会导致ipa包变得非常大，所以就并没有支持新的CPU架构的。如QQ和微信：

file查看QQ

ps:QQ V5.5.1版本单个Mach-O文件大小为51M

1.2 Mach-O

虽然iOS/OS X采用了类UNIX的Darwin操作系统核心，完全符合UNIX标准系统，但在执行文件上，却没有支持UNIX的ELF，而是维护了一个独有的二进制可执行文件格式：Mach-Object（简写Mach-O）。Mach-O是NeXTSTEP的遗产，其文件格式如下：

Mach-O

由上图，我们可以看到Mach-O文件主要包含一下三个数据区：
(1). 头部Header：在<mach-o/loader.h>头文件定义了Mach-O Header的数据结构：

/* * The 32-bit mach header appears at the very beginning of the object file for * 32-bit architectures. */structmach_header{uint32_tmagic;/* mach magic number identifier */cpu_type_tcputype;/* cpu specifier */cpu_subtype_tcpusubtype;/* machine specifier */uint32_tfiletype;/* type of file */uint32_tncmds;/* number of load commands */uint32_tsizeofcmds;/* the size of all the load commands */uint32_tflags;/* flags */};/* Constant for the magic field of the mach_header (32-bit architectures) */#define    MH_MAGIC    0xfeedface  /* the mach magic number */#define MH_CIGAM   0xcefaedfe  /* NXSwapInt(MH_MAGIC) */

以上引用代码是32位的文件头数据结构，<mach-o/loader.h>头文件还定义了64位的文件头数据结构mach_header_64，两者基本没有差别，mach_header_64多了一个额外的预留字段uint32_t reserved;，该字段目前没有使用。需要注意的是，64位的Mach-O文件的魔数值为#define MH_MAGIC_64 0xfeedfacf。

(2). 加载命令 Load Commends：

在mach_header之后的是加载命令，这些加载命令在Mach-O文件加载解析时，被内核加载器或者动态链接器调用，指导如何设置加载对应的二进制数据段；Load Commend的数据结构如下：

structload_command{uint32_tcmd;/* type of load command */uint32_tcmdsize;/* total size of command in bytes */};

OS X/iOS发展到今天，已经有40多条加载命令，其中部分是由内核加载器直接使用，而其他则是由动态链接器处理。其中几个主要的Load Commend为LC_SEGMENT, LC_LOAD_DYLINKER, LC_UNIXTHREAD, LC_MAIN等，这里不详细介绍，在<mach-o/loader.h>头文件有简单的注释，后续内核还会涉及。

ps: otool是查看操作Mach-O文件的工具，类似于UNIX下的ldd或readelf工具。
MachOView是查看Mach-O文件的可视化工具。

(3). 原始段数据 Raw segment data

原始段数据，是Mach-O文件中最大的一部分，包含了Load Command中所需的数据以及在虚存地址偏移量和大小；一般Mach-O文件有多个段(Segement)，段每个段有不同的功能，一般包括：

1). __PAGEZERO: 空指针陷阱段，映射到虚拟内存空间的第一页，用于捕捉对NULL指针的引用；
2). __TEXT: 包含了执行代码以及其他只读数据。该段数据的保护级别为：VM_PROT_READ（读）、VM_PROT_EXECUTE(执行)，防止在内存中被修改；
3). __DATA: 包含了程序数据，该段可写；
4). __OBJC: Objective-C运行时支持库；
5). __LINKEDIT: 链接器使用的符号以及其他表

一般的段又会按不同的功能划分为几个区（section），标识段-区的表示方法为(SEGMENT.section)，即段所有字母大小，加两个下横线作为前缀，而区则为小写，同样加两个下横线作为前缀；更多关于常见section的解析，请查看 https://developer.apple.com/library/mac/documentation/DeveloperTools/Conceptual/MachORuntime/

2. 内核Kernel

了解了App执行文件之后，我们从源码来看看，App经过了什么样的内核调用流程之后，来到了主程序入口main()。

2.1 XNU开源代码

虽然内核XNU是开源的，但只限于OS X, iOS的XNU内核一直是封闭的，但从历史角度来说，iOS是OS X的分支，两者比较大的区别就是支持的目标架构不一样（iOS目标架构为ARM，而不是OS X的Intel i386和x86_64），内存管理以及系统安全限制；而执行文件都是Mach-O。所以，本文预设两者在App启动执行这方面并没有太大差别。

本文参考的XNU版本为v2782.1.97;

2.2 内核调用流程

可执行文件的内核流程如下图：

启动进程的流程

引用自《Mac OS X and iOS Internals : To the Apple's Core》P555

上述流程对应到源代码的调用树为：

ps: 由于源代码较多，篇幅所限，只引用关键性的代码，并有简单的注释，本人注释以oncenote为前缀.

// oncenote: /bsd/kern/ker_exec.c  line: 2615execve(proc_tp,structexecve_args*uap,int32_t*retval){__mac_execve(proc_tp,struct__mac_execve_args*uap,int32_t*retval){// oncenote: /bsd/kern/ker_exec.c  line: 2654  // oncenote: /bsd/kern/ker_exec.c  line: 2735// 加载执行文件镜像并设置环境exec_activate_image(structimage_params*imgp){// oncenote: /bsd/kern/kern_exec.c  line: 1328// 遍历execsw执行格式，执行对应的ex_imgact函数for(i=0;error==-1&&execsw[i].ex_imgact!=NULL;i++){// 1.对于Mach-o Binary，执行exec_mach_imgact// 2.对于Fat Binary，执行exec_fat_imgact// 3.对于Interpreter Script，执行exec_shell_imgact// 由于只支持Mach-O这种执行格式，所以exec_fat_imgact和exec_shell_imgact最终都会调到exec_mach_imgact// 返回错误码0，则表示mach file被正确加载处理；只有exec_mach_imgact会返回0error=(*execsw[i].ex_imgact)(imgp);// oncenote: 对于Mach-o，执行(*execsw[i].ex_imgact)(imgp) = exec_mach_imgact(imgp)exec_mach_imgact(structimage_params*imgp){// oncenote: /bsd/kern/kern_exec.c  line: 893load_machfile(structimage_params*imgp,...){// oncenote: /bsd/kern/mach_loader.c  line: 287// oncenote: oncenote: /bsd/kern/mach_loader.c  line: 336// 设置内存映射if(create_map){vm_map_create();}// oncenote: /bsd/kern/mach_loader.c  line: 373// 设置地址空间布局随机数if(!(imgp->ip_flags&IMGPF_DISABLE_ASLR)){aslr_offset=random();}// oncenote: /bsd/kern/mach_loader.c  line: 392parse_machfile(structvnode*vp,...,load_result_t*result){// oncenote: 递归深度解析mach file, 在2.3中详细讲解}}// oncenote: /bsd/kern/kern_exec.c line: 973if(load_result.unixproc){/* Set the stack *///oncenotethread_setuserstack(thread,ap);}// oncenote: /bsd/kern/kern_exec.c line: 1014// 设置入口点（寄存器状态来自LC_UNIXTHREAD）/* Set the entry point */thread_setentrypoint(thread,load_result.entry_point);/* Stop profiling */stopprofclock(p);/*                    * Reset signal state.                    */execsigs(p,thread);...}}}}}

由于篇幅所限，本文就不对源码进行展开讲解。通过上述的调用树，App启动在内核中的大概流程已非常清晰，如想更深入研究，请下载源代码，并辅以文末参考资料，进行阅读；

2.3 加载并解析Mach-O文件

前一节描述了可执行文件的执行流程，本节探讨下，内核是如何加载解析Mach-O文件的。

函数load_machfile()加载Mach-O文件，然后调用函数parse_machfile()解析Mach-O文件。函数load_machfile()本身并没有太复杂的逻辑，因此parse_machfile()函数是加载解析Mach-O文件的核心逻辑。在阅读具体代码观察解析流程之前，先明确下parse_machfile()三个特别的逻辑：

首先，parse_machfile()是递归解析的，最初的递归深度为0，最高深度到6，防止无限递归。使用递归解析，主要是将不同Mach-O文件类型按照依赖关系，分前后进行解析。如解析可执行二进制文件类型(MH_EXECUTABLE)的Mach-O文件需要调用load_dylinker来处理加载命令LC_LOAD_DYLINKER，而动态链接器也是Mach-O文件，所以就需要递归到不同的深度进行解析；
其次，parse_machfile()的每一次递归，在解析加载命令时，会将内核需要解析的加载命令按照加载循序划分为三组进行解析，在代码的体现上就是通过三次循环，每趟循环只关注当前趟需要解析的命令： (1)：解析线程状态，UUID和代码签名。相关命令为LC_UNIXTHREAD、LC_MAIN、LC_UUID、LC_CODE_SIGNATURE (2)：解析代码段Segment。相关命令为LC_SEGMENT、LC_SEGMENT_64； (3)：解析动态链接库、加密信息。相关命令为：LC_ENCRYPTION_INFO、LC_ENCRYPTION_INFO_64、LC_LOAD_DYLINKER
最后，关于Mach-O的入口点。解析完可执行二进制文件类型的Mach-O文件(假设为A)之后，我们会得到A的入口点；但线程并不立刻进入到这个入口点。这是由于我们还会加载动态链接器(dyld)，在load_dylinker()中，dyld会保存A的入口点，递归调用parse_machfile()之后，将线程的入口点设为dyld的入口点；动态链接器dyld完成加载库的工作之后，再将入口点设回A的入口点，程序启动完成；

理解了上述逻辑之后，我们通过源代码最直观地探索解析流程：

// oncenote: oncenote: /bsd/kern/mach_loader.c  line: 483staticload_return_tparse_machfile(structvnode*vp,vm_map_tmap,thread_tthread,structmach_header*header,off_tfile_offset,off_tmacho_size,intdepth,int64_taslr_offset,int64_tdyld_aslr_offset,load_result_t*result){/*    *  Break infinite recursion    *///oncenote: 最大深度6的控制if(depth>6){return(LOAD_FAILURE);}depth++;//oncenote: 不同的深度解析不同的Mach-o文件类型，//如可执行二进制文件类型MH_EXECUTE，只在第一次深度，因此不存在MH_EXECUTE依赖MH_EXECUTE的情况switch(header->filetype){caseMH_OBJECT:caseMH_EXECUTE:caseMH_PRELOAD:if(depth!=1){return(LOAD_FAILURE);}break;caseMH_FVMLIB:caseMH_DYLIB:if(depth==1){return(LOAD_FAILURE);}break;caseMH_DYLINKER:if(depth!=2){return(LOAD_FAILURE);}break;default:return(LOAD_FAILURE);}// ...//oncenote: 将所有的加载命令都映射到内核内存中，准备解析/*    * Map the load commands into kernel memory.    */addr=0;kl_size=size;kl_addr=kalloc(size);addr=(caddr_t)kl_addr;if(addr==NULL)return(LOAD_NOSPACE);error=vn_rdwr(UIO_READ,vp,addr,size,file_offset,UIO_SYSSPACE,0,kauth_cred_get(),&resid,p);// ...//nocenote: 开始解析加载命令(Load Command)，分三趟进行解析/*    *  Scan through the commands, processing each one as necessary.    *  We parse in three passes through the headers:    *  1: thread state, uuid, code signature    *  2: segments    *  3: dyld, encryption, check entry point    */for(pass=1;pass<=3;pass++){/*        * Check that the entry point is contained in an executable segments        */if((pass==3)&&(result->validentry==0)){thread_state_initialize(thread);ret=LOAD_FAILURE;break;}/*        * Loop through each of the load_commands indicated by the        * Mach-O header; if an absurd value is provided, we just        * run off the end of the reserved section by incrementing        * the offset too far, so we are implicitly fail-safe.        */offset=mach_header_sz;ncmds=header->ncmds;while(ncmds--){/*            *  Get a pointer to the command.            */lcp=(structload_command*)(addr+offset);oldoffset=offset;offset+=lcp->cmdsize;switch(lcp->cmd){caseLC_SEGMENT:if(pass!=2)//oncenote: 第二趟进行解析break;ret=load_segment(lcp,header->filetype,control,file_offset,macho_size,vp,map,slide,result);break;caseLC_SEGMENT_64://oncenote: 与命令LC_SEGMENT相同break;caseLC_UNIXTHREAD:if(pass!=1)break;//oncenote: load_unixthread() 依次调用load_threadstack()、load_threadentry()和load_threadstate()//oncenote: 启动一个unix线程，加载线程的初始化状态，并载入入口点ret=load_unixthread((structthread_command*)lcp,thread,slide,result);break;caseLC_MAIN:if(pass!=1)break;if(depth!=1)break;//oncenote: 代替LC_UNIXTHREAD，与LC_UNIXTHREAD类似ret=load_main((structentry_point_command*)lcp,thread,slide,result);break;caseLC_LOAD_DYLINKER:if(pass!=3)break;//在第一次深度的递归调用，解析到LC_LOAD_DYLINKER，设置dlp，用于后续加载动态链接库if((depth==1)&&(dlp==0)){dlp=(structdylinker_command*)lcp;dlarchbits=(header->cputype&CPU_ARCH_MASK);}else{ret=LOAD_FAILURE;}break;caseLC_UUID://oncenote: 省略break;caseLC_CODE_SIGNATURE://oncenote: 省略break;#if CONFIG_CODE_DECRYPTIONcaseLC_ENCRYPTION_INFO://oncenote: 省略caseLC_ENCRYPTION_INFO_64:break;#endifdefault://内核不处理其他命令，其他命令交由动态链接器dyld来处理/* Other commands are ignored by the kernel */ret=LOAD_SUCCESS;break;}if(ret!=LOAD_SUCCESS)break;}if(ret!=LOAD_SUCCESS)break;}//oncenote: 前面解析命令操作成功，加载动态链接器if(ret==LOAD_SUCCESS){if((ret==LOAD_SUCCESS)&&(dlp!=0)){/*           * load the dylinker, and slide it by the independent DYLD ASLR           * offset regardless of the PIE-ness of the main binary.           */ret=load_dylinker(dlp,dlarchbits,map,thread,depth,dyld_aslr_offset,result);}}// ...return(ret);}

再来看load_dylinker()的代码：

staticload_return_tload_dylinker(structdylinker_command*lcp,integer_tarchbits,vm_map_tmap,thread_tthread,intdepth,int64_tslide,load_result_t*result){//oncenote: 获取dyld vnoderet=get_macho_vnode(name,archbits,header,&file_offset,&macho_size,macho_data,&vp);if(ret)gotonovp_out;*myresult=load_result_null;/*    *  First try to map dyld in directly.  This should work most of    *  the time since there shouldn't normally be something already    *  mapped to its address.    *///oncenote: 递归调用parse_machfile()解析dyldret=parse_machfile(vp,map,thread,header,file_offset,macho_size,depth,slide,0,myresult);// ...if(ret==LOAD_SUCCESS){//oncenote: 解析成功，设置线程入口为dyld的入口，dyld开始加载共享库result->dynlinker=TRUE;result->entry_point=myresult->entry_point;result->validentry=myresult->validentry;result->all_image_info_addr=myresult->all_image_info_addr;result->all_image_info_size=myresult->all_image_info_size;if(myresult->platform_binary){result->csflags|=CS_DYLD_PLATFORM;}}// ...return(ret);}

3. 总结

之前对App流程有个大体的概念，但于细节并不甚清楚，耗时1个多月，边学边复习边写文章，终于在出行旅游前完成。原计划是准备在第三段讲解下动态链接器dyld加载共享库的流程的，但限于本文篇幅实在太长，所以新起一篇文章来写会好一点。

关于App启动流程还有许多细节，如代码签名验证、虚存映射、iOS的触屏应用加载器SpringBoard如何进行切换应用等，本文并未涉及到，有兴趣的同学可以继续深入研究。

参考资料：

同分类推荐文章

「置顶」我做了什么（2026-05-05 12:13:28）
万字长文推演：手机不再从 App 开始，Agent OS 如何接管任务入口（2026-04-28 14:57:22）
Android Perfetto 系列 10 - Binder 调度与锁竞争（2025-11-16 15:33:30）

查看更多移动开发文章 →

建议继续学习

过年回家有感：他们的互联网（累计阅读 4,534）
高效输出移动app产品原型（累计阅读 3,659）
选择创业方向的随想（累计阅读 3,094）
2011年手机产品设计趋势（3）：硬件与应用（累计阅读 2,860）
CES 2011 移动设备界面的视觉盛宴（累计阅读 2,792）
移动终端设计和开发类书籍推荐（累计阅读 2,696）
移动互联网这5年（累计阅读 2,512）
云相册与相片群（累计阅读 2,387）
用吐槽的方式生产内容（累计阅读 2,328）