推广

启动优化之二进制重排

iseeyu2年前 (2024-02-22)推广145

虚拟内存工作原理

2. 虚拟内存分页

刚刚提到虚拟内存和物理内存通过映射表进行映射,但是这个映射并不可能是一一对应的,那样就太过浪费内存了。为了解决效率题,实际上真实物理内存是分页的。而映射表同样是以页为单位的。换句话说,映射表只会映射到某一页,并不会映射到具体每一个地址。

Mac OS 、linux内存 4kb一页,iOS是16kb一页。可以使用 pagesize 命令,在终端直接查看。4096字节=4千字节。

  1. 0 和 1 代表当前地址有没有在物理内存中。
  2. 从上图我们也可以看出,进程的虚拟地址是连续的,但是实际物理内存地址并不是连续的,而是由若干完整的内存分页组成。
  3. 当应用被加载到物理内存中时 ,并不会将整个应用加载到物理内存中。只会放用到的那一部分。也就是懒加载,换句话说就是应用使用多少,实际物理内存就分配多少。

二、Page Fault

1. Page Fault产生原因

  1. 当应用访问到某个地址,映射表中为 0,也就是说它并没有被加载到物理内存中时,系统就会立刻阻塞整个进程,触发一个缺页中断,即 Page Fault
  2. 当一个缺页中断被触发,操作系统会从磁盘中重新读取这页数据到物理内存上,然后将映射表中虚拟内存指向对应物理内存。 如果当前内存已满,操作系统会通过置换页算法找一页数据进行覆盖。这也是为什么开再多的应用也不会崩掉,但是之前开的应用再打开,就会重新启动的根本原因。

2. Page Fault影响

内存分页触发中断异常 Page Fault 后,会阻塞进程,这是会对性能产生影响的。并且在 iOS 系统的生产环境应用,在发生缺页中断进行重新加载时 ,iOS 系统还会对其做一次签名验证,因此 iOS 生产环境的 Page Fault 所产生的耗时要更多。
对用户而言,使用App时第一个直接体验就是启动 App 时间,而启动时期会有大量的分类三方等等需要加载和执行,此时大量Page Fault所产生的的耗时往往是不能小觑的。

抖音团队分享的一个 Page Fault,开销在 0.6 ~ 0.8ms。实际测试发现不同页会有所不同 , 也跟 cpu 负荷状态有关,在 0.1 ~ 1.0 ms 之间。
二进制重排这个方案最早也是 抖音团队 分享的。

三、二进制重排

1. 二进制重排原理

函数编译在mach-O中的位置是根据ld ( Xcode 的链接器)的编译顺序并非调用顺序来的,因此很可能这两个函数分布在不同的内存页上。

  1. 如上图,编译顺序是method1method2… 。启动时page1与page2都需要从无到有加载到物理内存中,所以会触发两次Page Fault
  2. 二进制重排的做法就是将method1method4放到一个内存页中,那么启动时则只需要加载一次 page 即可,也就是只触发一次Page Fault
  3. 在实际项目中,我们可以将启动时需要调用的函数放到一起 ( 比如 前10页中 ) 以尽可能减少Page Fault,进而减少启动耗时。

2. 二进制重排操作

苹果已经给我们提供了这个机制,实际上二进制重排就是对即将生成的可执行文件重新排列,这个操作发生在链接阶段。

2.1 Order File

Xcode用的链接器叫做 ldld有一个参数叫做Order File,我们可以通过这个参数配置一个 后缀名 为order的文件路径。在这个xxx.order文件中,将需要的符号按顺序写在里面,当工程build的时候,Xcode会读取这个文件,打的二进制包就会按照这个文件中的符号顺序进行生成对应的mach-O

2.2 Linkmap 查看二进制文件布局

Linkmap是iOS编译过程的中间产物,记录了二进制文件的布局,开启步骤如下:

2.2.1 修改Write Link Map File为 YES,然后clean项目并重新编译

  • Products -> show in finder,上上层文件夹,然后找到一个xxx-LinkMap-normal-arm64.txt的txt文件

  • 这个文件的# Symbols:部分存储了所有符号的顺序,前面的 .o 等内容忽略,Address就是实际的物理地址,可用Mach-O工具查看

  • 我们发现符号顺序是按照Compile Sources的文件顺序来排列的

当我们调整Compile Sources中的文件顺序后,会发现符号顺序也有了变化。

2.3 二进制重排原理

我们二进制重排并非只是修改符号地址,而是利用符号顺序,重新排列整个代码在文件的偏移地址,将启动需要加载的方法地址放到前面内存页中,以此达到减少page fault的次数从而实现时间上的优化。

3. 获取App启动时调用的所有方法(使用编译插桩)

备注:Clang插桩实际上就是一个代码覆盖工具 Clang插桩官网地址

要真正的实现二进制重排,我们需要拿到启动时的所有方法、函数等符号,并保存其顺序,然后写入xxx.order文件来实现二进制重排,获取的方案使用 Clang编译插桩

3.1 在Build SettingsOther C Flags添加编译配置-fsanitize-coverage=func,trace-pc-guard

3.2 添加完编译配置后,会发现编译报错,如下:

3.3 添加Clang函数

#import "DZHomeViewController.h"
#import <dlfcn.h> // 动态库的显式调用
#import <libkern/OSAtomic.h> //

/*
 考虑到插桩方法会调用很多次,使用锁会影响性能,所以使用苹果底层的`原子队列`,其内部实际上是一个链表,遵循先进先出
 **/
static OSQueueHead symbolList = OS_ATOMIC_QUEUE_INIT;
// 定义符号结构体
typedef struct {
    void *pc;
    void *next;
} PCNode;
@interface DZHomeViewController ()

@end

@implementation DZHomeViewController

void(^blockTest)(void) = ^(void) {
    
};

+ (void)load {
    
}

+ (void)initialize {
    
}

- (void)viewDidLoad {
    [super viewDidLoad];    
}

- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event {
  //    [self deziTest];
    NSMutableArray <NSString *> * symbolNames = [NSMutableArray array];

    while (YES) {
        PCNode *node = OSAtomicDequeue(&symbolList, offsetof(PCNode, next));
        if (node == NULL) {
            break;
        }
        Dl_info info;
        dladdr(node->pc, &info);
        NSString * name = @(info.dli_sname);
        BOOL  isObjc = [name hasPrefix:@"+["] || [name hasPrefix:@"-["];
        NSString * symbolName = isObjc ? name: [@"_" stringByAppendingString:name];
        [symbolNames addObject:symbolName];
    }
    // 取反
    NSEnumerator *emt = [symbolNames reverseObjectEnumerator];
    //去重
    NSMutableArray<NSString *> *funcs = [NSMutableArray arrayWithCapacity:symbolNames.count];
    NSString *name;
    while (name = [emt nextObject]) {
        if (![funcs containsObject:name]) {
            [funcs addObject:name];
        }
    }
    //干掉自己!
    [funcs removeObject:[NSString stringWithFormat:@"%s",__FUNCTION__]];
    //将数组变成字符串
    NSString *funcStr = [funcs  componentsJoinedByString:@"\n"];

    NSString *filePath = [NSTemporaryDirectory() stringByAppendingPathComponent:@"fontResources.order"];
    NSData *fileContents = [funcStr dataUsingEncoding:NSUTF8StringEncoding];
    [[NSFileManager defaultManager] createFileAtPath:filePath contents:fileContents attributes:nil];
    NSLog(@"%@",funcStr);
}

- (void)deziTest {
    blockTest();
}

void __sanitizer_cov_trace_pc_guard_init(uint32_t *start, uint32_t *stop) {
  static uint64_t N;  // Counter for the guards.
  if (start == stop || *start) return;  // Initialize only once.
  printf("INIT: %p %p\n", start, stop);
  for (uint32_t *x = start; x < stop; x++)
    *x = ++N;  // Guards should start from 1.
}

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
    
    /*  精确定位 哪里开始 到哪里结束!  在这里面做判断写条件!*/
    void *PC = __builtin_return_address(0);
    DeziNode *node = malloc(sizeof(DeziNode));
    *node = (DeziNode){PC,NULL};
    //进入
    OSAtomicEnqueue(&symbolList, node, offsetof(DeziNode, next));
    
    Dl_info info; // 动态链接库时 通过传递指针给Mach-O头部Mach-O header,引用一个Dl_info结构体
    dladdr(PC, &info);

    
    printf("----------------------------------------\nfname:%s \nfbase:%p \nsname:%s \nsaddr:%p\n",
           info.dli_fname,
           info.dli_fbase,
           info.dli_sname,
           info.dli_saddr);

}

@end
  • dl_info结构体
typedef struct dl_info {
    const char      *dli_fname;     /* 共享对象的路径名 */
    void            *dli_fbase;     /* 共享对象的基本地址 */
    const char      *dli_sname;     /* 最近的符号的名称 */
    void            *dli_saddr;     /* 最近的符号地址 */
} Dl_info;

3.4 汇编断点调试

  • 首先打开汇编调试

  • 在方法中加断点

  • 调试结果

  • 结论

  • 由汇编断点调试可以发现在所有的方法函数里边插入这个方法__sanitizer_cov_trace_pc_guard,因此每次执行方法都会先执行插桩方法。
  • 所以在编译时刻,Clang插桩会静态加入汇编指令,做到全局AOP,Hook一切方法。

3.5 使用__sanitizer_cov_trace_pc_guard

  • 断点打印发现PC就是方法地址

void *PC = __builtin_return_address(0); 通过这个函数,拿到当前函数__sanitizer_cov_trace_pc_guard的下一个函数地址,也就是程序中的真实调用方法。

3.6 通过原子队列存取方法

  • 插桩时存

void __sanitizer_cov_trace_pc_guard(uint32_t *guard) {
    /* 定位插桩方法的下一个方法,也就是程序中的真实调用方法 */
    void *PC = __builtin_return_address(0);
    
    PCNode *node = malloc(sizeof(PCNode));
    *node = (PCNode){PC,NULL};
    // 进入 &symbolList链表表头,node节点数据,offsetof(PCNode, next) 下一个成员在链表中的偏移地址
    OSAtomicEnqueue(&symbolList, node, offsetof(PCNode, next));
}
  • 通过touchesBegan方法手动取出原子队列所存方法

- (void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event {
    NSMutableArray <NSString *> *symbolNames = [NSMutableArray array];

    while (YES) {
        // &symbolList链表表头,
        PCNode *node = OSAtomicDequeue(&symbolList, offsetof(PCNode, next));
        if (node == NULL) {
            break;
        }
        Dl_info info;
        dladdr(node->pc, &info);
        NSString * name = @(info.dli_sname);
        BOOL isObjc = [name hasPrefix:@"+["] || [name hasPrefix:@"-["];
        NSString *symbolName = isObjc ? name: [@"_" stringByAppendingString:name];
        [symbolNames addObject:symbolName];
    }
    
    // 由于先进先出的特性,所以要取反
    NSEnumerator *emt = [symbolNames reverseObjectEnumerator];
    // 去重
    NSMutableArray<NSString *> *funcs = [NSMutableArray arrayWithCapacity:symbolNames.count];
    NSString *name;
    while (name = [emt nextObject]) {
        if (![funcs containsObject:name]) {
            [funcs addObject:name];
        }
    }
    // 去掉自己
    [funcs removeObject:[NSString stringWithFormat:@"%s",__FUNCTION__]];
    // 将数组变成字符串
    NSString *funcStr = [funcs  componentsJoinedByString:@"\n"];

    NSString *filePath = [NSTemporaryDirectory() stringByAppendingPathComponent:@"fontResources.order"];
    NSData *fileContents = [funcStr dataUsingEncoding:NSUTF8StringEncoding];
    [[NSFileManager defaultManager] createFileAtPath:filePath contents:fileContents attributes:nil];
    NSLog(@"%@",funcStr);
}
  • 将存入本地的fontResources.order文件取出,放在工程里

  • 配置工程的Order File文件

  • 二进制重排到此结束,对比前后xxx-LinkMap-normal-arm64.txt文件,我们会发现启动时调用的方法,已经被排到前边去了

二进制重排前

二进制重排后

四、使用 System Trace 来检验二进制重排结果

1. 那么如何衡量页的加载时间呢?这里就用到了Instruments中的System Trace工具。

首先,重新启动设备(冷启动)。⌘+I打开Instruments,选择System Trace工具。
点击录制⏺后,出现第一个页面,马上停止⏹。过滤只显示Main Thread相关,选择Summary: Virtual Memory。

  • File Backed Page In次数就是触发Page Fault的次数了。
  • Page Cache Hit就是页缓存命中的次数了。

由于获取Page Fault影响因素很多,导致每次获取存在较大波动。只能在尽量保证同一的环境下,多次采样取平均值的来大致估算数据。此处不进行赘述。

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://www.0291.com.cn/post/56342.html

相关文章

淘宝ifashion入驻需要什么条件,淘宝ifashion什么意思(淘宝ifashion如何进入)

淘宝ifashion入驻需要什么条件,淘宝ifashion什么意思(淘宝ifashion如何进入)

由于淘宝ifashion目前涵盖的类目比较广泛,而每一种类模特的具体要求都有一些不同之处。所以我们今天就以男装为例,给大家分析一下淘宝ifashion的入驻规则有什么具体要求,其他各项大家可以参考淘宝的具体要求。...

MAGNA:流媒体电视广告报告。

MAGNA:流媒体电视广告报告。

MAGNA和Roku合作开展一项新研究发现,流媒体电视中的新视频广告形式比传统电视广告对消费者的吸引力高出二倍。 如今,营销人员希望在向流媒体的转变中脱颖而出。仅靠传统电视广告就错过了在整个流媒体旅程中带来惊喜和愉悦的机会。 报告研究了营销人员如何使流媒体电视广告体验获得吸引力。94% 的参与者...

我来分享内容页内链设置的要点是什么。

我来分享内容页内链设置的要点是什么。

网站内链的形式有很多,包括各种导航,推荐阅读,文章中的链接等。对于网站seo来讲,内链是不可或缺的一部分。有一种说法,中型网站注重结构和,不是空穴来风。内容页的内链设置得当,可以引导站内权值的传递,提高网站的收录量,提升长尾关键词的排名。内链的形式多种多样,用好了,效果显著,错误的使用,带来的是消...

微信公众号推广技巧大总结。

微信公众号推广技巧大总结。

微信推广窍门许多,在推广前也要对微信进行一个大约的知道,多想想怎样使用微信推广,找准合适自己的路子,依据自个总结的办法共享给咱们作为参阅。 1、 首要,知道微信这个渠道,开展的微信渠道的意图是啥,有人过错了解微信和微博相同是用来开展新客户的渠道,其实微信主要功能是用来保护客户和增强客户关系的推广...

财富管理行业专题报告:商业模式变革,从卖方到买方的关键路径

财富管理行业专题报告:商业模式变革,从卖方到买方的关键路径

(报告出品方/作者:国海证券,杨仁文、李杨)1、 未来蓝图:中国财富管理商业模式将走向何方?我国财富管理仍存在较大增长空间,未来 5 年仍将维持快速增长趋势。然 而,未来中国财富管理将走向何方。通过梳理国外财富管理行业的发展路径,可 帮助我们更好地理解财富管理的未来式,从而...

SEO优化师如何提高网站的权重。

SEO优化师如何提高网站的权重。

有很多新的SEO理解SEO是为了提高网站的排名,更片面的表现是SEO是为了做首页排名。事实上,有一个很大的误解。SEO的目的是提高整个网站的权重。只有提高整个网站的权重,才能更好地对网站的主页、栏目页面和内页进行排名,从而限度地获取相关流量。那么,SEO优化如何提高网站的权重呢? 一、选择一个好域...

现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片