iOS runtime—看这一篇就够了


本文篇幅比较长,创作的目的为了自己日后温习知识所用,希望这篇文章能对你有所帮助。
如发现任何有误之处,肯请留言纠正,谢谢。

一、深入代码理解 instance、class object、metaclass

1、instance对象实例

我们经常使用id来声明一个对象,那id的本质又是什么呢?查看objc/objc.h文件

/// An opaque type that represents an Objective-C class.
typedef struct objc_class *Class;

/// Represents an instance of a class.
struct objc_object {
    Class _Nonnull isa  OBJC_ISA_AVAILABILITY;
};

/// A pointer to an instance of a class.
typedef struct objc_object *id;

我们创建的一个对象或实例其实就是一个struct objc_object结构体,而我们常用的id也就是这个结构体的指针。

这个结构体只有一个成员变量,这是一个Class类型的变量isa,也是一个结构体指针,isa指针就指向对象所属的类

一个 NSObject 对象占用多少内存空间?
一个NSObject实例对象只有一个isa指针,所以一个isa指针的大小,他在64位的环境下占8个字节,在32位环境上占4个字节。

 NSObject *obj = [[NSObject alloc] init];
 NSLog(@"class_getInstanceSize--%zd", class_getInstanceSize([NSObject class]));

输出结果:

class_getInstanceSize--8

2、class object(类对象)/metaclass(元类)

看结构体objc_class的定义

struct objc_class {
    Class isa  OBJC_ISA_AVAILABILITY;

#if !__OBJC2__
    Class super_class                                        OBJC2_UNAVAILABLE;
    const char *name                                         OBJC2_UNAVAILABLE;
    long version                                             OBJC2_UNAVAILABLE;
    long info                                                OBJC2_UNAVAILABLE;
    long instance_size                                       OBJC2_UNAVAILABLE;
    struct objc_ivar_list *ivars                             OBJC2_UNAVAILABLE;
    struct objc_method_list **methodLists                    OBJC2_UNAVAILABLE;
    struct objc_cache *cache                                 OBJC2_UNAVAILABLE;
    struct objc_protocol_list *protocols                     OBJC2_UNAVAILABLE;
#endif

} OBJC2_UNAVAILABLE;
/* Use `Class` instead of `struct objc_class *` */

  • Class superclass;——用于获取父类,也就是元类对象,它也是一个Class类型
  • cache_t cache;——是方法缓存
  • class_data_bits_t bits;——用于获取类的具体信息,看到bits
  • class_rw_t *data()函数,该函数的作用就是获取该类的可读写信息,通过class_data_bits_t的bits.data()方法获得,class_rw_t后面会介绍
class_rw_t* data() {
        return (class_rw_t *)(bits & FAST_DATA_MASK);
}

该结构体的第一个成员变量也是isa指针,这就说明了Class本身其实也是一个对象,我们称之为类对象。类对象中的元数据存储的都是如何创建一个实例的相关信息,那么类对象和类方法应该从哪里创建呢?就是从isa指针指向的结构体创建,类对象的isa指针指向的我们称之为元类(metaclass),元类中保存了创建类对象以及类方法所需的所有信息。

3、isa指针与superclass相关逻辑图

4、总结 + 代码校验

  • 对象 的类(Superclass)是 类(对象) ;
  • 类(对象) 的类(Superclass)是 元类,和类同名;
  • 元类 的类(Superclass)是 根元类 NSObject;
  • 根元类 的类(Superclass)是 自己 ,还是NSObject;
  • 对象的isa指针指向类(对象) ;
  • 类对象的isa指针指向元类,和类同名;
  • 元类的isa指针指向跟根元类 NSObject;
  • 根元类 NSObject的isa指针指向自己。

isa验证

    NSString *string = @"字符串";
    Class class1 = object_getClass(string);//NSString类对象
    Class metaClass = object_getClass(class1);//NSString元类
    Class rootMetaClass = object_getClass(metaClass);//根元类
    Class rootRootMetaClass = object_getClass(rootMetaClass);//根元类
    NSLog(@"%p 实例对象 ",string);
    NSLog(@"%p 类 %@",class1,NSStringFromClass(class1));
    NSLog(@"%p 元类 %@",metaClass,NSStringFromClass(metaClass));
    NSLog(@"%p 根元类 %@",rootMetaClass,NSStringFromClass(rootMetaClass));
    NSLog(@"%p 根根元类 %@",rootRootMetaClass,NSStringFromClass(rootRootMetaClass));

    Class rootMetaClass_superclass = rootMetaClass.superclass;//根元类的superclass
    NSLog(@"根根元类的superclass:%@",NSStringFromClass(rootMetaClass_superclass));

输出结果:

0x102d48078 实例对象 
0x1d80e3d10 类 __NSCFConstantString
0x1d80e3cc0 元类 __NSCFConstantString
0x1d80c66c0 根元类 NSObject
0x1d80c66c0 根根元类 NSObject
根根元类的superclass:NSObject

superclass验证

    NSString *string = @"字符串";
    Class class1 = object_getClass(string);//NSString类对象
    Class class2 = class1.superclass;
    NSLog(@"%@ 的superclass是 %@",NSStringFromClass(class1),NSStringFromClass(class2));
    Class class3 = class2.superclass;
    NSLog(@"%@ 的superclass是 %@",NSStringFromClass(class2),NSStringFromClass(class3));
    Class class4 = class3.superclass;
    NSLog(@"%@ 的superclass是 %@",NSStringFromClass(class3),NSStringFromClass(class4));
    Class class5 = class4.superclass;
    NSLog(@"%@ 的superclass是 %@",NSStringFromClass(class4),NSStringFromClass(class5));
    Class class6 = class5.superclass;
    NSLog(@"%@ 的superclass是 %@",NSStringFromClass(class5),NSStringFromClass(class6));

输出结果:

 __NSCFConstantString 的superclass是 __NSCFString
 __NSCFString 的superclass是 NSMutableString
NSMutableString 的superclass是 NSString
NSString 的superclass是 NSObject
NSObject 的superclass是 (null)

如果你正在跳槽或者正准备跳槽不妨动动小手,添加一下咱们的交流群1012951431来获取一份详细的大厂面试资料为你的跳槽多添一份保障。

二、class_rw_t 与 class_ro_t

1、class_ro_t 一"码"当先:

struct class_ro_t {
    uint32_t flags;
    uint32_t instanceStart;
    uint32_t instanceSize;
#ifdef __LP64__
    uint32_t reserved;
#endif

    const uint8_t * ivarLayout;

    const char * name;
    method_list_t * baseMethodList;
    protocol_list_t * baseProtocols;
    const ivar_list_t * ivars;

    const uint8_t * weakIvarLayout;
    property_list_t *baseProperties;

    method_list_t *baseMethods() const {
        return baseMethodList;
    }
};

  • uint32_t instanceSize;——instance对象占用的内存空间
  • const char * name;——类名
  • const ivar_list_t * ivars;——类的成员变量列表

class_ro_t存储了当前类在编译期就已经确定的属性、方法以及遵循的协议,里面是没有分类的方法的。那些运行时添加的方法将会存储在运行时生成的class_rw_t中。
ro即表示read only,是无法进行修改的。

2、class_rw_t 一"码"当先:

// 可读可写
struct class_rw_t {
    // Be warned that Symbolication knows the layout of this structure.
    uint32_t flags;
    uint32_t version;

    const class_ro_t *ro; // 指向只读的结构体,存放类初始信息

    /*
     这三个都是二位数组,是可读可写的,包含了类的初始内容、分类的内容。
     这三个二位数组中的数据有一部分是从class_ro_t中合并过来的。
     */
    method_array_t methods; // 方法列表(类对象存放对象方法,元类对象存放类方法)
    property_array_t properties; // 属性列表
    protocol_array_t protocols; //协议列表

    Class firstSubclass;
    Class nextSiblingClass;

    //...
    }

3、class_rw_t生成时机

class_rw_t生成在运行时,在编译期间,class_ro_t结构体就已经确定,objc_class中的bits的data部分存放着该结构体的地址。在runtime运行之后,具体说来是在运行runtime的realizeClass 方法时,会生成class_rw_t结构体,该结构体包含了class_ro_t,并且更新data部分,换成class_rw_t结构体的地址。

类的realizeClass运行之前:

然后在加载 ObjC 运行时的过程中在 realizeClass 方法中:

  • 从 class_data_bits_t 调用 data 方法,将结果从 class_rw_t 强制转换为 class_ro_t 指针
  • 初始化一个 class_rw_t 结构体
  • 设置结构体 ro 的值以及 flag
  • 最后设置正确的 data。
const class_ro_t *ro = (const class_ro_t *)cls->data();
class_rw_t *rw = (class_rw_t *)calloc(sizeof(class_rw_t), 1);
rw->ro = ro;
rw->flags = RW_REALIZED|RW_REALIZING;
cls->setData(rw);

但是,在这段代码运行之后 class_rw_t 中的方法,属性以及协议列表均为空。这时需要 realizeClass 调用 methodizeClass 方法来将类自己实现的方法(包括分类)、属性和遵循的协议加载到 methods、 properties 和 protocols 列表中。

realizeClass 方法执行过后的类所占用内存的布局:

细看两个结构体的成员变量会发现很多相同的地方,他们都存放着当前类的属性、实例变量、方法、协议等等。区别在于:class_ro_t存放的是编译期间就确定的;而class_rw_t是在runtime时才确定,它会先将class_ro_t的内容拷贝过去,然后再将当前类的分类的这些属性、方法等拷贝到其中。所以可以说class_rw_t是class_ro_t的超集,当然实际访问类的方法、属性等也都是访问的class_rw_t中的内容。

4、method_t

上面我们剖析了class_rw_t、class_ro_t这两个重要部分的结构,并且主要关注了其中的方法列表部分,而从上面的分析,可发现里面最基本也是重要的单位是method_t,这个结构体包含了描述一个方法所需要的各种信息。

struct method_t {
    SEL name;
    const char *types;
    IMP imp;
};

变量介绍可以参考之前文章:iOS 代码注入—— hook 实践

三、Runtime 初始化函数

1、一"码"当先

/***********************************************************************
* _objc_init
* Bootstrap initialization. Registers our image notifier with dyld.
* Called by libSystem BEFORE library initialization time
**********************************************************************/

void _objc_init(void)
{
    static bool initialized = false;
    if (initialized) return;
    initialized = true;

    // fixme defer initialization until an objc-using image is found?
    environ_init();
    tls_init();
    static_init();
    lock_init();
    exception_init();

    _dyld_objc_notify_register(&map_images, load_images, unmap_image);
}

_dyld_objc_notify_register(&map_images, load_images, unmap_image)。这个函数里面的三个参数分别是另外三个函数:

  • map_images -- Process the given images which are being mapped in by dyld.(处理那些正在被dyld映射的镜像文件)
  • load_images -- Process +load in the given images which are being mapped in by dyld.(处理那些正在被dyld映射的镜像文件中的+load方法)
  • unmap_image -- Process the given image which is about to be unmapped by dyld.(处理那些将要被dyld进行去映射操作的镜像文件)

我们查看一下map_images方法,点进去:

/***********************************************************************
* map_images
* Process the given images which are being mapped in by dyld.
* Calls ABI-agnostic code after taking ABI-specific locks.
*
* Locking: write-locks runtimeLock
**********************************************************************/
void
map_images(unsigned count, const char * const paths[],
           const struct mach_header * const mhdrs[])
{
    mutex_locker_t lock(runtimeLock);
    return map_images_nolock(count, paths, mhdrs);
}

四、分类底层原理

根据map_images函数,继续点进去看,可以看到如下代码:

// Discover categories. 
    for (EACH_HEADER) {
        category_t **catlist = 
            _getObjc2CategoryList(hi, &count);
        bool hasClassProperties = hi->info()->hasCategoryClassProperties();

        for (i = 0; i < count; i++) {
            category_t *cat = catlist[i];
            Class cls = remapClass(cat->cls);

            if (!cls) {
                // Category's target class is missing (probably weak-linked).
                // Disavow any knowledge of this category.
                catlist[i] = nil;
                if (PrintConnecting) {
                    _objc_inform("CLASS: IGNORING category \?\?\?(%s) %p with "
                                 "missing weak-linked target class", 
                                 cat->name, cat);
                }
                continue;
            }

            // Process this category. 
            // First, register the category with its target class. 
            // Then, rebuild the class's method lists (etc) if 
            // the class is realized. 
            bool classExists = NO;
            if (cat->instanceMethods ||  cat->protocols  
                ||  cat->instanceProperties) 
            {
                addUnattachedCategoryForClass(cat, cls, hi);
                if (cls->isRealized()) {
                    remethodizeClass(cls);
                    classExists = YES;
                }
                if (PrintConnecting) {
                    _objc_inform("CLASS: found category -%s(%s) %s", 
                                 cls->nameForLogging(), cat->name, 
                                 classExists ? "on existing class" : "");
                }
            }

            if (cat->classMethods  ||  cat->protocols  
                ||  (hasClassProperties && cat->_classProperties)) 
            {
                addUnattachedCategoryForClass(cat, cls->ISA(), hi);
                if (cls->ISA()->isRealized()) {
                    remethodizeClass(cls->ISA());
                }
                if (PrintConnecting) {
                    _objc_inform("CLASS: found category +%s(%s)", 
                                 cls->nameForLogging(), cat->name);
                }
            }
        }
    }

根据代码:

category_t *cat = catlist[i];

一开始的那个catlist是一个二维数组,里面的成员也是一个一个的数组,也就是代码里面的cat所指向的数组,它的类型是category_t *,说明cat数组里面装的就是category_t,一个cat里面装的就是某个class所对应的所有category。

那么什么决定了这些category_t在cat数组中的顺序呢?
答案是category文件的编译顺序决定的。先参与编译的,就放在数组的前面,后参与编译的,就放在数组后面。我们可以在xcode-->target-->Build Phases-->Compile Sources列表查看和调整category文件的编译顺序

加载分类的最后,执行方法:remethodizeClass(cls->ISA());

static void remethodizeClass(Class cls)
{
    category_list *cats;
    bool isMeta;

    runtimeLock.assertLocked();

    isMeta = cls->isMetaClass();

    // Re-methodizing: check for more categories
    if ((cats = unattachedCategoriesForClass(cls, false/*not realizing*/))) {
        if (PrintConnecting) {
            _objc_inform("CLASS: attaching categories to class '%s' %s", 
                         cls->nameForLogging(), isMeta ? "(meta)" : "");
        }

        attachCategories(cls, cats, true /*flush caches*/);        
        free(cats);
    }
}

然后在这里面找到一个方法attachCategories,看名字就知道,附着分类,也就是把分类的内容添加/合并到class里面,感兴趣的可以自己查看一下这个方法,这个理就不做解释了。

五、方法缓存

1、数据结构

它的底层是通过散列表(哈希表)的数据结构来实现的,用于缓存曾经调用过的方法,可以提高方法的查找速度。
首先,回顾一下正常情况下方法调用的流程。假设我们调用一个实例方法[obj XXXX];

  • obj -> isa -> obj的Class对象 -> method_array_t methods -> 对该表进行遍历查找,找到就调用,没找到继续往下走
  • obj -> superclass -> obj的父类 -> isa -> method_array_t methods -> 对父类的方法列表进行遍历查找,找到就调用,没找到就重复本步骤
  • 直到NSObject -> isa -> NSObject的Class对象 -> method_array_t,如果还是没有找到就会crash

如果XXXX方法在程序内会被频繁的调用,那么这种逐层便利查找的方式肯定是效率低下的,因此苹果设计了cache_t cache,当XXXX第一次被调用的时候,会按照常规流程查找,找到之后,就会被加入到cache_t cache中,当再次被调用的时候,系统就会直接现到cache_t cache来查找,找到就直接调用,这样便大大提升了查找的效率。

struct cache_t {
    struct bucket_t *_buckets;
    mask_t _mask;
    mask_t _occupied;
}

  • struct bucket_t *_buckets; —— 用来缓存方法的散列/哈希表
  • mask_t _mask; —— 这个值 = 散列表长度 - 1
  • mask_t _occupied; —— 表示已经缓存的方法的数量

_buckets散列表里面的存储单元是bucket_t,

struct bucket_t {
private:
    cache_key_t _key;
    IMP _imp;
}

  • cache_key_t _key; —— 这个key实际上就是方法的SEL,也就是方法名
  • IMP _imp; —— 这个就是方法对应的函数的内存地址

2、缓存逻辑

  • (1) 当一个对象接收到消息时[obj message];,首先根据obj的isa指针进入它的类对象class里面。
  • (2) 在obj的class里面,首先到缓存cache_t里面查询方法message的函数实现,如果找到,就直接调用该函数。
  • (3) 如果上一步没有找到对应函数,在对该class的方法列表进行二分/遍历查找,如果找到了对应函数,首先会将该方法缓存到obj的类对象class的cache_t里面,然后对函数进行调用。
  • (4) 在每次进行缓存操作之前,首先需要检查缓存容量,如果缓存内的方法数量超过规定的临界值(设定容量的3/4),需要先对缓存进行2倍扩容,原先缓存过的方法全部丢弃,然后将当前方法存入扩容后的新缓存内。
  • (5) 如果在obj的class对象里面,发现缓存和方法列表都找不到mssage方法,则通过class的superclass指针进入它的父类对象father_class里面
  • (6) 进入father_class后,首先在它的cache_t里面查找mssage,如果找到了该方法,那么会首先将方法缓存到消息接受者obj的类对象class的cache_t里面,然后调用方法对应的函数。
  • (7) 如果上一步没有找到方法,将会对father_class的方法列表进行遍历二分/遍历查找,如果找到了mssage方法,那么同样,会首先将方法缓存到消息接受者obj的类对象class的cache_t里面,然后调用方法对应的函数。需要注意的是,这里并不会将方法缓存到当前父类对象father_class的cache_t里面
  • (8) 如果还没找到方法,则会通过father_class的superclass进入更上层的父类对象里面,按照(6)->(7)->(8)步骤流程重复。如果此时已经到了基类对象NSObject,仍没有找到mssage,则进入步骤(9)

如果你正在跳槽或者正准备跳槽不妨动动小手,添加一下咱们的交流群1012951431来获取一份详细的大厂面试资料为你的跳槽多添一份保障。

六、消息转发

第一步:Method resolution 方法解析处理阶段
如果调用了对象方法首先会进行+(BOOL)resolveInstanceMethod:(SEL)sel判断
如果调用了类方法 首先会进行 +(BOOL)resolveClassMethod:(SEL)sel判断
两个方法都为类方法;

+ (BOOL)resolveClassMethod:(SEL)sel {
    ///这里动态添加方法
    return YES;
}
+ (BOOL)resolveInstanceMethod:(SEL)sel {
    ///这里动态添加方法
    return YES;
}

_class_resolveInstanceMethod源码解析

/***********************************************************************
* _class_resolveInstanceMethod
* Call +resolveInstanceMethod, looking for a method to be added to class cls.
* cls may be a metaclass or a non-meta class.
* Does not check if the method already exists.
**********************************************************************/
static void _class_resolveInstanceMethod(id inst, SEL sel, Class cls)
{
    SEL resolve_sel = @selector(resolveInstanceMethod:);

    if (! lookUpImpOrNilTryCache(cls, resolve_sel, cls->ISA())) {
        // Resolver not implemented.
        return;
    }

    BOOL (*msg)(Class, SEL, SEL) = (typeof(msg))objc_msgSend;
    bool resolved = msg(cls, resolve_sel, sel);

    // Cache the result (good or bad) so the resolver doesn't fire next time.
    // +resolveInstanceMethod adds to self a.k.a. cls
    IMP imp = lookUpImpOrNilTryCache(inst, sel, cls);

    if (resolved  &&  PrintResolving) {
        if (imp) {
            _objc_inform("RESOLVE: method %c[%s %s] "
                         "dynamically resolved to %p", 
                         cls->isMetaClass() ? '+' : '-', 
                         cls->nameForLogging(), sel_getName(sel), imp);
        }
        else {
            // Method resolver didn't add anything?
            _objc_inform("RESOLVE: +[%s resolveInstanceMethod:%s] returned YES"
                         ", but no new implementation of %c[%s %s] was found",
                         cls->nameForLogging(), sel_getName(sel), 
                         cls->isMetaClass() ? '+' : '-', 
                         cls->nameForLogging(), sel_getName(sel));
        }
    }
}

从runtime的源码,resolveInstanceMethod的返回值对于消息转发流程没有任何意义,这个返回值只和debug的信息相关。
这两个方法是最先走到的方法,可以在这两个方法中动态的添加方法,进行消息转发。这里有一个需要特别注意的地方,类方法需要添加到元类里面,原因这里就不赘述了。

**第二步:Fast forwarding 快速转发阶段 **

- (id)forwardingTargetForSelector:(SEL)aSelector {
    return [xxx new];
}

这个里可以快速重定向成其他对象,已经让备用的对象去响应了该对象本身无法响应的一个SEL

第三步:Normal forwarding 常规转发阶段

//返回方法签名
-(NSMethodSignature *)methodSignatureForSelector:(SEL)aSelector{
    if ([NSStringFromSelector(aSelector) isEqualToString:@"xxx"]) {
        return [[xxx new] methodSignatureForSelector:aSelector];
    }
    return [super methodSignatureForSelector:aSelector];
}

//处理返回的方法签名
-(void)forwardInvocation:(NSInvocation *)anInvocation{
    if ([NSStringFromSelector(anInvocation.selector) isEqualToString:@"xxx"]) {
        [anInvocation invokeWithTarget:[xxx new]];
    }else{
        [super forwardInvocation:anInvocation];
    }
}

自动签名

-(NSMethodSignature *)methodSignatureForSelector:(SEL)aSelector{
    //如果返回为nil则进行自动签名
   if ([super methodSignatureForSelector:aSelector]==nil) {
        NSMethodSignature * sign = [NSMethodSignature signatureWithObjCTypes:"v@:"];
        return sign;
    }
    return [super methodSignatureForSelector:aSelector];
}

-(void)forwardInvocation:(NSInvocation *)anInvocation{
    //创建备用对象
    xxx * backUp = [xxx new];
    SEL sel = anInvocation.selector;
    //判断备用对象是否可以响应传递进来等待响应的SEL
    if ([backUp respondsToSelector:sel]) {
        [anInvocation invokeWithTarget:backUp];
    }else{
       // 如果备用对象不能响应 则抛出异常
        [self doesNotRecognizeSelector:sel];
    }
}

////触发崩溃
- (void)doesNotRecognizeSelector:(SEL)aSelector {

}

七、super的本质

1、定义

  • super—— 是一个指向结构体指针struct objc_super *,它里面的内容是{消息接受者 recv, 消息接受者的父类类对象 [[recv superclass] class]},objc_msgSendSuper会将消息接受者的父类类对象作为消息查找的起点。

2、流程
[obj message] -> 在obj的类对象cls查找方法 -> 在cls的父类对象[cls superclass]查找方法 -> 在更上层的父类对象查找方法 -> ... -> 在根类类对象 NSObject里查找方法

[super message] -> 在obj的类对象cls查找方法(跳过此步骤) -> (直接从这一步开始)在cls的父类对象[cls superclass]查找方法 -> 在更上层的父类对象查找方法 -> ... -> 在根类类对象 NSObject里查找方法

3、实例

 NSLog(@"[self class] = %@",[self class]);

  • 接受者 当前class实例对象
  • 最终调用的方法:基类NSObject的-(Class)class方法
 NSLog(@"[super class] = %@",[super class]);

  • 接受者 当前class实例对象
  • 最终调用的方法:基类NSObject的-(Class)class方法
 NSLog(@"[self superclass] = %@",[self superclass]);

  • 接受者 当前class实例对象
  • 最终调用的方法:基类NSObject的-(Class) superclass方法
 NSLog(@"[super superclass] = %@",[super superclass]);

  • 接受者 当前class实例对象
  • 最终调用的方法:基类NSObject的-(Class) superclass方法

因此 [self class] [super class] [self superclass] [super superclass] 的值都相等

至此,runtime相关的知识点全部总结完毕,该文章将会持续更新迭代!!
看到就是缘分??,如发现任何有误之处,肯请留言纠正,谢谢。