[翻译] 编写高性能 .NET 代码--第二章 GC -- 将长生命周期对象和大对象池化


将长生命周期对象和大对象池化

请记住最开始说的原则:对象要么立即回收要么一直存在。它们要么在0代被回收,要么在2代里一直存在。有些对象本质是静态的,生命周期从它们被创建开始,到程序停止才会结束。其它对象显然不需要永远存在下去,但他们的生命周期会存在程序的某些上下文里。它们的存活时间会超过0代(1代)回收。这些类型的对象可以作为池化对象的备选。这虽然需要你手动管理内存,但实际情况下这是一个很好的选择。另外一个重要的需要池化的对象是分配在LOH里的大对象。

没有一个单一的标准方案或者API来实现对象的池化。 这需要你根据你的程序和对象的类型来设计对应方案。

对于如何管理池化对象,你可以将其当做非托管资源(内存)来进行管理。.NET对于这类资源有一个种管理模式:IDisposable。在本章前面我们介绍了如何实现这种模式。一个比较合理的方式是实现IDisposable接口,在Dispose方法里将对象丢回对象池。
实现一个好的对象池策略并不简单,他取决于你程序要如何使用,以及那种类型的对象需要进行池化。
下面的栗子,实现了一个简单的对象池,你可以从里面知道对象池会涉及那些内容。这个代码可以从 PooledObjects 的栗子工程里看到。


    interface IPoolableObject : IDisposable
    {
        int Size { get; }
        void Reset();
        void SetPoolManager(PoolManager poolManager);
    }

    internal class PoolManager
    {
        private class Pool
        {
            public int PooledSize { get; set; }

            public int Count
            {
                get { return this.Stack.Count; }
            }

            public Stack Stack { get; private set; }

            public Pool()
            {
                this.Stack = new Stack();
            }
        }

        private const int MaxSizePerType = 10*(1 << 10); // 10 MB 

        private Dictionary pools = new Dictionary();

        public int TotalCount
        {
            get
            {
                int sum = 0;
                foreach (var pool in this.pools.Values)
                {
                    sum += pool.Count;
                }
                return sum;
            }
        }

        public T GetObject() where T : class, IPoolableObject, new()
        {
            Pool pool;
            T valueToReturn = null;
            if (pools.TryGetValue(typeof (T), out pool))
            {
                if (pool.Stack.Count > 0)
                {
                    valueToReturn = pool.Stack.Pop() as T;
                }
            }
            if (valueToReturn == null)
            {
                valueToReturn = new T();
            }
            valueToReturn.SetPoolManager(this);
            return valueToReturn;
        }

        public void ReturnObject(T value) where T : class, IPoolableObject, new()
        {
            Pool pool;
            if (!pools.TryGetValue(typeof (T), out pool))
            {
                pool = new Pool();
                pools[typeof (T)] = pool;
            }
            if (value.Size + pool.PooledSize < MaxSizePerType)
            {
                pool.PooledSize += value.Size;
                value.Reset();
                pool.Stack.Push(value);
            }
        }
    }

    internal class MyObject : IPoolableObject
    {
        private PoolManager poolManager;
        public byte[] Data { get; set; }
        public int UsableLength { get; set; }

        public int Size
        {
            get { return Data != null ? Data.Length : 0; }
        }

        void IPoolableObject.Reset()
        {
            UsableLength = 0;
        }

        void IPoolableObject.SetPoolManager(PoolManager poolManager)
        {
            this.poolManager = poolManager;
        }

        public void Dispose()
        {
            this.poolManager.ReturnObject(this);
        }
    }


强制让每个对象都实现接口会麻烦一些,但它除了方便外,还有一个重要的事实:为了使对象池重用对象,你必须能完全理解并控制它们。每次对象回到对象池前,你的代码需要将对象重新设置到一个移植的,安全的状态。这意味着你不应该天真的直接用第三方的对象池组件。你需要设计接口,并让对象实现该接口,用来处理每个对象获取时的初始化过程。你还需要特别小心对.NET框架对象做池化。

特别需要注意的是用来做对象池的集合,因为它们的性质决定--你并不希望它们销毁所存储的数据(毕竟这是池的重点),但你需要一个可以表示可以为空和可用空间的集合。幸运的是,大多数集合类型都实现了长度和容量的参数。考虑到使用现有的.NET集合类型会存在风险,建议最好自己实现集合类型,并实现一些标准的集合接口(如:IList,ICollection等)。相关创建自己定义集合的内容,可参考本书第六章。另外一个策略就是让你设计的可回收对象实现一个终结器(析构函数)。如果终结器运行,则意味着Dispose方法没有执行,这将会是一个小小的bug。你也可以在你的程序里一些地方记录日志,崩溃信息或者一些信号信息。

请牢记,如果不清理对象池里的数据,这等同于内存泄漏。你的对象池应该有一个边界大小(无论是字节数量或者对象的数量),一旦超过,它应该通知GC清理多余的对象。理想情况下,你的对象池足够大,可以正常操作而不回收对象,但也会造成GC在执行回收时暂停时间变长,对象池里对象越多回收算法耗时也越多。当然最重要的还是对象池能满足你的需要。

我通常不会将对象池作为默认的解决方案。它作为一种通用机制,显得很笨重以及容易出错。但你可能会发现你的程序在某些类型上很适用对象池。在一个应用里分配了大量的LOH对象,我们调查后发现,可以将一个单一的对象池化就能解决99%的问题。这个就是MemoryStream,我们使用它来序列化网络传输数据。实际的实现不仅仅是将构建了一个MemoryStream的队列,因为要避免内存碎片,有一些更复杂的设计,但从本质上来说还是将它池化。每次使用完MemoryStream对象,它都会被放入对象池里。

下一篇:第二章 GC -- 减少大对象堆的碎片,在某些情况下强制执行完整GC,按需压缩大对象堆,在GC前收到消息通知,使用弱引用缓存对象