再扯扯智能指针之protobuf

一直对智能指针很感兴趣，之前写过一篇扯扯智能指针，平时没事也会翻出来boost chrome源码里的智能指针学习下。

在这个过程中发现一个有趣的现象，很多项目在选择开源的时候，为了减少用户使用的成本，往往希望尽量少的@第三方代码，特别是有些源码比较庞大、编译耗时的第三方库，例如boost。我厂开源的sofa-rpc里为了不依赖boost同时又使用智能指针，就有大量的smartptr代码，看了下感觉是从boost拿过来的，不过本身已经依赖了boost，有些画蛇添足。

个人比较推荐的是protobuf里的做法，因为c11已经默认支持了std::shared_ptr std::enable_shared_from_this等，如果用户的编译环境是c11，那么直接使用std原生的智能指针，否则使用模块里或者第三方的代码，比如boost。

protobuf里的智能指针是自己实现的，比较简单（只有500行），相比boost更具有可读性，当然缺点是提供的并不全，比如make_shared。

本文主要介绍下protobuf里智能指针的源码实现，包括shared_ptr weak_ptr enable_from_this，protobuf版本为2.6.0，代码位于google/protobuf/stubs/shared_ptr.h。

1. 使用std原生智能指针

如果是c11或者MSVC编译器，使用std原生指针，这点通过alias完成。

namespace google {
namespace protobuf {
namespace internal {
#if !defined(UTIL_GTL_USE_STD_SHARED_PTR) && \
    (defined(COMPILER_MSVC) || defined(LANG_CXX11))
#define UTIL_GTL_USE_STD_SHARED_PTR 1
#endif

#if defined(UTIL_GTL_USE_STD_SHARED_PTR) && UTIL_GTL_USE_STD_SHARED_PTR
using std::enable_shared_from_this;
using std::shared_ptr;
using std::static_pointer_cast;
using std::weak_ptr;
#else
//自定义的智能指针实现
#endif
}
}
}

如果没有定义，那么就使用protobuf的实现。

2. 智能指针的实现

那么接下来说下protobuf里的实现过程。

逐个介绍下

SharedPtrControlBlock：引用计数管理
shared_ptr
weak_ptr
enable_shared_from_this
static_pointer_cast：智能指针类型转换

2.1. google::protobuf::internal::SharedPtrControlBlock用于计数

智能指针自然少不了引用计数，计数通过SharedPtrControlBlock完成

class SharedPtrControlBlock {
  template <typename T> friend class shared_ptr;
  template <typename T> friend class weak_ptr;
 private:
  SharedPtrControlBlock() : refcount_(1), weak_count_(1) { }
  Atomic32 refcount_;
  Atomic32 weak_count_;
};

原始对象由智能指针接管后，会开辟一段内存用于计数。同一原始对象上的这些智能指针，无论是shared_ptr还是weak_ptr，都可以访问到这段内存，对引用计数进行加减操作。refcount_ weak_count_分别是当前shared_ptr weak_ptr的个数（weak_count_严格来讲是weak_ptr个数+1）。

注意这两个计数初始化值均为1，也就是只有真的要管理内存了，SharedPtrControlBlock才会创建出来。

2.2. google::protobuf::internal::shared_ptr

shared_ptr负责管理对象所在的内存，通过对Copy Constructor/Operator =等的封装，确保对象上增加shared_ptr计数加1，析构shared_ptr时计数减1，并在合适的时机释放原始指针和计数。因此包含两个成员变量：原始指针和SharedPtrControlBlock。

  T* ptr_;
  SharedPtrControlBlock* control_block_;

2.2.1. 构造、复制构造以及operator=

空的shared_ptr不管理任何指针，同时control_block_也不会被new出来

shared_ptr() : ptr_(NULL), control_block_(NULL) {}

当传入一个raw pointer时，control_block_被new出来并且使用默认值，这也是SharedPtrControlBlock初始化时refcount_设置为1的原因：

  explicit shared_ptr(T* ptr)
      : ptr_(ptr),
        control_block_(ptr != NULL ? new SharedPtrControlBlock : NULL) {
    // If p is non-null and T inherits from enable_shared_from_this, we
    // set up the data that shared_from_this needs.
    MaybeSetupWeakThis(ptr);
  }

MaybeSetupWeakThis主要的作用是：

如果对象父类是enable_from_this类型，那么初始化enable_from_this的成员变量。否则什么都不干。这里的语法也比较有意思，实现了两个版本的MaybeSetupWeakThis

  void MaybeSetupWeakThis(enable_shared_from_this<T>* ptr);
  void MaybeSetupWeakThis(...) { }

其中”大众化”的版本什么都不做，enable_shared_from_this参数的版本我们放到本文后面讲。

复制构造函数有两种，主要是参数类型上的区别，既支持定义时的模板类型T，也支持其他类型U，对U的要求就是：U可以隐式转化为T。两者最终都调用InitializeWithStaticCast

  template <typename U, typename V>
  void InitializeWithStaticCast(const shared_ptr<V>& r) {
    if (r.control_block_ != NULL) {
      RefCountInc(&r.control_block_->refcount_);

      ptr_ = static_cast<U*>(r.ptr_);
      control_block_ = r.control_block_;
    }
  }

可以看到这里就是一个拷贝ptr_ control_block_以及加计数的过程。

operator=稍微复杂一点，因为还要考虑到之前的ptr_是否需要释放，主要通过一个临时变量 + std::swap完成，本质上则是把资源释放的判断放到了临时变量的析构里。

注意这里的计数是针对refcount_，增加shared_ptr并不会引起weak_count_变化。

2.2.2. 析构

shared_ptr在析构时需要考虑是否释放ptr_以及control_block_，直接看下代码：

  ~shared_ptr() {
    if (ptr_ != NULL) {
      //首先判断refcount_减1的值
      //如果为0，表示自己是最后一个own原始指针的智能指针，需要释放ptr_
      if (!RefCountDec(&control_block_->refcount_)) {
        delete ptr_;

        // weak_count_ is defined as the number of weak_ptrs that observe
        // ptr_, plus 1 if refcount_ is nonzero.
        if (!RefCountDec(&control_block_->weak_count_)) {
          delete control_block_;
        }
      }
    }
  }

delete ptr_的判断在代码里说明了，weak_count_重点说下：

weak_count_的值初始化为1，随着weak_ptr的构造和析构分别增减1。因为可以认为ptr_与shared_ptr个数相关，而control_block_则跟shared_ptr/weak_ptr个数都相关，严格来讲无论多少个shared_ptr，对weak_count_贡献都是+1，而weak_ptr_则每个贡献+1。上面的析构函数里当原始指针上的最后一个shared_ptr析构时，会对weak_ptr_贡献-1，此时是否delete control_block_则由weak_ptr_的个数决定。

boost里的注释就比较简单直接：

class sp_counted_base
{
private:
    ...

    int use_count_;        // #shared
    int weak_count_;       // #weak + (#shared != 0)

这样的设计是非常合理的，保证了shared_ptr与weak_ptr_共同管理control_block_，同时相比其他设计保证了自增自减的操作最少。

此外shared_ptr提供了use_count reset unique等常见接口。

2.3. google::protobuf::internal::weak_ptr

weak_ptr相当于指针的弱owner，包含两个成员变量

  element_type* ptr_;
  SharedPtrControlBlock* control_block_;

实现上跟shared_ptr比较类似，不同的是复制时增加的计数是weak_count_

  void CopyFrom(T* ptr, SharedPtrControlBlock* control_block) {
    //复制成员变量：ptr_ control_block_
    ptr_ = ptr;
    control_block_ = control_block;
    if (control_block_ != NULL)
      //增加引用计数
      RefCountInc(&control_block_->weak_count_);
  }

众所周知weak_ptr最常用的接口是lock，我们重点分析下实现

  shared_ptr<T> lock() const {
    shared_ptr<T> result;
    if (control_block_ != NULL) {
      Atomic32 old_refcount;
      do {
        old_refcount = control_block_->refcount_;
        //如果refcount_ == 0，表示没有shared_ptr在管理ptr_，ptr_已经释放
        if (old_refcount == 0)
          break;
        //while这句非常关键，注意这种race condition
        //最后一个shared_ptr将refcount_置0，然后析构ptr_
        //此时执行while前control_block_->refcount_ = 0， old_refcount = 1
        //因此除了Swap，Compare是必须的
      } while (old_refcount !=
               NoBarrier_CompareAndSwap(
                   &control_block_->refcount_, old_refcount,
                   old_refcount + 1));
      if (old_refcount > 0) {
        result.ptr_ = ptr_;
        result.control_block_ = control_block_;
      }
    }

    return result;
  }

解释下while判断条件的必要性：

CompareAndSwap的伪代码如下：

Atomic32 NoBarrier_CompareAndSwap(volatile Atomic32* ptr,
                                  Atomic32 old_value,
                                  Atomic32 new_value)
// Atomically execute:
      result = *ptr;
      if (*ptr == old_value)
        *ptr = new_value;
      return result;

如果ptr指向的内存当前的值为old_value，那么替换为new_value，无论什么情况下都返回old_value。

为什么必须要引入这个函数呢？

因为即使control_block_->refcount_是原子的，也不能保证在修改过程中没有其他线程在修改，因此

比如假设我们这么写

if (old_refcount > 0) {
  RefCountInc(&control_block_->refcount_);
}

如果在if判断条件满足之后，RefCountInc调用之前，持有该内存的shared_ptr析构(if判断满足条件)。

      if (!RefCountDec(&control_block_->refcount_)) {
        delete ptr_;

此时race condition就会出现，ptr_已经delete，但是lock还是返回了一个shared_ptr。而CompareAndSwap则保证了这点。参考下lock函数的注释：

  // Return a shared_ptr that owns the object we are observing. If we
  // have expired, the shared_ptr will be empty. We have to be careful
  // about concurrency, though, since some other thread might be
  // destroying the last owning shared_ptr while we're in this
  // function.  We want to increment the refcount only if it's nonzero
  // and get the new value, and we want that whole operation to be
  // atomic.

trick一点，比如我们这么写：

if (old_refcount > 0) {
  RefCountInc(&control_block_->refcount_);
}
if (control_block->refcount_ == 1) {
  //自己是最后一个，无效内存
} else {
  //有效？
}

这种方式不仅不够“优雅”，而且无法解决两个weak_ptr同时lock的情况。

2.4. google::protobuf::internal::enable_shared_from_this

enable_shared_from_this使用时采用继承的方式。

比如：

class LinkBaseReader : public boost::enable_shared_from_this<LinkBaseReader>

只包含一个成员变量：

  weak_ptr<T> weak_this_;

在shared_ptr一节里介绍过MaybeSetupWeakThis这个函数，实现上就是填充了weak_this_这个成员变量：

template<typename T>
void shared_ptr<T>::MaybeSetupWeakThis(enable_shared_from_this<T>* ptr) {
  if (ptr) {
    CHECK(ptr->weak_this_.expired()) << "Object already owned by a shared_ptr";
    ptr->weak_this_ = *this;
  }
}

shared_from_this则提供了接口返回shared_ptr<T>，也就是自身的智能指针。

  shared_ptr<T> shared_from_this() {
    CHECK(!weak_this_.expired()) << "No shared_ptr owns this object";
    return weak_this_.lock();
  }

这里重点说下为什么要使用weak_ptr_？如果要通过shared_from_this返回自身的智能指针，那么保存的成员变量无非有三种选择：raw-pointer/shared-pointer/weak-pointer。

存储原始指针T* ptr_不可行：shared_from_this调用时返回shared_ptr<T>(ptr_)不可行，因为每个返回的shared_ptr<T>都会尝试释放ptr_
存储shared_ptr_不可行，因为一个对象不应该包含指向自己的智能指针作为成员变量，否则引用计数永远>1，这点和之前介绍的交叉引用很像。
存储weak_ptr_可行，不会固定增加一个引用计数，注意weak_this_是在shared_ptr::MaybeSetupWeakThis调用时初始化的，也就是shared_ptr::shared_ptr(T* ptr)，这也是为什么继承enable_shared_from_this的子类对象一定需要是heap上对象同时由shared_ptr管理生命周期。代码weak_this_->expired接口的作用正是为了判断是否符合上述条件。

因此注意不要在构造函数/析构函数里调用shared_from_this，weak_this_还没有指向任何shared_ptr.

2.5. google::protobuf::internal::static_pointer_cast

static_pointer_cast用于智能指针之间的类型转换，单独说下这个的原因是有个比较有意思的语法

template <typename T, typename U>
shared_ptr<T> static_pointer_cast(const shared_ptr<U>& rhs) {
  shared_ptr<T> lhs;
  lhs.template InitializeWithStaticCast<T>(rhs);
  return lhs;
}

InitializeWithStaticCast是shared_ptr的成员函数

  template <typename U, typename V>
  void InitializeWithStaticCast(const shared_ptr<V>& r)

注意lhs.template ...这句，如果我第一次写上面那段代码，估计会写成

  lhs.InitializeWithStaticCast<T>(rhs);

不过这样编译器会报错，跟two-phase-lookup有关，具体可以参考这里，简言之，就是编译器需要明确告诉它这是一个类型。

PREVIOUSprotobuf之string bytes的区别

NEXTgithub博客绑定域名