为什么多线程读写同一个文件 shared

为什么多线程读写 shared_ptr 要加锁?
我的图书馆
为什么多线程读写 shared_ptr 要加锁?
陈硕(giantchen_AT_gmail_DOT_com)
我在《Linux 多线程服务端编程:使用 muduo C++ 网络库》第 1.9 节“再论 shared_ptr 的线程安全”中写道: (shared_ptr)的引用计数本身是安全且无锁的,但对象的读写则不是,因为 shared_ptr 有两个数据成员,读写操作不能原子化。根据文档(), shared_ptr 的线程安全级别和内建类型、标准库容器、std::string 一样,即:
一个 shared_ptr 对象实体可被多个线程同时读取(文档例1);
两个 shared_ptr 对象实体可以被两个线程同时写入(例2),“析构”算写操作;
如果要从多个线程读写同一个 shared_ptr 对象,那么需要加锁(例3~5)。 请注意,以上是 shared_ptr 对象本身的线程安全级别,不是它管理的对象的线程安全级别。 后文(p.18)则介绍如何高效地加锁解锁。本文则具体分析一下为什么“因为 shared_ptr 有两个数据成员,读写操作不能原子化”使得多线程读写同一个 shared_ptr 对象需要加锁。这个在我看来显而易见的结论似乎也有人抱有疑问,那将导致灾难性的后果。本文以 boost::shared_ptr 为例,与 std::shared_ptr 可能略有区别。 shared_ptr 的数据结构 shared_ptr 是引用计数型(reference counting)智能指针,几乎所有的实现都采用在堆(heap)上放个计数值(count)的办法(除此之外理论上还有用循环链表的办法,不过没有实例)。具体来说,shared_ptr&Foo& 包含两个成员,一个是指向 Foo 的指针 ptr,另一个是 ref_count 指针(其类型不一定是原始指针,有可能是 class 类型,但不影响这里的讨论),指向堆上的 ref_count 对象。ref_count 对象有多个成员,具体的数据结构如图 1 所示,其中 deleter 和 allocator 是可选的。
图 1:shared_ptr 的数据结构。 为了简化并突出重点,后文只画出 use_count:
以上是 shared_ptr&Foo& x(new Foo); 对应的内存数据结构。 如果再执行 shared_ptr&Foo& y = 那么对应的数据结构如下。
但是 y=x 涉及两个成员的复制,这两步拷贝不会同时(原子)发生。 中间步骤 1,复制 ptr 指针:
中间步骤 2,复制 ref_count 指针,导致引用计数加 1:
步骤1和步骤2的先后顺序跟实现相关(因此步骤 2 里没有画出 y.ptr 的指向),我见过的都是先1后2。 既然 y=x 有两个步骤,如果没有 mutex 保护,那么在多线程里就有 race condition。 多线程无保护读写 shared_ptr 可能出现的 race condition 考虑一个简单的场景,有 3 个 shared_ptr&Foo& 对象 x、g、n:
shared_ptr&Foo& g(new Foo); // 线程之间共享的 shared_ptr shared_ptr&Foo& // 线程 A 的局部变量 shared_ptr&Foo& n(new Foo); // 线程 B 的局部变量 一开始,各安其事。
线程 A 执行 x = (即 read g),以下完成了步骤 1,还没来及执行步骤 2。这时切换到了 B 线程。
同时编程 B 执行 g = (即 write G),两个步骤一起完成了。 先是步骤 1:
再是步骤 2:
这是 Foo1 对象已经销毁,x.ptr 成了空悬指针! 最后回到线程 A,完成步骤 2:
多线程无保护地读写 g,造成了“x 是空悬指针”的后果。这正是多线程读写同一个 shared_ptr 必须加锁的原因。 当然,race condition 远不止这一种,其他线程交织(interweaving)有可能会造成其他错误。 思考,假如 shared_ptr 的 operator= 实现是先复制 ref_count(步骤 2)再复制 ptr(步骤 1),会有哪些 race condition? 杂项 shared_ptr 作为 unordered_map 的 key 如果把 boost::shared_ptr 放到 unordered_set 中,或者用于 unordered_map 的 key,那么要小心 hash table 退化为链表。 直到 Boost 1.47.0 发布之前,unordered_set&std::shared_ptr&T& & 虽然可以编译通过,但是其 hash_value 是 shared_ptr 隐式转换为 bool 的结果。也就是说,如果不自定义hash函数,那么 unordered_{set/map} 会退化为链表。 Boost 1.51 在 boost/functional/hash/extensions.hpp 中增加了有关重载,现在只要包含这个头文件就能安全高效地使用 unordered_set&std::shared_ptr& 了。 这也是 muduo 的 examples/idleconnection 示例要自己定义 hash_value(const boost::shared_ptr&T&& x) 函数的原因(书第 7.10.2 节,p.255)。因为 Debian 6 Squeeze、Ubuntu 10.04 LTS 里的 boost 版本都有这个 bug。 为什么图 1 中的 ref_count 也有指向 Foo 的指针? shared_ptr&Foo& sp(new Foo) 在构造 sp 的时候捕获了 Foo 的析构行为。实际上 shared_ptr.ptr 和 ref_count.ptr 可以是不同的类型(只要它们之间存在隐式转换),这是 shared_ptr 的一大功能。分 3 点来说: 1. 无需虚析构;假设 Bar 是 Foo 的基类,但是 Bar 和 Foo 都没有虚析构。 shared_ptr&Foo& sp1(new Foo); // ref_count.ptr 的类型是 Foo* shared_ptr&Bar& sp2 = sp1; // 可以赋值,自动向上转型(up-cast) sp1.reset(); // 这时 Foo 对象的引用计数降为 1 此后 sp2 仍然能安全地管理 Foo 对象的生命期,并安全完整地释放 Foo,因为其 ref_count 记住了 Foo 的实际类型。 2. shared_ptr&void& 可以指向并安全地管理(析构或防止析构)任何对象;muduo::net::Channel class 的 tie() 函数就使用了这一特性,防止对象过早析构,见书 7.15.3 节。 shared_ptr&Foo& sp1(new Foo); // ref_count.ptr 的类型是 Foo* shared_ptr&void& sp2 = sp1; // 可以赋值,Foo* 向 void* 自动转型 sp1.reset(); // 这时 Foo 对象的引用计数降为 1 此后 sp2 仍然能安全地管理 Foo 对象的生命期,并安全完整地释放 Foo,不会出现 delete void* 的情况,因为 delete 的是 ref_count.ptr,不是 sp2.ptr。 3. 多继承。假设 Bar 是 Foo 的多个基类之一,那么: shared_ptr&Foo& sp1(new Foo); shared_ptr&Bar& sp2 = sp1; // 这时 sp1.ptr 和 sp2.ptr 可能指向不同的地址,因为 Bar subobject 在 Foo object 中的 offset 可能不为0。 sp1.reset(); // 此时 Foo 对象的引用计数降为 1 但是 sp2 仍然能安全地管理 Foo 对象的生命期,并安全完整地释放 Foo,因为 delete 的不是 Bar*,而是原来的 Foo*。换句话说,sp2.ptr 和 ref_count.ptr 可能具有不同的值(当然它们的类型也不同)。 为什么要尽量使用 make_shared()? 为了节省一次内存分配,原来 shared_ptr&Foo& x(new Foo); 需要为 Foo 和 ref_count 各分配一次内存,现在用 make_shared() 的话,可以一次分配一块足够大的内存,供 Foo 和 ref_count 对象容身。数据结构是:
不过 Foo 的构造函数参数要传给 make_shared(),后者再传给 Foo::Foo(),这只有在 C++11 里通过 perfect forwarding 才能完美解决。 (.完.)
馆藏&23942
TA的最新馆藏[转]&[转]&[转]&
喜欢该文的人也喜欢多线程读写int值不需要同步? - ITeye问答
很多地方讲多线程时使用了下面UnsafeSequence类的getNext方法,说明如果不同步会得到错误的结果,但我的测试却从未出现过错误,请高手看看是怎么回事,谢谢!
多个线程同时持有对象us,它的getNext方法没有进行同步,按照书上的说法,由于有几个线程会同时拿到value,然后加1,10个线程分别加1后最终应该是一个小于9的值,但测试结果总是9。
public class Main2 {
public static void main(String[] args) {
UnsafeSequence us = new UnsafeSequence();
for (int i = 0; i & 10; i++) {
Runnable myRunnable = new MyRunnable(us);
new Thread(myRunnable).start();
public class MyRunnable implements Runnable {
private final UnsafeS
public MyRunnable(UnsafeSequence _us) {
public void run() {
System.out.println("next in " + Thread.currentThread().getName() + ": "
+ +us.getNext());
public class UnsafeSequence {
public int value = 0;
public int getNext() {
return value++;
}
下面是运行结果:
next in Thread-0: 0
next in Thread-9: 5
next in Thread-7: 4
next in Thread-5: 3
next in Thread-3: 2
next in Thread-1: 1
next in Thread-2: 6
next in Thread-4: 7
next in Thread-6: 8
next in Thread-8: 9
采纳的答案
多线程同步问题就是这点让人头疼:不是每次必然发生,有时候依赖数据或运行环境。
你的测试中没有发生的原因可能有很多,比如:
- 机器是单核的话,基本不会发生。多核的更加容易发生。
- 机器是多核的,但测试程序没能被系统分配成多线程。
- 运气问题。
我修改了下你的程序,在红线部分加入1秒睡眠,在我的环境下,是第3次发生的。
public class Test2 {
public static void main(String[] args) {
UnsafeSequence us = new UnsafeSequence();
int count = 10;
Thread[] ts = new Thread[count];
for (int i = 0; i & i++) {
Thread t = new Thread(new MyRunnable(us));
t.start();
class MyRunnable implements Runnable {
private final UnsafeS
public MyRunnable(UnsafeSequence _us) {
public void run() {
[color=red]Thread.sleep(1000);[/color]
} catch (InterruptedException e) {
e.printStackTrace();
System.out.println("next in " + Thread.currentThread().getName() + ": "
+ +us.getNext());
class UnsafeSequence {
public int value = 0;
public int getNext() {
return value++;
出错的结果如下
next in Thread-1: 0
next in Thread-0: 0
next in Thread-2: 1
next in Thread-5: 2
next in Thread-3: 3
next in Thread-4: 4
next in Thread-7: 5
next in Thread-8: 6
next in Thread-6: 7
next in Thread-9: 8
俺很负责的告诉你,基本类型的都是不可变类,所以,对于基本类型的String& Int& 什么什么的&& 不用考虑多线程问题。
已解决问题
未解决问题2017年11月
293031123456789101112131415161718192021222324252627282930123456789
评论 - 347
阅读排行榜
评论排行榜

我要回帖

更多关于 多线程读写 的文章

 

随机推荐