C++之stl::string写时拷贝导致的问题
这篇讲的是作者在实现数据结构序列化时,因滥用 `std::string` 作为缓冲区而踩到的一个隐蔽陷阱。具体来说,作者直接通过 `(char*)s.c_str()` 获取内部指针并使用 `fread` 写入数据,这在多数情况下看似高效且可行。然而,当代码中发生类似 `string s2 = s;` 的拷贝操作后,再对 `s2` 进行同样的 `fread` 操作,原本期望保持不变的 `s` 内容却意外被篡改了。 问题的根源在于部分 STL 实现(如旧版 GCC)采用了“写时拷贝”(copy-on-write)机制来优化 `string` 的拷贝性能。此时,拷贝操作仅共享底层指针,而非进行深拷贝。这就导致通过强制类型转换修改共享内存区的数据时,所有持有该指针的 `string` 对象都会受到影响。文章清晰对比了“写时拷贝”与“立即拷贝”(eager-copy)两种策略的差异与适用场景,并指出该 bug 因其延迟显现的特性而极难定位。 作者最终总结道,尽管将 `string` 作为临时缓冲区的写法在网络上屡见不鲜,但在“写时拷贝”的实现下,这种用法存在严重隐患。对于需要直接操作内存的场景,开发者应意识到 STL 容器的这些实现细节,或考虑使用更明确的缓冲区类型,以避免类似的陷阱。