Copy On Write(COW) 的罪与罚

缘起

对计算机有些了解的人,或多或少会对 Copy On Write 有些听闻。我接触这个名词最早是在操作系统的进程管理中,当子进程从父进程中 fork 出来时,其和父进程共享大部分的数据,对子进程而言这块内存是只读的。通过这么做,可以避免在子进程中创建时额外分配内存带来的开销。

进程管理的细节

子进程修改内存(案例1)

如果子进程要对共享的内存进行修改,那么内存管理系统就会分配额外的一块内存,然后将父进程的内存拷贝过去,然后子进程可以在这块拷贝过去的内存进行修改。

父进程修改内存(案例2)

书本上一般没提到的是如果是父进程修改内存,那么这块内存就会被修改,这个时候子进程怎么办呢?当然还是拷贝一块内存给它啊。本部分为猜测,无代码验证。

存储卷管理领域的快照流派

在存储卷管理领域里面,有个技术叫做快照,其从本质上来说就是记录了在指定的时刻,指定卷的所有的块状态。一旦快照被创建,那么意味着后续任何对现有磁盘块的更改都必须做额外处理。处理有两种流派,一种叫做 COW(Copy On Write)另外一种叫做ROW(Redirect On Write)。

COW 流派

这种流派跟进程管理的案例2类似,如果存储发现某个磁盘块要被更改,那么它会检查所有的快照,看看这些快照是不是已经对这块磁盘空间的数据进行了拷贝,如果没有的话则进行拷贝。待拷贝完毕后,数据会写入到该磁盘块。

优缺点

  • 缺点:在快照比较多的情况下,存在只针对一次写,需要发生一次读取和多次写入的情况,性能会急剧降低。快照可能会占用大量空间。
  • 优点:数据的连续性比较好,对未来连续数据读取有优势。在SSD下这个优点不是很明显。

ROW 流派

这种流派跟进程管理的案例1类似,如果存储发现某个磁盘块要被更改,那么它会检查所有快照,如果发现这个磁盘块被快照使用,那么会找到一块新的空间,将数据拷贝到新空间,然后在新空间进行数据修改。这种方式和 COW 有个本质上不一样,即其最开始并不是跟踪所有分配的卷的块,而是刚开始就要跟踪写入,而写入的内容可以分布在任意地方。随着写入范围的增加,其跟踪的块会越来越多,直到和分配的卷一样大小。

优缺点

  • 缺点:由于数据不是在原地修改,可能会导致数据碎片化严重,导致读取效率低下。这个缺点在 SSD 下不明显,但是在机械盘下就会成为瓶颈。
  • 优点:多个快照对性能影响很有限。可以合并多个随机写入变为大块的顺序写入,性能能够较大的提高。和 COW 相比,快照比较省空间。

两大流派的补充

在这里,我为什么会认为 COW 流派以开始就跟踪所有卷内磁盘块呢?那是因为在实现中,这么做在 COW 的情况下只有些许额外的存储开销,但是能够极大的简化实现难度。无论刚开始磁盘块上有没有有意义的数据,其实也判断不出来数据是不是有意义的,最终这些磁盘块都是会被文件系统使用到,不会有空间被浪费的。
但是在 ROW 的情况下,如果以开始就假定这些磁盘块有数据,意味着后续文件系统再也没有机会往这些磁盘块写东西了。这就是一个错误的实现了。
相比而言,前者是静态的,简洁的。后者则是动态的,复杂的。

现实的实现

  • LVM:COW,预先分配指定大小空间给快照,实验可以观察到快照空间的增长规律。
  • ZFS,Btrfs:ROW,原来的数据不被覆盖,Btrfs 可以设置为非这种模式

现实世界中的混用

Wikipedia 中将两者都称之为 copy on write。

参考

https://en.wikipedia.org/wiki/Copy-on-write#In_computer_storage
https://storageswiss.com/2016/04/01/snapshot-101-copy-on-write-vs-redirect-on-write/
https://en.wikipedia.org/wiki/Snapshot_(computer_storage)#Implementations
https://en.wikipedia.org/wiki/ZFS#Copy-on-write_transactional_model

最后编辑于
?著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事?!?“怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352