Twitter 的大规模文件 P2P 分发系统-Murder

引言

部门的文件分发系统是使用的单一的发布节点(100M 共享带宽),当进行小文件的发布时并没有体会到带宽和时间耗费方面的问题,   但在进行大规模的大文件发布时,明显看到带宽拥塞、耗费时间实在是太多了。 分发一个 80M 左右的软件包到 800 台机器时,耗费 40 分钟到 1 小时。   所以必须想办法解决这个问题,在单一分发节点及固定的出口带宽情况下,提高大规模大文件分发效率与性能。 于是,先来考察市面上是否有相关开源解决方案。

Twitter 开源项目 Murder 介绍

如题,恰巧听人介绍了这个项目,应该适合解决上面的问题。

它的 GitHub 主页上的简介就是:

Large scale server deploys using BitTorrent and the BitTornado library

Murder 项目来龙去脉:


Twitter 在早期便依赖 Capistrano 来进行应用程序的部署,每当有新版本的程序代码需要发布时,
Capistrano 会根据预设好的各种设置、流程到 Twitter 所有的服务器上进行更新的操作,
在过去服务器还不多的情況下一切都很美好,但随着 Twitter 服务器数量的增长,到了几百台服务器时,事情已经不再像过去一样美好,
甚至到后来拥有数千台服务器时,更新的操作会耗费 40 分钟。


Twitter 针对这个问题,认为问题的关键在于:使用集中式的系统,也就是所有的服务器要轮流排队到同一台版本控制系统上进行代码更新。
Twitter 最初的想法是将版本控制系统也做出分散式的架构,服务器的代码更新就可以分散到不同的机器来压缩部署时间,
但事实上版本控制系统即使分散在多台服务器上,这些服务器要更新文件也同样需要时间。
因此 Twitter 发现或许需要一个完全去中心化、最好是像 BitTorrent 这样的,
利用 P2P 的特点让所有的节点都可以协助进行程序代码的更新。

从结果来看,在采用了 BitTorrent 的方式来更新代码,部署的时间从 40 分钟大幅减少到只要 12 秒!
实在是非常惊人的改善,数千台服务器的代码更新居然只要短短 12 秒就能完成。

接下来需要花些时间验证测试下这个 P2P 方式的发布。

Ref

GitHub Murder
Twitter 如何在数千台服务器上快速部署代码?
Twitter 开源项目 Murder:缩短部署更新时间
Twitter 的 P2P分发系统
华为蘑菇云设计进展与规划
Herd - A single-command bittorrent distribution system, based on Twitter’s Murder