witter工程师博客刚刚发布了一篇有意思的
博文(需翻墙才可查看)。通常来说,对这个博客的感兴趣的人群主要是开发人员。这篇文章也不例外,不过它却透漏了一个重大新闻。首先,Twitter将不再使用Cassandra数据库系统来保存tweets。其次,Twitter将使用Cassandra来搭建新的实时分析系统。不过这些还没有正式宣布。
实时分析一直被认为是Twitter未来策略的一部分,不过Twitter却从未官方表态过。读写网的
Marshall Kirkpatrick在两天前发表的文章中声称,他找到了一些Twitter分析功能即将发布的证据。而在本文开头提及的博文中,Twitter的Ryan King也写到:“我们的分析、运营和架构团队正在努力研发一款可以在内外部使用的大规模实时分析产品,它将使用cassandra搭建。”
没错,大规模的实时分析,而且在内、外都能使用。
最重要的新闻是,Twitter将改变之前宣称的存储tweet的方案。之前,Twitter一直打算使用Cassandra系统存储tweet,不过这个计划将要改变了。“这是一次战略上的改变,”King写到,“我们还将继续使用我们现有的基于Mysql的方式存储tweet。我们觉得现在还不是大规模迁移到一个新技术的时候。”
我觉得之所以Twitter说现在不适合大规模的迁移,可能是因为最近的Twitter的流量大增(原因当然是世界杯)。我们已经向Twitter证实此事。
Cassandra是一个开源的Apache项目,其目标是成为一个“高度可扩展的第二代分布式数据库”。King说这套系统将继续作为Twitter的核心系统之一,还将被用于地理位置数据库、热门tweet和趋势的数据挖掘等等。“我们每天都在Cassandra上投入很多,我们对它的使用只会增加。”
English Version by MG Siegler