2.2.2 数据库与大数据存储(SQL/NoSQL、Hadoop)


文档摘要

2.2.2 数据库与大数据存储(SQL/NoSQL、Hadoop) 在分布式数据存储的疆域里,数据库不是静止的仓库,而是奔涌的数据河床——它既要承载事务的精确滴灌(ACID),又要接纳日志洪流的粗粒度吞吐(BASE);既要支撑毫秒级的用户画像查询,又要完成PB级的历史行为归因分析。当我们站在“2.2.2 数据库与大数据存储”这个技术十字路口,真正需要叩问的,从来不是“SQL 还是 NoSQL”,而是:当一条用户点击事件从移动端发出,它将经历怎样的路径,在哪一层被索引、在哪一层被压缩、在哪一层被切片、在哪一层被校验,最终既可被实时推荐引擎毫秒召回,又可被离线数仓按月聚合?


发布者: 作者: 转发
评论区 (0)
U