7.1.1 数据采集(日志、用户行为) 在数据驱动的今天,我们常把“数据是新时代的石油”挂在嘴边。可若石油深埋地底、未经钻探、未加炼化、未通管道,它就只是地质报告里一行冰冷的参数——既不能驱动引擎,也无法点亮城市。同理,再精妙的机器学习模型、再强大的实时数仓、再优雅的数据湖架构,一旦源头数据采集失准、失全、失稳、失时,整条数据链路便如沙上筑塔,风过即散。 而“7.1.1 数据采集(日志、用户行为)”,正是这整座数据大厦的地基工程。它不炫技,却决定成败;不显山露水,却处处藏刀——一个埋点字段命名不一致,可能让AB测试结果全盘失效;一条日志时间戳因NTP漂移偏差300ms,就足以在会话还原中撕裂用户行为流;一次客户端SDK未做离线缓存兜底,便会在地铁隧道里悄然丢失20%的关键转化路径。