版本:大小:8.79M
类别: 电子图书 系统:WinAll, WinXP, Win7, Win8, Win10
立即下载本站所有电子书资源均由网友分享提供,仅供个人学习与参考,有能力请购买正版书籍学习!
大数据之路pdf是阿里巴巴数据技术及产品部根据阿里巴巴公司现状编写的一本大数据方面的书籍,书中的实践和思考对同行会有很大的启发和借鉴意义,感兴趣欢迎下载学习!
《大数据之路:阿里巴巴大数据实践》由阿里巴巴数据技术及产品部组织并完成写作,是阿里巴巴分享对大数据的认知,与生态伙伴共创数据智能的重要基石。书中讲到的阿里巴巴大数据系统架构,就是为了满足不断变化的业务需求,同时实现系统的高度扩展性、灵活性以及数据展现的高性能而设计的。
第1章 总述1
第1篇 数据技术篇
第2章 日志采集
2.1 浏览器的页面日志采集
2.1.1 页面浏览日志采集流程
2.1.2 页面交互日志采集
2.1.3 页面日志的服务器端清洗和预处理
2.2 无线客户端的日志采集
2.2.1 页面事件
2.2.2 控件点击及其他事件
2.2.3 特殊场景
2.2.4 H5 & Native日志统一
2.2.5 设备标识
2.2.6 日志传输
2.3 日志采集的挑战
2.3.1 典型场景
2.3.2 大促保障
第3章 数据同步
3.1 数据同步基础
3.1.1 直连同步
3.1.2 数据文件同步
3.1.3 数据库日志解析同步
3.2 阿里数据仓库的同步方式
3.2.1 批量数据同步
3.2.2 实时数据同步
3.3 数据同步遇到的问题与解决方案
3.3.1 分库分表的处理
3.3.2 高效同步和批量同步
3.3.3 增量与全量同步的合并
3.3.4 同步性能的处理
3.3.5 数据漂移的处理
查看全部