Album
时长:
45分钟
播放:
726
发布:
1年前
主播...
简介...
https://xiaoyuzhoufm.com

这次我们从一个一线数据开发的角度,聊一聊“大数据”到底是啥?


不聊虚的概念和行业,我们用一个简单的实际例子来说明一下数据开发工程师的日常工作/大数据端到端的链路。主播觉得,认真听完这45分钟,你已经比绝大多数人懂什么是“大数据”了。 


这一期节目偏向业务相关的数仓和离线数据开发,Infra和数据系统开发的部分请等待我们后续的节目!


一些tags:


大数据/数据库/数据仓库/HDFS/Hive/HBase/Spark/Flink/Presto/Clickhouse/Kafka/S3/OSS/…


欢迎收听,欢迎大家一路的支持!!!


主播:松阴


节目开始前,请大家加入听友群(加群方法见播客介绍页),以及帮忙多多转发!


01:10 数据开发的岗位差异比较大


03:22 “200万只能搞云计算!”


05:05 学校里比较难教你“大数据”的内容


07:28 举个栗子:端到端的大数据开发是什么样的?


09:44 数据库(Database) vs. 数据仓库(DataWarehouse)


13:36 日志数据(Logging)和实时数据ETL


15:38 Google的三篇论文; 大数据时代的起点


20:06 为什么要把数据同步到数仓?


25:31 数仓设计和ETL


29:46 列一下大数据开发的日常工作


33:46 计算引擎怎么选


36:30 除了BI需求以外,机器学习也高度依赖离线数据开发

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧