Album
时长:
45分钟
播放:
589
发布:
1年前
主播...
简介...
https://xiaoyuzhoufm.com

这次我们从一个一线数据开发的角度,聊一聊“大数据”到底是啥?


不聊虚的概念和行业,我们用一个简单的实际例子来说明一下数据开发工程师的日常工作/大数据端到端的链路。主播觉得,认真听完这45分钟,你已经比绝大多数人懂什么是“大数据”了。 


这一期节目偏向业务相关的数仓和离线数据开发,Infra和数据系统开发的部分请等待我们后续的节目!


一些tags:


大数据/数据库/数据仓库/HDFS/Hive/HBase/Spark/Flink/Presto/Clickhouse/Kafka/S3/OSS/…


欢迎收听,欢迎大家一路的支持!!!


主播:松阴


节目开始前,请大家加入听友群(加群方法见播客介绍页),以及帮忙多多转发!


01:10 数据开发的岗位差异比较大


03:22 “200万只能搞云计算!”


05:05 学校里比较难教你“大数据”的内容


07:28 举个栗子:端到端的大数据开发是什么样的?


09:44 数据库(Database) vs. 数据仓库(DataWarehouse)


13:36 日志数据(Logging)和实时数据ETL


15:38 Google的三篇论文; 大数据时代的起点


20:06 为什么要把数据同步到数仓?


25:31 数仓设计和ETL


29:46 列一下大数据开发的日常工作


33:46 计算引擎怎么选


36:30 除了BI需求以外,机器学习也高度依赖离线数据开发

评价...

空空如也

小宇宙热门评论...
大王圣代
1年前 上海
1
本期BGM Bruno Major - Regent's Park
钱恪畅
1年前 四川
0
可得好好坚持做啊!我的朋友!!!
小毛豆Galaxy
11个月前 黑龙江
0
真的很棒啊!这个节目果断关注了
薄荷抹茶冰
11个月前 甘肃
0
好厉害!有没有推荐相关的书❤️
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧