Album
时长:
46分钟
播放:
4,114
发布:
4年前
简介...
https://xiaoyuzhoufm.com

“数据仓库”是一种数据库系统。我们现在经常说的“大数据”很多时候正是在“数据仓库”这种系统中进行查询和分析。这一集节目,我们来聊一聊数据仓库是什么、它的历史、它的关键技术,以及相关系统。


主播:斯图亚特、Sean Wang、Cat Chen

剪辑:王立冰


时间线



  • 01:34 什么是数据仓库

  • 12:26 数据仓库的技术

  • 36:29 ETL :抽取(Extract)、转置(Transform)、载入(Load)

  • 43:06 数据仓库和机器学习


本期内容


什么是数据仓库



  • 两套数据库系统:运营系统和数据仓库

  • 数据仓库的历史

  • 互联网公司引领的数据仓库潮流
    数据仓库的技术

  • 里程碑论文: Mike Stonebraker: "One size fits all": an idea whose time has come and gone (2005)

  • 列存储

  • 和运营系统技术特点的差别

  • MapReduce及其争议。

  • Hive开启的Hadoop生态系统中的SQL

  • 几大云数据仓库系统(Redshift、BigQuery,Azure,Snowflake)
    ETL :抽取(Extract)、转置(Transform)、载入(Load)

  • 如何把数据载入数据仓库

  • 数据清洗和数据整合

  • HTAP(Hybrid transactional/analytical processing)
    数据仓库和机器学习


播客邮件地址

[email protected]


相关链接



封面图片:

Image by Pexels from Pixabay


片头片尾音乐

Exzel Music Publishing (freemusicpublicdomain.com)

Licensed under Creative Commons: By Attribution 3.0

http://creativecommons.org/licenses/by/3.0/

Courante 1st Cello Suite

评价...

空空如也

小宇宙热门评论...
一梦音
4年前
11
非常喜欢这几期,包括之前那期存储相关的。希望可以多出点类似的节目呀
Kay_GvEi
4年前
4
36:29 1. IBM sql service 2. Google Map Reduce 3. Hadoop 4. 云厂 - redshift,snowflake和云厂硬刚
HD58094j
4年前
3
请问怎么加微信群啊?怎么联系到主播😂
deledeleda
4年前
3
假装听的很明白的留痕( :∇:)
avocadotoast
4年前
3
请问怎么加听众群呢
楼023
4年前
3
喜欢你们的节目
葛瑞葛瑞
4年前
2
讲得好!
虎耳Robin
3年前
1
主要是现在单点读写和聚合查询很难共存在一个数据库。 有的就是单加个列式存储模式。
segfault
3年前
1
是不是可以出一期关于Lakehouse的节目了
JERRYJAZZY
4年前
0
很赞,支持
nskz
4年前
0
学习到很多!
奔跑的iceman
3年前
0
喜欢你们的节目
一粒摇滚的糖霜
2年前 北京
0
受益匪浅,讲的很清楚~
无人区茉莉
1年前 上海
0
22:19 数据的数据
HD291054x
1年前 上海
0
讲得非常好!对于分析师来说正好听得懂!
HeycouPeng
1年前 天津
0
03:15 “除非你是上帝,不然就拿数据说话”
Eyrunq
7个月前 北京
0
37:21 这里口误啦,是csv文件
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧