BR 技术头条 技术链接、资讯与社区分享流
mp mp.weixin.qq.com / 2016-01-13 11:31 / by @Datartisan

Spark入门教程(针对Python)

赞过的人

@技术头条@Datartisan

讨论 · 2 条

@fighting_刘 2016-01-17 01:04

dskfsf

@技术头条 2016-01-15 09:19

经过多年来开拓性的工作,UC Berkeley AMP Lab开发了Spark。它使用分布式内存数据结构,提高了数据处理的速度,在大多数工作上优于Haddop。本文用一个真实的数据集,展示Spark的结构,以及基本的转换(transformations)与行动(actions)。如果你想尝试编写和运行自己的Spark代码,可以到Dataquest试试本教程的(英文)互动版本。

发表评论