dskfsf
by @fighting_刘 2016-01-17 01:04经过多年来开拓性的工作,UC Berkeley AMP Lab开发了Spark。它使用分布式内存数据结构,提高了数据处理的速度,在大多数工作上优于Haddop。本文用一个真实的数据集,展示Spark的结构,以及基本的转换(transformations)与行动(actions)。如果你想尝试编写和运行自己的Spark代码,可以到Dataquest试试本教程的(英文)互动版本。
by @技术头条 2016-01-15 09:19