Spark RDD

RDD ^[1]
開發者	加州大学柏克莱分校AMPLab, Databricks
编程语言	Scala
操作系统	跨平台
网站	spark.apache.org

Spark RDD（英語：Resilient Distributed Dataset，弹性分布式数据集）是一种数据存储集合。只能由它支持的数据源或是由其他RDD经过一定的转换（Transformation）来产生。在RDD上可以执行的操作有两种转换（Transformation）和行动（Action），每个 RDD 都记录了自己是如何由持久化存储中的源数据计算得出的，即其血统（Lineage）。

事实速览 開發者, 编程语言 ...

[1]

Spark RDD

转换

行动

依赖

参考文献

Wikiwand - on