Spark RDD

RDD ^[1]
開發者	加州大學柏克萊分校AMPLab, Databricks
編程語言	Scala
操作系統	跨平台
網站	spark.apache.org

Spark RDD（英語：Resilient Distributed Dataset，彈性分布式數據集）是一種數據存儲集合。只能由它支持的數據源或是由其他RDD經過一定的轉換（Transformation）來產生。在RDD上可以執行的操作有兩種轉換（Transformation）和行動（Action），每個 RDD 都記錄了自己是如何由持久化存儲中的源數據計算得出的，即其血統（Lineage）。

事实速览 開發者, 編程語言 ...

[1]

Spark RDD

轉換

行動

依賴

參考文獻

Wikiwand - on