Apache Spark

Apache Spark
Tipus	entorn de treball, machine learning framework (en) , informàtica al núvol i programari lliure
Versió inicial	30 maig 2014 i 1r març 2014
Versió estable	3.5.1 (15 febrer 2024)
Llicència	Llicència Apache, versió 2.0; llicència BSD
Característiques tècniques
Sistema operatiu	Microsoft Windows, Linux i macOS
Plataforma	Màquina Virtual Java
Escrit en	Scala, Java, Python, R, Structured Query Language i Java Database Connectivity
Format de fitxer de lectura	valors separats per comes, JSON, Apache Parquet, fitxer de text, Optimized Row Columnar i Apache Avro (en)
Format de fitxer d'escriptura	JSON, valors separats per comes, fitxer de text, Apache Parquet, Optimized Row Columnar i Apache Avro (en)
Equip
Creador/s	Matei Zaharia
Desenvolupador(s)	Apache Software Foundation
Codi font	Fonts de codi
Codi font	Codi font
Gentoo	sys-cluster/spark-bin
Més informació
Lloc web	spark.apache.org (anglès)
Stack Exchange	Etiqueta
Seguiment d'errors	Seguiment d'errors

Apache Spark és una plataforma de codi obert orientat a l'analítica i processat de dades massives. Ofereix una interfície per a treballar amb clústers tot considerant el paral·lelisme de dades i la tolerància a fallades de forma implícita. Originàriament desenvolupat per la Universitat de Califòrnia a Berkeley el 2009, el codi font fou cedit el 2013 a l'Apache Software Foundation, qui el manté des de llavors.^[1]^[2]^[3]

Dades ràpides Tipus, Versió inicial ...

Tanca