Apache Spark
plataforma d'anàlisi de dades de forma distribuïda / From Wikipedia, the free encyclopedia
Apache Spark és una plataforma de codi obert orientat a l'analítica i processat de dades massives. Ofereix una interfície per a treballar amb clústers tot considerant el paral·lelisme de dades i la tolerància a fallades de forma implícita. Originàriament desenvolupat per la Universitat de Califòrnia a Berkeley el 2009, el codi font fou cedit el 2013 a l'Apache Software Foundation, qui el manté des de llavors.[1][2][3]
Dades ràpides Tipus, Versió inicial ...
| |
Tipus | entorn de treball, machine learning framework (en) , informàtica al núvol i programari lliure |
---|---|
Versió inicial | 30 maig 2014 i 1r març 2014 |
Versió estable | |
Llicència | Llicència Apache, versió 2.0 llicència BSD |
Característiques tècniques | |
Sistema operatiu | Microsoft Windows, Linux i macOS |
Plataforma | Màquina Virtual Java |
Escrit en | Scala, Java, Python, R, Structured Query Language i Java Database Connectivity |
Format de fitxer de lectura | |
Format de fitxer d'escriptura | |
Equip | |
Creador/s | Matei Zaharia |
Desenvolupador(s) | Apache Software Foundation |
Fonts de codi | |
Més informació | |
Lloc web | spark.apache.org (anglès) |
Stack Exchange | Etiqueta |
Seguiment d'errors | Seguiment d'errors |
| |
Tanca