Apache Spark
framework de traitement et de calcul distribué / De Wikipedia, l'encyclopédie encyclopedia
Cher Wikiwand IA, Faisons court en répondant simplement à ces questions clés :
Pouvez-vous énumérer les principaux faits et statistiques sur Apache Spark?
Résumez cet article pour un enfant de 10 ans
Spark (ou Apache Spark[2]) est un framework open source de calcul distribué. Il s'agit d'un ensemble d'outils et de composants logiciels structurés selon une architecture définie. Développé à l'université de Californie à Berkeley par AMPLab[3], Spark est aujourd'hui un projet de la fondation Apache. Ce produit est un cadre applicatif de traitements des mégadonnées (big data) pour effectuer des analyses complexes à grande échelle.
Cet article ne cite pas suffisamment ses sources ().
Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».
En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?
L'article doit être débarrassé d'une partie de son jargon ().
Sa qualité peut être largement améliorée en utilisant un vocabulaire plus directement compréhensible. Discutez des points à améliorer en page de discussion.
Développé par | Apache Software Foundation |
---|---|
Première version | |
Dernière version | 3.5.1 ()[1] |
Dépôt | github.com/apache/spark et gitbox.apache.org/repos/asf/spark.git |
Écrit en | Scala, Java, Python, R, Structured Query Language et Java Database Connectivity |
Système d'exploitation | Microsoft Windows, Linux et macOS |
Environnement | Machine virtuelle Java |
Formats lus | JavaScript Object Notation, comma-separated values, fichier texte, Apache Parquet, Optimized Row Columnar (ORC) (d) et Apache Avro |
Formats écrits | Comma-separated values, JavaScript Object Notation, Apache Parquet, fichier texte, Optimized Row Columnar (ORC) (d) et Apache Avro |
Type |
Framework Structure logicielle d'apprentissage automatique (d) Cloud computing |
Licence | Licence Apache version 2.0 et licence BSD |
Site web | spark.apache.org |