Top Qs
Chronologie
Chat
Contexte

Apache Parquet

format de fichier pour le stockage de données structurées volumineuses De Wikipédia, l'encyclopédie libre

Remove ads

Apache Parquet est un format de fichiers orienté colonne, initialement développé pour l'écosystème de calcul distribué Apache Hadoop. Il est similaire aux autres formats de fichiers de stockage colonnaires disponibles dans Hadoop, à savoir RCFile et Optimized RCFile. Il est compatible avec la plupart des frameworks de traitement de données de l'environnement Hadoop. Il fournit des schémas efficaces de compression et de codage de données avec des performances améliorées pour gérer des données complexes en masse.

Faits en bref Développé par, Première version ...
Faits en bref Extension, Type MIME ...
Remove ads

Historique

Le projet open source qui a abouti à Apache Parquet vient des efforts conjoints entre Twitter[3] et Cloudera[4]. La première version de Apache Parquet 1.0 sort en . Depuis le Apache Parquet devient un projet top-level de la Apache Software Foundation [5],[6]

Articles connexes

Notes et références

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads