Apache Drill

Informations
Développé par	Apache Software Foundation
Première version	4 janvier 2015
Dernière version	1.22.0 (29 juin 2025)
Dépôt	github.com/apache/drill et git://git.apache.org/drill.git
État du projet	Développement
Écrit en	Java
Système d'exploitation	Multiplateforme (en)
Type	Big data
Licence	Licence Apache
Site web	drill.apache.org

Apache Drill est un framework logiciel open-source qui supporte les applications temps réel distribuées pour l'analyse interactive de jeux de données à grande échelle. Drill est la version open source du système Dremel de Google qui est disponible comme un service d'infrastructure appelé Google BigQuery. Un objectif de conception indique explicitement que Drill est capable d'évoluer à 10.000 serveurs ou plus et d'être en mesure de traiter des pétaoctets de données et des milliards d'enregistrements en quelques secondes. Drill est un projet de premier niveau pour Apache^[3].

Cet article est une ébauche concernant l’informatique.

Faits en bref Développé par, Première version ...

Drill supporte de nombreuses bases NoSQL et de nombreux systèmes de fichiers comme HBase, MongoDB, MapR-DB, HDFS, MapR-FS, Amazon S3, Azure Blob Storage, Google Cloud Storage, Swift, NAS et des fichiers locaux. Une seule requête peut joindre des données d'entrepôts de données distincts. Par exemple, vous pouvez joindre le profil utilisateur présent dans une collection sur MongoDB avec les logs d'Hadoop.

L'optimisateur de Drill restructure automatiquement un plan d'exécution de la requête pour tirer parti des capacités de traitement des entrepôts de données internes. En outre, Drill supporte la localité des données, il est donc interessant de co-implanter Drill et un datastore sur plusieurs nœuds^[4].

[3]

[1]

[2]

[4]

Apache Drill

Fonctionnalités

Support

Voir aussi

Références

Publications

Liens externes

Wikiwand - on