Top Qs
Chronologie
Chat
Contexte

Apache Tika

De Wikipédia, l'encyclopédie libre

Apache Tika
Remove ads

Apache Tika est un toolkit développé par la fondation Apache qui permet de détecter, d'extraire des métadonnées, et de structurer le contenu textuel de nombreux types de documents (gzip, .mid, .pdf, tar, zip...)[3].

Faits en bref Développé par, Première version ...

Ce projet dépendant de l'Apache Software Foundation, était auparavant un sous-projet de Apache Lucene.

Remove ads

Usages notables

Tika est utilisé combiné à Solr par environ 400 journalistes pour analyser les 11,5 millions de documents divulgués lors des Panama Papers[4].

Références

Liens externes

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads