Apache Lucene
információ lekérő szoftver könyvtár From Wikipedia, the free encyclopedia
Remove ads
Az Apache Lucene egy szabad/nyílt forráskódú információ lekérő szoftver könyvtár, amelyet eredetileg Doug Cutting készített java nyelven. Támogatást az Apache Software Foundation nyújt hozzá Apache Licenc alatt.
Lucene-t más programozási nyelvekre is portolták, többek közt a következőkre: Delphi, Perl, C#, C++, Python, Ruby és PHP.[2]
Remove ads
Története
A Lucene-t eredetileg Doug Cutting írta 1999-ben,[3] és a SourceForge webhelyéről volt letölthető. Később csatlakozott az Apache Software Foundation nyílt forráskódú Jakarta termékcsaládjához 2001 szeptemberében és 2005 februárjában vált az Apache felső szintű projektjévé. Egészen mostanáig számos alprojektje jött létre: Lucene Java, Droids, Lucene.Net, Lucy, Mahout, Solr, Nutch, Open Relevance Project, PyLucene és Tika. A Solr-t összefésülték magával a Lucene projekttel, továbbá a Mahoutot, a Nutchot és a Tikát kiemelték független felső szintű projektekbe.
Remove ads
Funkciók és általános felhasználás
Habár illeszthető bármely alkalmazáshoz – mely teljes szöveg indexelési és keresési képességeket igényel -, Lucene széles körben ismert[4][5] az Internetes- és lokális keresőmotorok, valamint webhely keresések implementációit segítő eszközeiről.
A Lucene logikai architektúrájának magját az az elgondolás alkotja, hogy egy dokumentum kizárólag szövegmezőkből áll. Ez a rugalmasság biztosítja, hogy a Lucene API független legyen a fájlformátumtól. A szöveg jöhet a PDFekből, HTMLből, Microsoft Word-, és OpenDocument dokumentumokból, és még sok másból is (kivéve a képek). Mindezek indexelhetők mindaddig, amíg a szöveges információ kinyerhető az adott formátumból.
Remove ads
Lucene alapú projektek
A Lucene maga csak egy indexelő és kereső könyvtár és nem tartalmaz crawling és HTML elemzési funkcionalitást. Számos projekt létezik, amely kiterjeszti a Lucene képességeit:
- Apache Nutch – biztosít web crawling-ot és HTML elemzést
- Apache Solr – egy vállalati kereső szerver
- ElasticSearch – egy vállalati kereső szerver
- Compass – egy Java keresőmotor keretrendszer
Felhasználók
Azon cégek listáját, melyek használják a Lucene-t, lásd a Lucene 'Power By' oldalát.[6] Többek közt a Twitter is használja a Lucene-t a valós idejű keresésekhez.[7]
Kapcsolódó szócikkek
- Lucene.net
- Hadoop
- Hibernate search
- Xapian
- Sphinx (search engine)
- LGTE
- Information extraction
- Text mining
- eGranary Digital Library
Jegyzetek
Irodalom
Külső hivatkozások
Fordítás
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads