Solr
来自维基百科,自由的百科全书
Solr(讀作「solar」)是Apache Lucene專案的開源企業搜尋平台。其主要功能包括全文檢索、命中標示[2]、分面搜尋、動態聚類、資料庫整合,以及富文字(如Word、PDF)的處理。Solr是高度可延伸的,並提供了分散式搜尋和索引複製。Solr是最流行的企業級搜尋引擎,[3]Solr 4還增加了NoSQL支援。[4]
Solr是用Java編寫、執行在Servlet容器(如Apache Tomcat或Jetty)的一個獨立的全文搜尋伺服器。 Solr採用了Lucene Java搜尋庫為核心的全文索引和搜尋,並具有類似REST的HTTP/XML和JSON的API。 Solr強大的外部組態功能使得無需進行Java編碼,便可對其進行調整以適應多種類型的應用程式。Solr有一個外掛程式架構,以支援更多的進階客製化。
因為2010年Apache Lucene和Apache Solr專案合併,兩個專案是由同一個Apache軟件基金會開發團隊製作實現的。提到技術或產品時,Lucene/Solr或Solr/Lucene是一樣的。
歷史
2004年,Solr作為CNET Networks為公司網站添加搜尋功能的一個內部專案,由Yonik Seeley建立。 後來Yonik Seeley隨Grant Ingersoll和Erik Hatcher建立了LucidWorks(原名Lucid Imagination),公司提供商業支援、諮詢和Apache Solr搜尋技術的培訓。
2006年1月,CNET Networks決定捐贈其到Apache軟件基金會頂級專案Lucene,公開發布其原始碼。[5]像在Apache軟件基金會的任何新專案一樣,其進入了一個潛伏期,以助於解決組織、法律和金融問題。
2007年1月,Solr結束孵化狀態,穩步成長,累積功能,從而形成聚集了用戶、參與者和提交者的強大社區。作為一個新的開源專案,Solr已被應用於一些流量很高的網站。[6]
2008年9月,Solr 1.3釋出了許多增強功能,包括分散式搜尋功能和效能增強等。
2009年11月,Solr 1.4釋出。此版本對索引、搜尋和分面做了增強,並有許多其它改進,例如富文字(PDF、Word和HTML)的處理,基於Carrot 2的搜尋結果聚簇,與資料庫整合的改進。該版本還提供了許多外掛程式。
2010年3月,Lucene和Solr專案合併。產品現在由同一組參與者共同開發。
在2011年,Solr改變了版本編號方案,以便與Lucene的匹配。為了使Solr和Lucene有相同的版本號,Solr 1.4的下一版本號為3.1。[7]
2012年10月,Solr 4.0版本釋出,包括新的SolrCloud功能。
特色
- 全文檢索
- HTTP管理介面
- 分佈式搜尋
- 快取
參見
- 面向搜尋架構
- eGranary數字圖書館
- 資訊檢索函數庫列表
參考文獻
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.