這篇文章主要講解了“solr是什么”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來(lái)研究和學(xué)習(xí)“solr是什么”吧!
創(chuàng)新互聯(lián)成都網(wǎng)站建設(shè)按需定制設(shè)計(jì),是成都營(yíng)銷(xiāo)推廣公司,為餐廳設(shè)計(jì)提供網(wǎng)站建設(shè)服務(wù),有成熟的網(wǎng)站定制合作流程,提供網(wǎng)站定制設(shè)計(jì)服務(wù):原型圖制作、網(wǎng)站創(chuàng)意設(shè)計(jì)、前端HTML5制作、后臺(tái)程序開(kāi)發(fā)等。成都網(wǎng)站設(shè)計(jì)熱線(xiàn):028-86922220
##Solr Features## Solr是一個(gè)提供類(lèi)似REST的API的獨(dú)立的企業(yè)級(jí)檢索服務(wù)器。你可以通過(guò)XML、JSON、CVS或者HTTP的二進(jìn)制來(lái)存儲(chǔ)文檔(或者稱(chēng)為索引)。你可以通過(guò)HTTP GET方法查詢(xún)并且接受XML、JSON、CVS或者二進(jìn)制數(shù)據(jù)。
先進(jìn)的全文檢索功能
為高吞量的網(wǎng)略流量進(jìn)行優(yōu)化
基于開(kāi)放接口標(biāo)準(zhǔn)-XML、JSON和HTTP
全面的HTML管理接口
服務(wù)器統(tǒng)計(jì)信息暴露,可以通過(guò)JMX來(lái)監(jiān)控
線(xiàn)性可擴(kuò)展,自動(dòng)索引復(fù)制,自動(dòng)故障轉(zhuǎn)移和恢復(fù)
近乎實(shí)時(shí)索引
基于XML配置的靈活性和適應(yīng)性
可擴(kuò)展的插件架構(gòu)
###Solr使用Lucene檢索庫(kù)并擴(kuò)展它###
一個(gè)真實(shí)的數(shù)據(jù)模式,包括數(shù)字類(lèi)型、動(dòng)態(tài)字段、唯一鍵
對(duì)Lucene查詢(xún)語(yǔ)言強(qiáng)大的擴(kuò)展功能
方面檢索和過(guò)濾
支持每個(gè)文檔中多點(diǎn)和地理多邊形的地理空間檢索
先進(jìn)的,可配置的文本分析器
高度可配置性和用戶(hù)可擴(kuò)展緩存
性能優(yōu)化
基于XML的可擴(kuò)展配置
基于A(yíng)JAX的管理接口
可監(jiān)視的日志
快速接近實(shí)時(shí)的增量索引和索引復(fù)制
基于跨多個(gè)主機(jī)的索引分片的高度可擴(kuò)展的分布式檢索
JSON、XML、CVS/delimited-text,和二進(jìn)制更新格式
簡(jiǎn)單的方式拉取數(shù)據(jù),從數(shù)據(jù)庫(kù)、本地磁盤(pán)上的XML文件,或者HTTP資源
使用Apache Tika來(lái)解析和索引富文本(PDF、Word、HTML等)
基于A(yíng)pache UIMA集成配置的元數(shù)據(jù)提取
多檢索索引
####Schema####
定義文檔字段并指定字段類(lèi)型
可以驅(qū)動(dòng)更智能的處理
申明lucene 分詞器
動(dòng)態(tài)字段是能夠即時(shí)的添加新的字段
字段復(fù)制功能允許索引單個(gè)字段多種方式,或多個(gè)字段合并成一個(gè)單一的搜索領(lǐng)域
顯式類(lèi)型,排序了猜測(cè)字段類(lèi)型的必要
基于擴(kuò)展(外部文件)文件的配置停用詞列表、同義詞列表、保護(hù)詞列表
許多額外的文本分析組件,包括單詞分割,正則表達(dá)式和sounds-like過(guò)濾器
每個(gè)字段都有可插拔的類(lèi)似模型
####Query####
HTTP接口提供可配置的響應(yīng)格式(XML/XSLT、JSON、Python、Ruby、PHP、Velocity、CSV、二進(jìn)制)
可通過(guò)任意數(shù)量的字段或者對(duì)于任意數(shù)量字段的復(fù)雜函數(shù)來(lái)排序
高級(jí)的DisMax查詢(xún)分析器從用戶(hù)輸入的查詢(xún)中獲得高度相關(guān)的結(jié)果
高亮上下文片段
基于唯一字段值、明確的查詢(xún)、日期范圍、數(shù)字范圍或者點(diǎn)的方面檢索
通過(guò)標(biāo)簽或者可選擇的執(zhí)行過(guò)濾來(lái)實(shí)現(xiàn)多方面檢索
對(duì)用戶(hù)查詢(xún)進(jìn)行拼寫(xiě)建議
給定文檔的相似性建議
函數(shù)查詢(xún)-影響用戶(hù)指定復(fù)雜的數(shù)值字段或查詢(xún)相關(guān)度分值函數(shù)的得分
通過(guò)函數(shù)查詢(xún)對(duì)結(jié)果范圍進(jìn)行過(guò)濾
Range filter over Function Query results
Date Math - specify dates relative to "NOW" in queries and updates
通過(guò)carrot2進(jìn)行動(dòng)態(tài)檢索結(jié)果聚類(lèi)
數(shù)字字段統(tǒng)計(jì),如最小值,最大值,平均值,標(biāo)準(zhǔn)偏差
Combine queries derived from different syntaxes
自動(dòng)建議功能完成用戶(hù)查詢(xún)
允許配置一個(gè)查詢(xún)的最優(yōu)先的結(jié)果,這些結(jié)果可以覆蓋正常的得分和排序
簡(jiǎn)單連接兩個(gè)文檔類(lèi)型功能
性能優(yōu)化
####Core####
動(dòng)態(tài)的創(chuàng)建或者刪除文檔集合而不用重啟服務(wù)
可插拔的查詢(xún)處理器和可擴(kuò)展的XML數(shù)據(jù)格式
可插拔的用戶(hù)函數(shù)供函數(shù)查詢(xún)
可定制的基于組建的請(qǐng)求處理器并且支持分布式檢索
基于unique key 字段的文檔唯一性加強(qiáng)
重復(fù)文件檢測(cè),包括 fuzzy near duplicates
可定制的索引處理鏈,允許索引前對(duì)文檔處理
User configurable commands triggered on index changes
Ability to control where docs with the sort field missing will be placed
"Luke" request handler for corpus information
####SolrCloud####
基于A(yíng)pache ZooKeeper 的集中式的配置
自動(dòng)分布式索引/分片,發(fā)送文檔到任意節(jié)點(diǎn)并且文檔會(huì)被轉(zhuǎn)發(fā)到正確的分片
基于立即推模型(同時(shí)也支持緩慢拉模型復(fù)制)復(fù)制的近實(shí)時(shí)索引
事務(wù)日志確保即使更新文檔沒(méi)有索引到磁盤(pán)也不會(huì)丟失
如果失敗時(shí)的自動(dòng)索引故障轉(zhuǎn)移、索引leader選舉和故障恢復(fù)
無(wú)單點(diǎn)故障
####Admin Interface####
對(duì)于緩存利用、更新和查詢(xún)的綜合統(tǒng)計(jì)
包括索引統(tǒng)計(jì)的交互模式瀏覽
復(fù)制監(jiān)控
圖形化集群節(jié)點(diǎn)狀態(tài)的SolrCloud儀表盤(pán)
全日志控制
文本分析調(diào)試,顯示一個(gè)分析器每個(gè)階段的分析結(jié)果
Web查詢(xún)接口,w/ 調(diào)式輸出
解析的查詢(xún)輸出
基于Lecene explain()的文檔得分詳細(xì)設(shè)計(jì)
Explain score for documents outside of the requested range to debug why a given document wasn't ranked highe
感謝各位的閱讀,以上就是“solr是什么”的內(nèi)容了,經(jīng)過(guò)本文的學(xué)習(xí)后,相信大家對(duì)solr是什么這一問(wèn)題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!