Tag: solr

一起使用Solr和Zends Lucene端口

下午的家伙, 在我使用Zend-Lucene-Search进行冒险之后,发现它并不是在为大型数据集编制索引时,我已经转向Solr(感谢Bill Karwin 🙂 我现在已经让Solr将数据库编入索引的速度远远超过了8分钟就可以为一个超过170万行的表编制索引 – 这让我非常满意。 但是,当我尝试使用Zend端口搜索索引时,我遇到以下错误; 致命错误:/var/www/Zend/Search/Lucene.php:407中未捕获的exception’Zend_Search_Lucene_Exception’,消息’不支持的段文件格式’堆栈跟踪:#0 /var/www/Zend/Search/Lucene.php(555 ):Zend_Search_Lucene – > _ readSegmentsFile()#1 /var/www/z_search.php(12):Zend_Search_Lucene – > __ construct(’tmp / feeds_index’)在#var / www / Zend / Search / Lucene中抛出#2 {main} .php在407行 我试图搜索一下但似乎无法找到关于这个问题的任何内容,每个人似乎都能够让他们工作? 任何帮助,因为总是非常感谢:) 谢谢, 汤姆

线程“main”中的exceptionjava.lang.NoClassDefFoundError:org / apache / commons / codec / DecoderException

我尝试通过Solrj查询Solr 这是我的代码 public class ReadFromSolr { public static void main(String[] args) throws MalformedURLException, SolrServerException { String url = “http://localhost:8983/solr”; try{ SolrServer server = new CommonsHttpSolrServer(url); ModifiableSolrParams params = new ModifiableSolrParams(); params.set(“qt”, “/select”); params.set(“q”, “name”); QueryResponse response = server.query(params); System.out.println(“response = ” + response); } catch (MalformedURLException ex) { ex.printStackTrace(); } catch (SolrServerException ex) { ex.printStackTrace(); […]

Solr中的字频率

我试图使用solr获得单词的频率。 当我提出这个问题: localSolr/solr/select?q=someQuery&rows=0&facet=true&facet.field=content&wt=xml solr给我频率像; 24 12 8 但是当我算上这些话时; 我发现word2的实际计数是13. Solr将字段中的相同单词计为一个。 例如; 字段文本包括; word2 word5 word7 word9 word2 。 Solr不返回word2的计数数字2,而是返回1.对于下面两个句子的word2计数,它返回1; word2 word10 word11 word12 word2 word9 word7 word2 word23 所以频率错误地返回。 我检查了facet字段但没有找到适当的参数。 我如何修复它以使它在句子中计算相同的单词? 编辑:schema.xml的相关部分:

Jetty / SOLR管理员面板密码

我正在使用jetty在SOLR管理面板上应用身份validation。 我已经阅读了很多教程并使用以下步骤实现: 在/solr/core/etc/jetty.xml中添加了以下代码: Test Realm /var/www/solr/core/etc/realm.properties 0 在/solr/core/solr-webapp/webapp/WEB-INF/web.xml中添加了以下代码: Solr authenticated application /* admin BASIC Test Realm 然后使用以下代码行在solr / core / etc中创建文件realm.proprerties文件: admin: OBF:1y0s1v1p1v2p1y0y, admin 但是当我使用URL http:// localhost:8983 / solr /打开solr管理面板时。 我有一个弹出窗口询问用户名和密码。 我填写了在realm.properties中添加的用户名和密码。 但无法登录。 请帮我搞清楚我错在哪里。

Solr 4.0如何更改拼写检查分析器以使它们完全相同?

我刚刚从3.6.1升级到4.0 solr并且spelchecker停止工作。 我正在使用标准的配置/拼写请求处理程序来测试拼写检查。 我一直得到“所有检查员都需要使用相同的分析器”错误。 (https://svn.apache.org/repos/asf/lucene/dev/trunk/solr/core/src/java/org/apache/solr/spelling/ConjunctionSolrSpellChecker.java) 如何更改拼写检查分析器以使它们完全相同? 这是我正在使用的处理程序: text default wordbreak on true 10 5 5 true true 10 5 spellcheck 我知道这不是在生产中使用它的方法。

使用HTTP POST时,SOLR查询字符串是否有大小或术语限制?

我正在使用Java来查询SOLR服务器,以查找在我感兴趣的一组已知ID中具有ID的结果。 我能想到的最好的方法是获得我感兴趣的这些结果是创建一个看起来像这样的长查询字符串: q=(item_id:XXX33-3333 OR item_id:YYY42-3445 OR item_id:JFDE-3838) 在发出请求之前,我生成了这个String, queryString ,并且我最终想要在请求中包含超过1500个这样的id。 我正在使用HTTP POST来进行查询: HttpPost post = new HttpPost(url); post.setHeader(“Content-Type”, “application/x-www-form-urlencoded; charset=utf-8”); StringEntity entity = new StringEntity(queryString, “UTF-8”); entity.setContentType(“application/x-www-form-urlencoded; charset=utf-8”); post.setEntity(entity); HttpClient client = new DefaultHttpClient(); HttpResponse response = client.execute(post); 如果我将查询限制为只有前1000个ID,它会成功,我会按照我的预期得到结果。 但是,如果我将查询增加到包含我真正感兴趣的所有1500,我会得到一个HTTP 400响应代码,其中包含以下错误: HTTP/1.1 400 org.apache.lucene.queryParser.ParseException: Cannot parse ‘[my query here…] 在SOLR查询中,我可以一起使用OR的数量是否有限制? 当我超过1000时,还有另一个原因可能会失败吗? 我已经进行了实验,它在1024左右失败了(我的ID几乎都是相同的长度)所以它似乎暗示有一个字符或术语限制。 或者,如果有人对如何以另一种更智能的方式检索我正在寻找的物品有一个很好的建议,我很乐意听到它。 我的备份解决方案只是查询所有项目的SOLR,解析结果,并使用属于我感兴趣的集合的那些。我宁愿不这样做,因为数据源可能有数万个项目,而且效率低下。

solr – java堆空间内存不足

任何人都可以帮我找出tomcat中的错误原因。 我正在使用solr。 开始工作正常。 稍后我会提出这个错误。 重新启动后它工作正常。 请帮我找出错误。 2011年3月7日上午10:36:47 org.apache.solr.common.SolrException log SEVERE:java.lang.RuntimeException:java.lang.OutOfMemoryError:org.apache.solr.core.SolrCore.getSearcher中的Java堆空间( SolrCore.java:1068)org.apache.solr.update.DirectUpdateHandler2.commit(DirectUpdateHandler2.java:418)atg.apache.solr.update.processor.RunUpdateProcessor.processCommit(RunUpdateProcessorFactory.java:85)atg.apache位于org.apache.solr.handler.ContentStreamHandlerBase.handleRequestBody(ContentStreamHandlerBase.java)的org.apache.solr.handler.XMLLoader.load(XMLLoader.java:69)中的.solr.handler.XMLLoader.processUpdate(XMLLoader.java:169) :54)org.apache.solr.handle.RequestHandlerBase.handleRequest(RequestHandlerBase.java:131)位于org.apache.solr.servlet的org.apache.solr.core.SolrCore.execute(SolrCore.java:1316)。 SolrDispatchFilter.execute(SolrDispatchFilter.java:338)位于org.apache.catalina.core.ApplicationFilterCha的org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:241) org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206)中的or.internalDoFilter(ApplicationFilterChain.java:235)org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:228)at org .apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:175)org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:128)org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve) .java:105)org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109)org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:212)org.apache.coyote。 http://www.Http11Processor.process(Http11Processor.java:844)org.apache.coyote.http11.Http11Protocol $ Http11ConnectionHandler.process(Http11Protocol.java:634)at org.apache.tomcat.util.net.JIoEndpoint $ Worker.run( JIoEndpoint.java:445)at java.lang.Thread.run(Unknown Source)引起:java.lang.OutOfMemoryError:Java堆空间

如何优化solr指数

如何优化solr指数。 我想优化我的solr索引,我尝试在solrconfig.xml中更改它被索引,但我想知道如何validation它们是否已经过优化以及索引优化涉及哪些内容。

即时搜索数PB的数据

我需要在CSV格式文件中搜索超过PB的数据。 使用LUCENE进行索引后,索引文件的大​​小比原始文件的大。 是否可以减少索引文件大小??? 如何在HADOOP中分发LUCENE索引文件以及如何在搜索环境中使用? 或者是否有必要,我应该使用solr来分发LUCENE指数??? 我的要求是对PB级文件进行即时搜索….

如何使用Spring Data Solr为多个核心和存储库实现自定义Solr存储库

我希望使用spring-data-solr在一个服务中访问多个/ 2个repos。 从Spring Data Solr多核和存储库我知道’通过命名空间配置的多核支持不幸是一个悬而未决的问题’。 能否请您帮我解决以下示例,如何创建自定义Repos? 我的applicationContext.xml有两个Solr模板定义如下: 我有以下回购 @Repository public class EventDocumentRepositoryImpl implements EventSearchRepository { @Resource @Qualifier(“solrEventsTemplate”) private SolrTemplate solrEventsTemplate; … } public interface EventDocumentRepository extends EventSearchRepository, SolrCrudRepository { } public interface EventSearchRepository { …. } @Repository public class TownRepositoryImpl implements TownSearchRepository { … @Resource @Qualifier(“solrTownsTemplate”) private SolrTemplate solrTownsTemplate; … } public interface TownRepository extends […]