Search - deltacloud-devel - Fedora Mailing-Lists

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

2010

2009

Search

[PATCH aeolus] Hardware Profiles UI

[PATCH 0/2]: Remove bogus...

Tomas Sedovic

Thursday, 13 January 2011 Thu, 13 Jan '11

7:40 a.m.

This is a new revision of the previous patches. It features simpler models, views and controllers plus some Cucumber tests.

Reply

Show replies by date

Tomas Sedovic

Thursday, 13 January Thu, 13 Jan

7:40 a.m.

New subject: [PATCH aeolus 1/3] Add Solr/Sunspot search support

From: Tomas Sedovic <tsedovic(a)redhat.com> This gets us ready for adding the search. The Solr server is bundled with the sunspot gem so you don't have to install it by hand. On the dev machine, not in production of course. Run `rake sunspot:solr:start` to start the Solr server. When you make change to the solr/conf files, you must stop and start it again. Run `rake sunspot:reindex` to rebuild the index -- do this when you change the search setup in the models. --- .gitignore | 3 + src/Rakefile | 1 + src/config/environment.rb | 1 + src/config/sunspot.yml | 23 + src/solr/conf/elevate.xml | 36 ++ src/solr/conf/schema.xml | 252 ++++++++++++ src/solr/conf/solrconfig.xml | 934 ++++++++++++++++++++++++++++++++++++++++++ src/solr/conf/spellings.txt | 2 + src/solr/conf/stopwords.txt | 57 +++ src/solr/conf/synonyms.txt | 30 ++ 10 files changed, 1339 insertions(+), 0 deletions(-) create mode 100644 src/config/sunspot.yml create mode 100644 src/solr/conf/elevate.xml create mode 100644 src/solr/conf/schema.xml create mode 100644 src/solr/conf/solrconfig.xml create mode 100644 src/solr/conf/spellings.txt create mode 100644 src/solr/conf/stopwords.txt create mode 100644 src/solr/conf/synonyms.txt diff --git a/.gitignore b/.gitignore index b70174c..4785d79 100644 --- a/.gitignore +++ b/.gitignore @@ -29,3 +29,6 @@ src/public/stylesheets/compiled development.sqlite3 production.sqlite3 test.sqlite3 + +# the search index generated by Solr +src/solr/data diff --git a/src/Rakefile b/src/Rakefile index 37c683b..6164883 100644 --- a/src/Rakefile +++ b/src/Rakefile @@ -7,5 +7,6 @@ require(File.join(File.dirname(__FILE__), 'config', 'boot')) require 'rake' require 'rake/testtask' require 'rake/rdoctask' +require 'sunspot/rails/tasks' require 'tasks/rails' diff --git a/src/config/environment.rb b/src/config/environment.rb index 09ec85b..dadcea3 100644 --- a/src/config/environment.rb +++ b/src/config/environment.rb @@ -53,6 +53,7 @@ Rails::Initializer.run do |config| config.gem "typhoeus" config.gem "rb-inotify" config.gem 'rack-restful_submit', :version => '1.1.2' + config.gem 'sunspot_rails', :lib => 'sunspot/rails' config.middleware.swap Rack::MethodOverride, 'Rack::RestfulSubmit' diff --git a/src/config/sunspot.yml b/src/config/sunspot.yml new file mode 100644 index 0000000..8d498bc --- /dev/null +++ b/src/config/sunspot.yml @@ -0,0 +1,23 @@ +production: + solr: + hostname: localhost + port: 8983 + log_level: WARNING + +development: + solr: + hostname: localhost + port: 8982 + log_level: INFO + +cucumber: + solr: + hostname: localhost + port: 8981 + log_level: WARNING + +test: + solr: + hostname: localhost + port: 8981 + log_level: WARNING diff --git a/src/solr/conf/elevate.xml b/src/solr/conf/elevate.xml new file mode 100644 index 0000000..0472508 --- /dev/null +++ b/src/solr/conf/elevate.xml @@ -0,0 +1,36 @@ +<?xml version="1.0" encoding="UTF-8" ?> + + + + +<elevate> + <query text="foo bar"> + <doc id="1" /> + <doc id="2" /> + <doc id="3" /> + </query> + + <query text="ipod"> + <doc id="MA147LL/A" />  + <doc id="IW-02" exclude="true" />  + </query> + +</elevate> diff --git a/src/solr/conf/schema.xml b/src/solr/conf/schema.xml new file mode 100644 index 0000000..a36ea0f --- /dev/null +++ b/src/solr/conf/schema.xml @@ -0,0 +1,252 @@ +<?xml version="1.0" encoding="UTF-8"?> + + +<schema name="sunspot" version="1.0"> + <types> +  +  + <fieldType name="string" class="solr.StrField" omitNorms="true"/> +  + <fieldType name="tdouble" class="solr.TrieDoubleField" omitNorms="true"/> +  + <fieldType name="rand" class="solr.RandomSortField" omitNorms="true"/> +  + <fieldType name="text" class="solr.TextField" omitNorms="false"> + <analyzer> + <tokenizer class="solr.StandardTokenizerFactory"/> + <filter class="solr.StandardFilterFactory"/> + <filter class="solr.LowerCaseFilterFactory"/> + </analyzer> + </fieldType> +  + <fieldType class="solr.TextField" name="text_sub" positionIncrementGap="100"> + <analyzer type="index"> + <tokenizer class="solr.WhitespaceTokenizerFactory"/> + <filter class="solr.LowerCaseFilterFactory"/> + <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="15"/> + </analyzer> + <analyzer type="query"> + <tokenizer class="solr.WhitespaceTokenizerFactory"/> + <filter class="solr.LowerCaseFilterFactory"/> + </analyzer> + </fieldType> +  + <fieldType name="boolean" class="solr.BoolField" omitNorms="true"/> +  + <fieldType name="date" class="solr.DateField" omitNorms="true"/> +  + <fieldType name="sdouble" class="solr.SortableDoubleField" omitNorms="true"/> +  + <fieldType name="sfloat" class="solr.SortableFloatField" omitNorms="true"/> +  + <fieldType name="sint" class="solr.SortableIntField" omitNorms="true"/> +  + <fieldType name="slong" class="solr.SortableLongField" omitNorms="true"/> +  + <fieldType name="tint" class="solr.TrieIntField" omitNorms="true"/> +  + <fieldType name="tfloat" class="solr.TrieFloatField" omitNorms="true"/> +  + <fieldType name="tdate" class="solr.TrieDateField" omitNorms="true"/> + </types> + <fields> +  +  + <field name="id" stored="true" type="string" multiValued="false" indexed="true"/> +  + <field name="type" stored="false" type="string" multiValued="true" indexed="true"/> +  + <field name="class_name" stored="false" type="string" multiValued="false" indexed="true"/> +  + <field name="text" stored="false" type="string" multiValued="true" indexed="true"/> +  + <field name="lat" stored="true" type="tdouble" multiValued="false" indexed="true"/> +  + <field name="lng" stored="true" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="random_*" stored="false" type="rand" multiValued="false" indexed="true"/> +  + <dynamicField name="_local*" stored="false" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_text" stored="false" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_texts" stored="true" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_substring" stored="false" type="text_sub" multiValued="true" indexed="true"/> +  + <dynamicField name="*_b" stored="false" type="boolean" multiValued="false" indexed="true"/> +  + <dynamicField name="*_bm" stored="false" type="boolean" multiValued="true" indexed="true"/> +  + <dynamicField name="*_bs" stored="true" type="boolean" multiValued="false" indexed="true"/> +  + <dynamicField name="*_bms" stored="true" type="boolean" multiValued="true" indexed="true"/> +  + <dynamicField name="*_d" stored="false" type="date" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dm" stored="false" type="date" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ds" stored="true" type="date" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dms" stored="true" type="date" multiValued="true" indexed="true"/> +  + <dynamicField name="*_e" stored="false" type="sdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_em" stored="false" type="sdouble" multiValued="true" indexed="true"/> +  + <dynamicField name="*_es" stored="true" type="sdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ems" stored="true" type="sdouble" multiValued="true" indexed="true"/> +  + <dynamicField name="*_f" stored="false" type="sfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_fm" stored="false" type="sfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_fs" stored="true" type="sfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_fms" stored="true" type="sfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_i" stored="false" type="sint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_im" stored="false" type="sint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_is" stored="true" type="sint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ims" stored="true" type="sint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_l" stored="false" type="slong" multiValued="false" indexed="true"/> +  + <dynamicField name="*_lm" stored="false" type="slong" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ls" stored="true" type="slong" multiValued="false" indexed="true"/> +  + <dynamicField name="*_lms" stored="true" type="slong" multiValued="true" indexed="true"/> +  + <dynamicField name="*_s" stored="false" type="string" multiValued="false" indexed="true"/> +  + <dynamicField name="*_sm" stored="false" type="string" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ss" stored="true" type="string" multiValued="false" indexed="true"/> +  + <dynamicField name="*_sms" stored="true" type="string" multiValued="true" indexed="true"/> +  + <dynamicField name="*_it" stored="false" type="tint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_itm" stored="false" type="tint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_its" stored="true" type="tint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_itms" stored="true" type="tint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ft" stored="false" type="tfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ftm" stored="false" type="tfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_fts" stored="true" type="tfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ftms" stored="true" type="tfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_dt" stored="false" type="tdate" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dtm" stored="false" type="tdate" multiValued="true" indexed="true"/> +  + <dynamicField name="*_dts" stored="true" type="tdate" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dtms" stored="true" type="tdate" multiValued="true" indexed="true"/> +  + <dynamicField name="*_textv" stored="false" termVectors="true" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_textsv" stored="true" termVectors="true" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_et" stored="false" termVectors="true" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_etm" stored="false" termVectors="true" type="tdouble" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ets" stored="true" termVectors="true" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_etms" stored="true" termVectors="true" type="tdouble" multiValued="true" indexed="true"/> + </fields> +  + <uniqueKey>id</uniqueKey> +  + <defaultSearchField>text</defaultSearchField> +  + <solrQueryParser defaultOperator="AND"/> +  +</schema> diff --git a/src/solr/conf/solrconfig.xml b/src/solr/conf/solrconfig.xml new file mode 100644 index 0000000..2bca955 --- /dev/null +++ b/src/solr/conf/solrconfig.xml @@ -0,0 +1,934 @@ +<?xml version="1.0" encoding="UTF-8"?> + + +<config> +  + <abortOnConfigurationError>${solr.abortOnConfigurationError:true}</abortOnConfigurationError> +  +  + <lib dir="../../contrib/extraction/lib"/> +  + <lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar"/> + <lib dir="../../dist/" regex="apache-solr-clustering-\d.*\.jar"/> +  + <lib dir="../../contrib/clustering/lib/downloads/"/> + <lib dir="../../contrib/clustering/lib/"/> + <lib dir="/total/crap/dir/ignored"/> +  +  + <dataDir>${solr.data.dir:./solr/data}</dataDir> +  + <indexDefaults> +  + <useCompoundFile>false</useCompoundFile> + <mergeFactor>10</mergeFactor> +  +  +  + <ramBufferSizeMB>32</ramBufferSizeMB> +  + <maxFieldLength>10000</maxFieldLength> + <writeLockTimeout>1000</writeLockTimeout> + <commitLockTimeout>10000</commitLockTimeout> +  +  +  +  +  +  +  + <lockType>native</lockType> +  +  + </indexDefaults> + <mainIndex> +  + <useCompoundFile>false</useCompoundFile> + <ramBufferSizeMB>32</ramBufferSizeMB> + <mergeFactor>10</mergeFactor> +  +  +  +  +  + <unlockOnStartup>false</unlockOnStartup> +  + <reopenReaders>true</reopenReaders> +  +  +  + <deletionPolicy class="solr.SolrDeletionPolicy"> +  + <str name="maxCommitsToKeep">1</str> +  + <str name="maxOptimizedCommitsToKeep">0</str> +  + </deletionPolicy> +  + <infoStream file="INFOSTREAM.txt">false</infoStream> + </mainIndex> +  + <jmx/> +  + <updateHandler class="solr.DirectUpdateHandler2"> +  +  +  +  +  + </updateHandler> +  +  +  + <query> +  + <maxBooleanClauses>1024</maxBooleanClauses> +  +  + <filterCache class="solr.FastLRUCache" size="512" initialSize="512" autowarmCount="0"/> +  +  + <queryResultCache class="solr.LRUCache" size="512" initialSize="512" autowarmCount="0"/> +  + <documentCache class="solr.LRUCache" size="512" initialSize="512" autowarmCount="0"/> +  + <enableLazyFieldLoading>true</enableLazyFieldLoading> +  +  +  +  + <queryResultWindowSize>20</queryResultWindowSize> +  + <queryResultMaxDocsCached>200</queryResultMaxDocsCached> +  +  + <listener event="newSearcher" class="solr.QuerySenderListener"> + <arr name="queries"> +  + </arr> + </listener> +  + <listener event="firstSearcher" class="solr.QuerySenderListener"> + <arr name="queries"> + <lst> + <str name="q">solr rocks</str> + <str name="start">0</str> + <str name="rows">10</str> + </lst> + <lst> + <str name="q">static firstSearcher warming query from solrconfig.xml</str> + </lst> + </arr> + </listener> +  + <useColdSearcher>false</useColdSearcher> +  + <maxWarmingSearchers>2</maxWarmingSearchers> + </query> +  + <requestDispatcher handleSelect="true"> +  + <requestParsers enableRemoteStreaming="true" multipartUploadLimitInKB="2048000"/> +  +  + <httpCaching lastModifiedFrom="openTime" etagSeed="Solr"> +  +  +  + </httpCaching> + </requestDispatcher> +  + <requestHandler name="standard" class="solr.SearchHandler" default="true"> +  + <lst name="defaults"> + <str name="echoParams">explicit</str> +  + </lst> + </requestHandler> +  +  +  +  +  + <requestHandler name="dismax" class="solr.SearchHandler"> + <lst name="defaults"> + <str name="defType">dismax</str> + <str name="echoParams">explicit</str> + <float name="tie">0.01</float> + <str name="qf"> + text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4 + </str> + <str name="pf"> + text^0.2 features^1.1 name^1.5 manu^1.4 manu_exact^1.9 + </str> + <str name="bf"> + popularity^0.5 recip(price,1,1000,1000)^0.3 + </str> + <str name="fl"> + id,name,price,score + </str> + <str name="mm"> + 2<-1 5<-2 6<90% + </str> + <int name="ps">100</int> + <str name="q.alt">*:*</str> +  + <str name="hl.fl">text features name</str> +  + <str name="f.name.hl.fragsize">0</str> +  + <str name="f.name.hl.alternateField">name</str> + <str name="f.text.hl.fragmenter">regex</str> +  + </lst> + </requestHandler> +  + <requestHandler name="partitioned" class="solr.SearchHandler"> + <lst name="defaults"> + <str name="defType">dismax</str> + <str name="echoParams">explicit</str> + <str name="qf">text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0</str> + <str name="mm">2<-1 5<-2 6<90%</str> +  + <str name="bq">incubationdate_dt:[* TO NOW/DAY-1MONTH]^2.2</str> + </lst> +  + <lst name="appends"> + <str name="fq">inStock:true</str> + </lst> +  + <lst name="invariants"> + <str name="facet.field">cat</str> + <str name="facet.field">manu_exact</str> + <str name="facet.query">price:[* TO 500]</str> + <str name="facet.query">price:[500 TO *]</str> + </lst> + </requestHandler> +  +  + <searchComponent name="spellcheck" class="solr.SpellCheckComponent"> + <str name="queryAnalyzerFieldType">textSpell</str> + <lst name="spellchecker"> + <str name="name">default</str> + <str name="field">name</str> + <str name="spellcheckIndexDir">./spellchecker</str> + </lst> +  +  + </searchComponent> +  + <requestHandler name="/spell" class="solr.SearchHandler" lazy="true"> + <lst name="defaults"> +  + <str name="spellcheck.onlyMorePopular">false</str> +  + <str name="spellcheck.extendedResults">false</str> +  + <str name="spellcheck.count">1</str> + </lst> + <arr name="last-components"> + <str>spellcheck</str> + </arr> + </requestHandler> + <searchComponent name="tvComponent" class="org.apache.solr.handler.component.TermVectorComponent"/> +  + <requestHandler name="tvrh" class="org.apache.solr.handler.component.SearchHandler"> + <lst name="defaults"> + <bool name="tv">true</bool> + </lst> + <arr name="last-components"> + <str>tvComponent</str> + </arr> + </requestHandler> +  + <searchComponent name="clusteringComponent" enable="${solr.clustering.enabled:false}" class="org.apache.solr.handler.clustering.ClusteringComponent"> +  + <lst name="engine"> +  + <str name="name">default</str> +  + <str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str> +  + <str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str> + </lst> + <lst name="engine"> + <str name="name">stc</str> + <str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str> + </lst> + </searchComponent> + <requestHandler name="/clustering" enable="${solr.clustering.enabled:false}" class="solr.SearchHandler"> + <lst name="defaults"> + <bool name="clustering">true</bool> + <str name="clustering.engine">default</str> + <bool name="clustering.results">true</bool> +  + <str name="carrot.title">name</str> + <str name="carrot.url">id</str> +  + <str name="carrot.snippet">features</str> +  + <bool name="carrot.produceSummary">true</bool> +  +  +  + <bool name="carrot.outputSubClusters">false</bool> + </lst> + <arr name="last-components"> + <str>clusteringComponent</str> + </arr> + </requestHandler> +  + <requestHandler name="/update/extract" class="org.apache.solr.handler.extraction.ExtractingRequestHandler" startup="lazy"> + <lst name="defaults"> +  + <str name="fmap.content">text</str> + <str name="lowernames">true</str> + <str name="uprefix">ignored_</str> +  + <str name="captureAttr">true</str> + <str name="fmap.a">links</str> + <str name="fmap.div">ignored_</str> + </lst> + </requestHandler> +  + <searchComponent name="termsComponent" class="org.apache.solr.handler.component.TermsComponent"/> + <requestHandler name="/terms" class="org.apache.solr.handler.component.SearchHandler"> + <lst name="defaults"> + <bool name="terms">true</bool> + </lst> + <arr name="components"> + <str>termsComponent</str> + </arr> + </requestHandler> +  + <searchComponent name="elevator" class="solr.QueryElevationComponent"> +  + <str name="queryFieldType">string</str> + <str name="config-file">elevate.xml</str> + </searchComponent> +  + <requestHandler name="/elevate" class="solr.SearchHandler" startup="lazy"> + <lst name="defaults"> + <str name="echoParams">explicit</str> + </lst> + <arr name="last-components"> + <str>elevator</str> + </arr> + </requestHandler> +  + <requestHandler name="/update" class="solr.XmlUpdateRequestHandler"/> + <requestHandler name="/update/javabin" class="solr.BinaryUpdateRequestHandler"/> +  +  + <requestHandler name="/analysis/document" class="solr.DocumentAnalysisRequestHandler"/> +  + <requestHandler name="/analysis/field" class="solr.FieldAnalysisRequestHandler"/> +  + <requestHandler name="/update/csv" class="solr.CSVRequestHandler" startup="lazy"/> +  + <requestHandler name="/admin/" class="org.apache.solr.handler.admin.AdminHandlers"/> +  + <requestHandler name="/admin/ping" class="PingRequestHandler"> + <lst name="defaults"> + <str name="qt">standard</str> + <str name="q">solrpingquery</str> + <str name="echoParams">all</str> + </lst> + </requestHandler> +  + <requestHandler name="/debug/dump" class="solr.DumpRequestHandler"> + <lst name="defaults"> + <str name="echoParams">explicit</str> +  + <str name="echoHandler">true</str> + </lst> + </requestHandler> + <highlighting> +  +  + <fragmenter name="gap" class="org.apache.solr.highlight.GapFragmenter" default="true"> + <lst name="defaults"> + <int name="hl.fragsize">100</int> + </lst> + </fragmenter> +  + <fragmenter name="regex" class="org.apache.solr.highlight.RegexFragmenter"> + <lst name="defaults"> +  + <int name="hl.fragsize">70</int> +  + <float name="hl.regex.slop">0.5</float> +  + <str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str> + </lst> + </fragmenter> +  + <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true"> + <lst name="defaults"> + <str name="hl.simple.pre"><![CDATA[<em>]]></str> + <str name="hl.simple.post"><![CDATA[</em>]]></str> + </lst> + </formatter> + </highlighting> +  +  +  +  + <queryResponseWriter name="xslt" class="org.apache.solr.request.XSLTResponseWriter"> + <int name="xsltCacheLifetimeSeconds">5</int> + </queryResponseWriter> +  +  +  + <admin> + <defaultQuery>solr</defaultQuery> +  + </admin> + <requestHandler class="solr.MoreLikeThisHandler" name="/mlt"> + <lst name="defaults"> + <str name="mlt.mintf">1</str> + <str name="mlt.mindf">2</str> + </lst> + </requestHandler> +</config> diff --git a/src/solr/conf/spellings.txt b/src/solr/conf/spellings.txt new file mode 100644 index 0000000..d7ede6f --- /dev/null +++ b/src/solr/conf/spellings.txt @@ -0,0 +1,2 @@ +pizza +history \ No newline at end of file diff --git a/src/solr/conf/stopwords.txt b/src/solr/conf/stopwords.txt new file mode 100644 index 0000000..0a23ec2 --- /dev/null +++ b/src/solr/conf/stopwords.txt @@ -0,0 +1,57 @@ +# Licensed to the Apache Software Foundation (ASF) under one or more +# contributor license agreements. See the NOTICE file distributed with +# this work for additional information regarding copyright ownership. +# The ASF licenses this file to You under the Apache License, Version 2.0 +# (the "License"); you may not use this file except in compliance with +# the License. You may obtain a copy of the License at +# +# http://www.apache.org/licenses/LICENSE-2.0 +# +# Unless required by applicable law or agreed to in writing, software +# distributed under the License is distributed on an "AS IS" BASIS, +# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. +# See the License for the specific language governing permissions and +# limitations under the License. + +#----------------------------------------------------------------------- +# a couple of test stopwords to test that the words are really being +# configured from this file: +stopworda +stopwordb + +#Standard english stop words taken from Lucene's StopAnalyzer +a +an +and +are +as +at +be +but +by +for +if +in +into +is +it +no +not +of +on +or +s +such +t +that +the +their +then +there +these +they +this +to +was +will +with diff --git a/src/solr/conf/synonyms.txt b/src/solr/conf/synonyms.txt new file mode 100644 index 0000000..fa4755d --- /dev/null +++ b/src/solr/conf/synonyms.txt @@ -0,0 +1,30 @@ +# The ASF licenses this file to You under the Apache License, Version 2.0 +# (the "License"); you may not use this file except in compliance with +# the License. You may obtain a copy of the License at +# +# http://www.apache.org/licenses/LICENSE-2.0 +# +# Unless required by applicable law or agreed to in writing, software +# distributed under the License is distributed on an "AS IS" BASIS, +# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. +# See the License for the specific language governing permissions and +# limitations under the License. + +#----------------------------------------------------------------------- +#some test synonym mappings unlikely to appear in real input text +aaa => aaaa +bbb => bbbb1 bbbb2 +ccc => cccc1,cccc2 +a\=>a => b\=>b +a\,a => b\,b +fooaaa,baraaa,bazaaa + +# Some synonym groups specific to this example +GB,gib,gigabyte,gigabytes +MB,mib,megabyte,megabytes +Television, Televisions, TV, TVs +#notice we use "gib" instead of "GiB" so any WordDelimiterFilter coming +#after us won't split it into two words. + +# Synonym mappings can be used for spelling correction too +pixima => pixma -- 1.7.3.4

Reply

lmartinc＠redhat.com

7:54 a.m.

New subject: [PATCH aeolus 1/3] Add Solr/Sunspot search support

ACK to all SOLR patches, good work! On Jan 13, 2011, at 2:40 PM, tsedovic(a)redhat.com wrote:

From: Tomas Sedovic <tsedovic(a)redhat.com> This gets us ready for adding the search. The Solr server is bundled with the sunspot gem so you don't have to install it by hand. On the dev machine, not in production of course. Run `rake sunspot:solr:start` to start the Solr server. When you make change to the solr/conf files, you must stop and start it again. Run `rake sunspot:reindex` to rebuild the index -- do this when you change the search setup in the models. --- .gitignore | 3 + src/Rakefile | 1 + src/config/environment.rb | 1 + src/config/sunspot.yml | 23 + src/solr/conf/elevate.xml | 36 ++ src/solr/conf/schema.xml | 252 ++++++++++++ src/solr/conf/solrconfig.xml | 934 ++++++++++++++++++++++++++++++++++++++++++ src/solr/conf/spellings.txt | 2 + src/solr/conf/stopwords.txt | 57 +++ src/solr/conf/synonyms.txt | 30 ++ 10 files changed, 1339 insertions(+), 0 deletions(-) create mode 100644 src/config/sunspot.yml create mode 100644 src/solr/conf/elevate.xml create mode 100644 src/solr/conf/schema.xml create mode 100644 src/solr/conf/solrconfig.xml create mode 100644 src/solr/conf/spellings.txt create mode 100644 src/solr/conf/stopwords.txt create mode 100644 src/solr/conf/synonyms.txt diff --git a/.gitignore b/.gitignore index b70174c..4785d79 100644 --- a/.gitignore +++ b/.gitignore @@ -29,3 +29,6 @@ src/public/stylesheets/compiled development.sqlite3 production.sqlite3 test.sqlite3 + +# the search index generated by Solr +src/solr/data diff --git a/src/Rakefile b/src/Rakefile index 37c683b..6164883 100644 --- a/src/Rakefile +++ b/src/Rakefile @@ -7,5 +7,6 @@ require(File.join(File.dirname(__FILE__), 'config', 'boot')) require 'rake' require 'rake/testtask' require 'rake/rdoctask' +require 'sunspot/rails/tasks' require 'tasks/rails' diff --git a/src/config/environment.rb b/src/config/environment.rb index 09ec85b..dadcea3 100644 --- a/src/config/environment.rb +++ b/src/config/environment.rb @@ -53,6 +53,7 @@ Rails::Initializer.run do |config| config.gem "typhoeus" config.gem "rb-inotify" config.gem 'rack-restful_submit', :version => '1.1.2' + config.gem 'sunspot_rails', :lib => 'sunspot/rails' config.middleware.swap Rack::MethodOverride, 'Rack::RestfulSubmit' diff --git a/src/config/sunspot.yml b/src/config/sunspot.yml new file mode 100644 index 0000000..8d498bc --- /dev/null +++ b/src/config/sunspot.yml @@ -0,0 +1,23 @@ +production: + solr: + hostname: localhost + port: 8983 + log_level: WARNING + +development: + solr: + hostname: localhost + port: 8982 + log_level: INFO + +cucumber: + solr: + hostname: localhost + port: 8981 + log_level: WARNING + +test: + solr: + hostname: localhost + port: 8981 + log_level: WARNING diff --git a/src/solr/conf/elevate.xml b/src/solr/conf/elevate.xml new file mode 100644 index 0000000..0472508 --- /dev/null +++ b/src/solr/conf/elevate.xml @@ -0,0 +1,36 @@ +<?xml version="1.0" encoding="UTF-8" ?> + + + + +<elevate> + <query text="foo bar"> + <doc id="1" /> + <doc id="2" /> + <doc id="3" /> + </query> + + <query text="ipod"> + <doc id="MA147LL/A" />  + <doc id="IW-02" exclude="true" />  + </query> + +</elevate> diff --git a/src/solr/conf/schema.xml b/src/solr/conf/schema.xml new file mode 100644 index 0000000..a36ea0f --- /dev/null +++ b/src/solr/conf/schema.xml @@ -0,0 +1,252 @@ +<?xml version="1.0" encoding="UTF-8"?> + + +<schema name="sunspot" version="1.0"> + <types> +  +  + <fieldType name="string" class="solr.StrField" omitNorms="true"/> +  + <fieldType name="tdouble" class="solr.TrieDoubleField" omitNorms="true"/> +  + <fieldType name="rand" class="solr.RandomSortField" omitNorms="true"/> +  + <fieldType name="text" class="solr.TextField" omitNorms="false"> + <analyzer> + <tokenizer class="solr.StandardTokenizerFactory"/> + <filter class="solr.StandardFilterFactory"/> + <filter class="solr.LowerCaseFilterFactory"/> + </analyzer> + </fieldType> +  + <fieldType class="solr.TextField" name="text_sub" positionIncrementGap="100"> + <analyzer type="index"> + <tokenizer class="solr.WhitespaceTokenizerFactory"/> + <filter class="solr.LowerCaseFilterFactory"/> + <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="15"/> + </analyzer> + <analyzer type="query"> + <tokenizer class="solr.WhitespaceTokenizerFactory"/> + <filter class="solr.LowerCaseFilterFactory"/> + </analyzer> + </fieldType> +  + <fieldType name="boolean" class="solr.BoolField" omitNorms="true"/> +  + <fieldType name="date" class="solr.DateField" omitNorms="true"/> +  + <fieldType name="sdouble" class="solr.SortableDoubleField" omitNorms="true"/> +  + <fieldType name="sfloat" class="solr.SortableFloatField" omitNorms="true"/> +  + <fieldType name="sint" class="solr.SortableIntField" omitNorms="true"/> +  + <fieldType name="slong" class="solr.SortableLongField" omitNorms="true"/> +  + <fieldType name="tint" class="solr.TrieIntField" omitNorms="true"/> +  + <fieldType name="tfloat" class="solr.TrieFloatField" omitNorms="true"/> +  + <fieldType name="tdate" class="solr.TrieDateField" omitNorms="true"/> + </types> + <fields> +  +  + <field name="id" stored="true" type="string" multiValued="false" indexed="true"/> +  + <field name="type" stored="false" type="string" multiValued="true" indexed="true"/> +  + <field name="class_name" stored="false" type="string" multiValued="false" indexed="true"/> +  + <field name="text" stored="false" type="string" multiValued="true" indexed="true"/> +  + <field name="lat" stored="true" type="tdouble" multiValued="false" indexed="true"/> +  + <field name="lng" stored="true" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="random_*" stored="false" type="rand" multiValued="false" indexed="true"/> +  + <dynamicField name="_local*" stored="false" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_text" stored="false" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_texts" stored="true" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_substring" stored="false" type="text_sub" multiValued="true" indexed="true"/> +  + <dynamicField name="*_b" stored="false" type="boolean" multiValued="false" indexed="true"/> +  + <dynamicField name="*_bm" stored="false" type="boolean" multiValued="true" indexed="true"/> +  + <dynamicField name="*_bs" stored="true" type="boolean" multiValued="false" indexed="true"/> +  + <dynamicField name="*_bms" stored="true" type="boolean" multiValued="true" indexed="true"/> +  + <dynamicField name="*_d" stored="false" type="date" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dm" stored="false" type="date" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ds" stored="true" type="date" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dms" stored="true" type="date" multiValued="true" indexed="true"/> +  + <dynamicField name="*_e" stored="false" type="sdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_em" stored="false" type="sdouble" multiValued="true" indexed="true"/> +  + <dynamicField name="*_es" stored="true" type="sdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ems" stored="true" type="sdouble" multiValued="true" indexed="true"/> +  + <dynamicField name="*_f" stored="false" type="sfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_fm" stored="false" type="sfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_fs" stored="true" type="sfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_fms" stored="true" type="sfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_i" stored="false" type="sint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_im" stored="false" type="sint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_is" stored="true" type="sint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ims" stored="true" type="sint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_l" stored="false" type="slong" multiValued="false" indexed="true"/> +  + <dynamicField name="*_lm" stored="false" type="slong" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ls" stored="true" type="slong" multiValued="false" indexed="true"/> +  + <dynamicField name="*_lms" stored="true" type="slong" multiValued="true" indexed="true"/> +  + <dynamicField name="*_s" stored="false" type="string" multiValued="false" indexed="true"/> +  + <dynamicField name="*_sm" stored="false" type="string" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ss" stored="true" type="string" multiValued="false" indexed="true"/> +  + <dynamicField name="*_sms" stored="true" type="string" multiValued="true" indexed="true"/> +  + <dynamicField name="*_it" stored="false" type="tint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_itm" stored="false" type="tint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_its" stored="true" type="tint" multiValued="false" indexed="true"/> +  + <dynamicField name="*_itms" stored="true" type="tint" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ft" stored="false" type="tfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ftm" stored="false" type="tfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_fts" stored="true" type="tfloat" multiValued="false" indexed="true"/> +  + <dynamicField name="*_ftms" stored="true" type="tfloat" multiValued="true" indexed="true"/> +  + <dynamicField name="*_dt" stored="false" type="tdate" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dtm" stored="false" type="tdate" multiValued="true" indexed="true"/> +  + <dynamicField name="*_dts" stored="true" type="tdate" multiValued="false" indexed="true"/> +  + <dynamicField name="*_dtms" stored="true" type="tdate" multiValued="true" indexed="true"/> +  + <dynamicField name="*_textv" stored="false" termVectors="true" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_textsv" stored="true" termVectors="true" type="text" multiValued="true" indexed="true"/> +  + <dynamicField name="*_et" stored="false" termVectors="true" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_etm" stored="false" termVectors="true" type="tdouble" multiValued="true" indexed="true"/> +  + <dynamicField name="*_ets" stored="true" termVectors="true" type="tdouble" multiValued="false" indexed="true"/> +  + <dynamicField name="*_etms" stored="true" termVectors="true" type="tdouble" multiValued="true" indexed="true"/> + </fields> +  + <uniqueKey>id</uniqueKey> +  + <defaultSearchField>text</defaultSearchField> +  + <solrQueryParser defaultOperator="AND"/> +  +</schema> diff --git a/src/solr/conf/solrconfig.xml b/src/solr/conf/solrconfig.xml new file mode 100644 index 0000000..2bca955 --- /dev/null +++ b/src/solr/conf/solrconfig.xml @@ -0,0 +1,934 @@ +<?xml version="1.0" encoding="UTF-8"?> + + +<config> +  + <abortOnConfigurationError>${solr.abortOnConfigurationError:true}</abortOnConfigurationError> +  +  + <lib dir="../../contrib/extraction/lib"/> +  + <lib dir="../../dist/" regex="apache-solr-cell-\d.*\.jar"/> + <lib dir="../../dist/" regex="apache-solr-clustering-\d.*\.jar"/> +  + <lib dir="../../contrib/clustering/lib/downloads/"/> + <lib dir="../../contrib/clustering/lib/"/> + <lib dir="/total/crap/dir/ignored"/> +  +  + <dataDir>${solr.data.dir:./solr/data}</dataDir> +  + <indexDefaults> +  + <useCompoundFile>false</useCompoundFile> + <mergeFactor>10</mergeFactor> +  +  +  + <ramBufferSizeMB>32</ramBufferSizeMB> +  + <maxFieldLength>10000</maxFieldLength> + <writeLockTimeout>1000</writeLockTimeout> + <commitLockTimeout>10000</commitLockTimeout> +  +  +  +  +  +  +  + <lockType>native</lockType> +  +  + </indexDefaults> + <mainIndex> +  + <useCompoundFile>false</useCompoundFile> + <ramBufferSizeMB>32</ramBufferSizeMB> + <mergeFactor>10</mergeFactor> +  +  +  +  +  + <unlockOnStartup>false</unlockOnStartup> +  + <reopenReaders>true</reopenReaders> +  +  +  + <deletionPolicy class="solr.SolrDeletionPolicy"> +  + <str name="maxCommitsToKeep">1</str> +  + <str name="maxOptimizedCommitsToKeep">0</str> +  + </deletionPolicy> +  + <infoStream file="INFOSTREAM.txt">false</infoStream> + </mainIndex> +  + <jmx/> +  + <updateHandler class="solr.DirectUpdateHandler2"> +  +  +  +  +  + </updateHandler> +  +  +  + <query> +  + <maxBooleanClauses>1024</maxBooleanClauses> +  +  + <filterCache class="solr.FastLRUCache" size="512" initialSize="512" autowarmCount="0"/> +  +  + <queryResultCache class="solr.LRUCache" size="512" initialSize="512" autowarmCount="0"/> +  + <documentCache class="solr.LRUCache" size="512" initialSize="512" autowarmCount="0"/> +  + <enableLazyFieldLoading>true</enableLazyFieldLoading> +  +  +  +  + <queryResultWindowSize>20</queryResultWindowSize> +  + <queryResultMaxDocsCached>200</queryResultMaxDocsCached> +  +  + <listener event="newSearcher" class="solr.QuerySenderListener"> + <arr name="queries"> +  + </arr> + </listener> +  + <listener event="firstSearcher" class="solr.QuerySenderListener"> + <arr name="queries"> + <lst> + <str name="q">solr rocks</str> + <str name="start">0</str> + <str name="rows">10</str> + </lst> + <lst> + <str name="q">static firstSearcher warming query from solrconfig.xml</str> + </lst> + </arr> + </listener> +  + <useColdSearcher>false</useColdSearcher> +  + <maxWarmingSearchers>2</maxWarmingSearchers> + </query> +  + <requestDispatcher handleSelect="true"> +  + <requestParsers enableRemoteStreaming="true" multipartUploadLimitInKB="2048000"/> +  +  + <httpCaching lastModifiedFrom="openTime" etagSeed="Solr"> +  +  +  + </httpCaching> + </requestDispatcher> +  + <requestHandler name="standard" class="solr.SearchHandler" default="true"> +  + <lst name="defaults"> + <str name="echoParams">explicit</str> +  + </lst> + </requestHandler> +  +  +  +  +  + <requestHandler name="dismax" class="solr.SearchHandler"> + <lst name="defaults"> + <str name="defType">dismax</str> + <str name="echoParams">explicit</str> + <float name="tie">0.01</float> + <str name="qf"> + text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4 + </str> + <str name="pf"> + text^0.2 features^1.1 name^1.5 manu^1.4 manu_exact^1.9 + </str> + <str name="bf"> + popularity^0.5 recip(price,1,1000,1000)^0.3 + </str> + <str name="fl"> + id,name,price,score + </str> + <str name="mm"> + 2<-1 5<-2 6<90% + </str> + <int name="ps">100</int> + <str name="q.alt">*:*</str> +  + <str name="hl.fl">text features name</str> +  + <str name="f.name.hl.fragsize">0</str> +  + <str name="f.name.hl.alternateField">name</str> + <str name="f.text.hl.fragmenter">regex</str> +  + </lst> + </requestHandler> +  + <requestHandler name="partitioned" class="solr.SearchHandler"> + <lst name="defaults"> + <str name="defType">dismax</str> + <str name="echoParams">explicit</str> + <str name="qf">text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0</str> + <str name="mm">2<-1 5<-2 6<90%</str> +  + <str name="bq">incubationdate_dt:[* TO NOW/DAY-1MONTH]^2.2</str> + </lst> +  + <lst name="appends"> + <str name="fq">inStock:true</str> + </lst> +  + <lst name="invariants"> + <str name="facet.field">cat</str> + <str name="facet.field">manu_exact</str> + <str name="facet.query">price:[* TO 500]</str> + <str name="facet.query">price:[500 TO *]</str> + </lst> + </requestHandler> +  +  + <searchComponent name="spellcheck" class="solr.SpellCheckComponent"> + <str name="queryAnalyzerFieldType">textSpell</str> + <lst name="spellchecker"> + <str name="name">default</str> + <str name="field">name</str> + <str name="spellcheckIndexDir">./spellchecker</str> + </lst> +  +  + </searchComponent> +  + <requestHandler name="/spell" class="solr.SearchHandler" lazy="true"> + <lst name="defaults"> +  + <str name="spellcheck.onlyMorePopular">false</str> +  + <str name="spellcheck.extendedResults">false</str> +  + <str name="spellcheck.count">1</str> + </lst> + <arr name="last-components"> + <str>spellcheck</str> + </arr> + </requestHandler> + <searchComponent name="tvComponent" class="org.apache.solr.handler.component.TermVectorComponent"/> +  + <requestHandler name="tvrh" class="org.apache.solr.handler.component.SearchHandler"> + <lst name="defaults"> + <bool name="tv">true</bool> + </lst> + <arr name="last-components"> + <str>tvComponent</str> + </arr> + </requestHandler> +  + <searchComponent name="clusteringComponent" enable="${solr.clustering.enabled:false}" class="org.apache.solr.handler.clustering.ClusteringComponent"> +  + <lst name="engine"> +  + <str name="name">default</str> +  + <str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str> +  + <str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str> + </lst> + <lst name="engine"> + <str name="name">stc</str> + <str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str> + </lst> + </searchComponent> + <requestHandler name="/clustering" enable="${solr.clustering.enabled:false}" class="solr.SearchHandler"> + <lst name="defaults"> + <bool name="clustering">true</bool> + <str name="clustering.engine">default</str> + <bool name="clustering.results">true</bool> +  + <str name="carrot.title">name</str> + <str name="carrot.url">id</str> +  + <str name="carrot.snippet">features</str> +  + <bool name="carrot.produceSummary">true</bool> +  +  +  + <bool name="carrot.outputSubClusters">false</bool> + </lst> + <arr name="last-components"> + <str>clusteringComponent</str> + </arr> + </requestHandler> +  + <requestHandler name="/update/extract" class="org.apache.solr.handler.extraction.ExtractingRequestHandler" startup="lazy"> + <lst name="defaults"> +  + <str name="fmap.content">text</str> + <str name="lowernames">true</str> + <str name="uprefix">ignored_</str> +  + <str name="captureAttr">true</str> + <str name="fmap.a">links</str> + <str name="fmap.div">ignored_</str> + </lst> + </requestHandler> +  + <searchComponent name="termsComponent" class="org.apache.solr.handler.component.TermsComponent"/> + <requestHandler name="/terms" class="org.apache.solr.handler.component.SearchHandler"> + <lst name="defaults"> + <bool name="terms">true</bool> + </lst> + <arr name="components"> + <str>termsComponent</str> + </arr> + </requestHandler> +  + <searchComponent name="elevator" class="solr.QueryElevationComponent"> +  + <str name="queryFieldType">string</str> + <str name="config-file">elevate.xml</str> + </searchComponent> +  + <requestHandler name="/elevate" class="solr.SearchHandler" startup="lazy"> + <lst name="defaults"> + <str name="echoParams">explicit</str> + </lst> + <arr name="last-components"> + <str>elevator</str> + </arr> + </requestHandler> +  + <requestHandler name="/update" class="solr.XmlUpdateRequestHandler"/> + <requestHandler name="/update/javabin" class="solr.BinaryUpdateRequestHandler"/> +  +  + <requestHandler name="/analysis/document" class="solr.DocumentAnalysisRequestHandler"/> +  + <requestHandler name="/analysis/field" class="solr.FieldAnalysisRequestHandler"/> +  + <requestHandler name="/update/csv" class="solr.CSVRequestHandler" startup="lazy"/> +  + <requestHandler name="/admin/" class="org.apache.solr.handler.admin.AdminHandlers"/> +  + <requestHandler name="/admin/ping" class="PingRequestHandler"> + <lst name="defaults"> + <str name="qt">standard</str> + <str name="q">solrpingquery</str> + <str name="echoParams">all</str> + </lst> + </requestHandler> +  + <requestHandler name="/debug/dump" class="solr.DumpRequestHandler"> + <lst name="defaults"> + <str name="echoParams">explicit</str> +  + <str name="echoHandler">true</str> + </lst> + </requestHandler> + <highlighting> +  +  + <fragmenter name="gap" class="org.apache.solr.highlight.GapFragmenter" default="true"> + <lst name="defaults"> + <int name="hl.fragsize">100</int> + </lst> + </fragmenter> +  + <fragmenter name="regex" class="org.apache.solr.highlight.RegexFragmenter"> + <lst name="defaults"> +  + <int name="hl.fragsize">70</int> +  + <float name="hl.regex.slop">0.5</float> +  + <str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str> + </lst> + </fragmenter> +  + <formatter name="html" class="org.apache.solr.highlight.HtmlFormatter" default="true"> + <lst name="defaults"> + <str name="hl.simple.pre"><![CDATA[<em>]]></str> + <str name="hl.simple.post"><![CDATA[</em>]]></str> + </lst> + </formatter> + </highlighting> +  +  +  +  + <queryResponseWriter name="xslt" class="org.apache.solr.request.XSLTResponseWriter"> + <int name="xsltCacheLifetimeSeconds">5</int> + </queryResponseWriter> +  +  +  + <admin> + <defaultQuery>solr</defaultQuery> +  + </admin> + <requestHandler class="solr.MoreLikeThisHandler" name="/mlt"> + <lst name="defaults"> + <str name="mlt.mintf">1</str> + <str name="mlt.mindf">2</str> + </lst> + </requestHandler> +</config> diff --git a/src/solr/conf/spellings.txt b/src/solr/conf/spellings.txt new file mode 100644 index 0000000..d7ede6f --- /dev/null +++ b/src/solr/conf/spellings.txt @@ -0,0 +1,2 @@ +pizza +history \ No newline at end of file diff --git a/src/solr/conf/stopwords.txt b/src/solr/conf/stopwords.txt new file mode 100644 index 0000000..0a23ec2 --- /dev/null +++ b/src/solr/conf/stopwords.txt @@ -0,0 +1,57 @@ +# Licensed to the Apache Software Foundation (ASF) under one or more +# contributor license agreements. See the NOTICE file distributed with +# this work for additional information regarding copyright ownership. +# The ASF licenses this file to You under the Apache License, Version 2.0 +# (the "License"); you may not use this file except in compliance with +# the License. You may obtain a copy of the License at +# +# http://www.apache.org/licenses/LICENSE-2.0 +# +# Unless required by applicable law or agreed to in writing, software +# distributed under the License is distributed on an "AS IS" BASIS, +# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. +# See the License for the specific language governing permissions and +# limitations under the License. + +#----------------------------------------------------------------------- +# a couple of test stopwords to test that the words are really being +# configured from this file: +stopworda +stopwordb + +#Standard english stop words taken from Lucene's StopAnalyzer +a +an +and +are +as +at +be +but +by +for +if +in +into +is +it +no +not +of +on +or +s +such +t +that +the +their +then +there +these +they +this +to +was +will +with diff --git a/src/solr/conf/synonyms.txt b/src/solr/conf/synonyms.txt new file mode 100644 index 0000000..fa4755d --- /dev/null +++ b/src/solr/conf/synonyms.txt @@ -0,0 +1,30 @@ +# The ASF licenses this file to You under the Apache License, Version 2.0 +# (the "License"); you may not use this file except in compliance with +# the License. You may obtain a copy of the License at +# +# http://www.apache.org/licenses/LICENSE-2.0 +# +# Unless required by applicable law or agreed to in writing, software +# distributed under the License is distributed on an "AS IS" BASIS, +# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. +# See the License for the specific language governing permissions and +# limitations under the License. + +#----------------------------------------------------------------------- +#some test synonym mappings unlikely to appear in real input text +aaa => aaaa +bbb => bbbb1 bbbb2 +ccc => cccc1,cccc2 +a\=>a => b\=>b +a\,a => b\,b +fooaaa,baraaa,bazaaa + +# Some synonym groups specific to this example +GB,gib,gigabyte,gigabytes +MB,mib,megabyte,megabytes +Television, Televisions, TV, TVs +#notice we use "gib" instead of "GiB" so any WordDelimiterFilter coming +#after us won't split it into two words. + +# Synonym mappings can be used for spelling correction too +pixima => pixma -- 1.7.3.4 _______________________________________________ deltacloud-devel mailing list deltacloud-devel(a)lists.fedorahosted.org https://fedorahosted.org/mailman/listinfo/deltacloud-devel

Reply

Jason Guiditta

Friday, 14 January Fri, 14 Jan

4:35 p.m.

New subject: [PATCH aeolus 1/3] Add Solr/Sunspot search support

On Thu, 2011-01-13 at 14:40 +0100, tsedovic(a)redhat.com wrote:

From: Tomas Sedovic <tsedovic(a)redhat.com> This gets us ready for adding the search. The Solr server is bundled with the sunspot gem so you don't have to install it by hand. On the dev machine, not in production of course. Run `rake sunspot:solr:start` to start the Solr server. When you make change to the solr/conf files, you must stop and start it again. Run `rake sunspot:reindex` to rebuild the index -- do this when you change the search setup in the models. ---

2 quick notes on issues I hit with this, in case anyone else has same problem: * If you don't have sunspot/solr installed, any rake task would fail, because we have solr stuff in our Rakefile. I pushed a trivial patch this afternoon to catch that error, so if you have this problem, please pull from next * I am not sure if this is something we should include in our script or not, but when I first tried to refresh my setup after pulling these changes down, I forgot to start the solr server, and when I ran 'rake dc:setup', it failed. Luckily, someone familiar with solr said the error I was getting sounded like something they had seen with solr before, so I was able to track it down quickly after that. However, if you dont realize this, you will get an unexpected Connect error when running that task. Like I said, not sure if this makes sense in a task or not, so I didnt change it, but might make things easier for developers, and certainly needs to be added to either the configure script or puppet setup (probably the latter). -j

Reply

Tomas Sedovic

Thursday, 13 January Thu, 13 Jan

7:40 a.m.

New subject: [PATCH aeolus 2/3] Implement search for Hardware Profiles and Pools

From: Tomas Sedovic <tsedovic(a)redhat.com> --- .../admin/hardware_profiles_controller.rb | 37 +++++++++++--------- src/app/controllers/resources/pools_controller.rb | 20 +++++++++-- src/app/models/hardware_profile.rb | 12 ++++++ src/app/models/pool.rb | 4 ++ src/app/views/admin/hardware_profiles/_list.haml | 2 - src/app/views/layouts/newui.haml | 3 ++ 6 files changed, 56 insertions(+), 22 deletions(-) diff --git a/src/app/controllers/admin/hardware_profiles_controller.rb b/src/app/controllers/admin/hardware_profiles_controller.rb index 67c655d..92edab0 100644 --- a/src/app/controllers/admin/hardware_profiles_controller.rb +++ b/src/app/controllers/admin/hardware_profiles_controller.rb @@ -1,11 +1,25 @@ class Admin::HardwareProfilesController < ApplicationController before_filter :require_user - before_filter :load_hardware_profiles, :only => [:index, :show] - before_filter :load_hardware_profile, :only => [:show] + before_filter :set_params_and_header, :only => [:index, :show] + before_filter :load_hardware_profiles, :only => [:show] + def index + @params = params + @search_term = params[:q] + if @search_term.blank? + load_hardware_profiles + return + end + + search = HardwareProfile.search do + keywords(params[:q]) + with(:frontend, true) + end + @hardware_profiles = search.results end def show + @hardware_profile = HardwareProfile.find((params[:id] || []).first) @tab_captions = ['Properties', 'History', 'Matching Provider Hardware Profiles'] @details_tab = params[:details_tab].blank? ? 'properties' : params[:details_tab] case @details_tab @@ -25,15 +39,6 @@ class Admin::HardwareProfilesController < ApplicationController end end - def new - end - - def create - end - - def delete - end - private def properties @properties_header = [ @@ -62,8 +67,7 @@ class Admin::HardwareProfilesController < ApplicationController :conditions => {:hardware_profile_map => { :aggregator_hardware_profile_id => params[:id] }}) end - def load_hardware_profiles - @hardware_profiles = HardwareProfile.all(:conditions => 'provider_id IS NULL') + def set_params_and_header @url_params = params @header = [ { :name => "Hardware Profile Name", :sort_attr => :name }, @@ -74,8 +78,7 @@ class Admin::HardwareProfilesController < ApplicationController ] end - def load_hardware_profile - @hardware_profile = HardwareProfile.find((params[:id] || []).first) + def load_hardware_profiles + @hardware_profiles = HardwareProfile.all(:conditions => 'provider_id IS NULL') end - -end \ No newline at end of file +end diff --git a/src/app/controllers/resources/pools_controller.rb b/src/app/controllers/resources/pools_controller.rb index 4e627be..ffd1f55 100644 --- a/src/app/controllers/resources/pools_controller.rb +++ b/src/app/controllers/resources/pools_controller.rb @@ -1,8 +1,19 @@ class Resources::PoolsController < ApplicationController before_filter :require_user - before_filter :load_pools, :only => [:index, :show] + before_filter :set_params_and_header, :only => [:index, :show] + before_filter :load_pools, :only => [:show] def index + @search_term = params[:q] + if @search_term.blank? + load_pools + return + end + + search = Pool.search() do + keywords(params[:q]) + end + @pools = search.results end def show @@ -68,17 +79,20 @@ class Resources::PoolsController < ApplicationController protected - def load_pools + def set_params_and_header + @url_params = params.clone @header = [ { :name => "Pool name", :sort_attr => :name }, { :name => "Quota (Instances)", :sort_attr => "quotas.total_instances"}, { :name => "% Quota used", :sortable => false }, { :name => "Pool Family", :sort_attr => "pool_families.name" } ] + end + + def load_pools @pools = Pool.paginate(:all, :include => [ :quota, :pool_family ], :page => params[:page] || 1, :order => (params[:order_field] || 'name') +' '+ (params[:order_dir] || 'asc') ) - @url_params = params.clone end end diff --git a/src/app/models/hardware_profile.rb b/src/app/models/hardware_profile.rb index d7ae995..5e6e9e8 100644 --- a/src/app/models/hardware_profile.rb +++ b/src/app/models/hardware_profile.rb @@ -19,7 +19,19 @@ # Filters added to this controller apply to all controllers in the application. # Likewise, all the methods added will be available for all controllers. +require 'sunspot_rails' class HardwareProfile < ActiveRecord::Base + searchable do + text :name, :as => :code_substring + text(:architecture) { architecture.try :value } + text(:memory) { memory.try :value } + text(:storage) { storage.try :value } + text(:cpu) { cpu.try :value } + boolean :frontend do + provider_id.nil? + end + end + has_many :instances named_scope :frontend, :conditions => { :provider_id => nil } has_many :provider_instances, :class_name => "Instance", diff --git a/src/app/models/pool.rb b/src/app/models/pool.rb index d35f578..550ca79 100644 --- a/src/app/models/pool.rb +++ b/src/app/models/pool.rb @@ -19,8 +19,12 @@ # Filters added to this controller apply to all controllers in the application. # Likewise, all the methods added will be available for all controllers. +require 'sunspot_rails' class Pool < ActiveRecord::Base include PermissionedObject + searchable do + text :name, :as => :code_substring + end has_many :instances, :dependent => :destroy belongs_to :quota belongs_to :pool_family diff --git a/src/app/views/admin/hardware_profiles/_list.haml b/src/app/views/admin/hardware_profiles/_list.haml index 7399549..1001db3 100644 --- a/src/app/views/admin/hardware_profiles/_list.haml +++ b/src/app/views/admin/hardware_profiles/_list.haml @@ -1,7 +1,5 @@ - form_tag do #object-actions - = restful_submit_tag "Create", "create", admin_hardware_profiles_path, "PUT" - = restful_submit_tag "Delete", "delete", admin_hardware_profiles_path, "DELETE" #selections %p diff --git a/src/app/views/layouts/newui.haml b/src/app/views/layouts/newui.haml index 1ac1073..5be5886 100644 --- a/src/app/views/layouts/newui.haml +++ b/src/app/views/layouts/newui.haml @@ -42,6 +42,9 @@ Saved searches - details = !(yield :details).blank? #list-view{ :class => details ? 'part' : 'full'} + - form_tag({:action => 'index'}, :method => :get) do + = text_field_tag :q, @search_term + = submit_tag "Search" = render :partial => '/layouts/notification' = (yield :list or yield) #details-view.ui-tabs.ui-widget.ui-widget-content.ui-corner-all{ :class => ('hidden' unless details)} -- 1.7.3.4

Reply

Tomas Sedovic

7:40 a.m.

New subject: [PATCH aeolus 3/3] Add cucumber tests for Hardware Profile search

From: Tomas Sedovic <tsedovic(a)redhat.com> NOTE about running Cucumber tests with Solr: The tests require that the Solr server be running. This is analogous to having the Deltacloud API server up. You start it thusly: $ rake sunspot:solr:start RAILS_ENV=cucumber And then run the tests as usual: $ rake cucumber --- src/features/hardware_profile.feature | 30 +++++++++++++++++++++++++++++- 1 files changed, 29 insertions(+), 1 deletions(-) diff --git a/src/features/hardware_profile.feature b/src/features/hardware_profile.feature index 6f1cc81..5f63c96 100644 --- a/src/features/hardware_profile.feature +++ b/src/features/hardware_profile.feature @@ -48,4 +48,32 @@ Feature: Manage Pools And I follow "Matching Provider Hardware Profiles" Then I should see the following: | Name | Memory | CPU | Storage | Architecture | - | m1-small | 1740 | 2 | 160 | i386 | \ No newline at end of file + | m1-small | 1740 | 2 | 160 | i386 | + + Scenario: Search for hardware profiles + Given there are the following aggregator hardware profiles: + | name | memory | cpu |storage | architecture | + | m1-small | 1740 | 2 | 160 | i386 | + | m1-large | 4096 | 4 | 850 | x86_64 | + | m1-xlarge | 8192 | 8 | 1690 | x86_64 | + And I am on the the hardware profiles page + When I fill in "q" with "large" + And I press "Search" + Then I should see "m1-large" + And I should see "m1-xlarge" + And I should not see "m1-small" + When I fill in "q" with "small" + And I press "Search" + Then I should see "m1-small" + And I should not see "m1-large" + And I should not see "m1-xlarge" + When I fill in "q" with "" + And I press "Search" + Then I should see "m1-small" + And I should see "m1-large" + And I should see "m1-xlarge" + When I fill in "q" with "i386" + And I press "Search" + Then I should see "m1-small" + And I should not see "m1-large" + And I should not see "m1-xlarge" -- 1.7.3.4

Reply

Jason Guiditta

Friday, 14 January Fri, 14 Jan

4:29 p.m.

New subject: [PATCH aeolus 3/3] Add cucumber tests for Hardware Profile search

On Thu, 2011-01-13 at 14:40 +0100, tsedovic(a)redhat.com wrote:

From: Tomas Sedovic <tsedovic(a)redhat.com> NOTE about running Cucumber tests with Solr: The tests require that the Solr server be running. This is analogous to having the Deltacloud API server up. You start it thusly: $ rake sunspot:solr:start RAILS_ENV=cucumber And then run the tests as usual: $ rake cucumber ---

Just so we don't forget to look at it (I'll try to on Monday if I have time): These tests run fine on sqlite, but with postgres fail with the following: Couldn't find HardwareProfile with ID=1 (ActiveRecord::RecordNotFound) ./app/controllers/admin/hardware_profiles_controller.rb:22:in `show' /usr/lib/ruby/1.8/benchmark.rb:308:in `realtime' ./features/step_definitions/web_steps.rb:38:in `/^(?:|I )follow "([^"]*)"$/' features/hardware_profile.feature:31:in `When I follow "m1-small"' Couldn't find HardwareProfile with ID=1 (ActiveRecord::RecordNotFound) ./app/controllers/admin/hardware_profiles_controller.rb:22:in `show' /usr/lib/ruby/1.8/benchmark.rb:308:in `realtime' ./features/step_definitions/web_steps.rb:38:in `/^(?:|I )follow "([^"]*)"$/' features/hardware_profile.feature:47:in `When I follow "m1-small"' Failing Scenarios: cucumber features/hardware_profile.feature:24 # Scenario: View a Hardware Profiles Properties cucumber features/hardware_profile.feature:39 # Scenario: View a Front End Hardware Profiles Matching Provider Hardware Profiles -j

Reply

4887

days inactive

4888

days old

deltacloud-devel@lists.fedorahosted.org

Manage subscription

6 comments

3 participants

tags (0)

participants (3)

Jason Guiditta
lmartinc＠redhat.com
Tomas Sedovic