Solr4.5.1+tomcat8.0安装配置

2019-03-27 01:18|来源: 网路

  1. 下载tomcat和solr:wget http://mirror.esocc.com/apache/tomcat/tomcat-8/v8.0.0-RC5/bin/apache-tomcat-8.0.0-RC5.tar.gz -O tomcat.tgz; wget http://mirror.bit.edu.cn/apache/lucene/solr/4.5.1/solr-4.5.1.tgz -O solr.tgz
  2. 解压缩tomcat和solr:tar xzvf tomcat.tgz; tar xzvf solr.tgz
  3. 拷贝solr到tomcat的webapps目录: cp solr/example/webapps/solr.war tomcat/webapps
  4. 启动tomcat,解压缩solr.wartomcat/bin/startup.sh
  5. solr/example/multicore拷贝到tomcat/webapps/conf目录下
  6. 在tomcat/webapps/solr/WEB-INF/下新建一个classes目录,将example/resources下的文件复制到该classes目录中
  7. 将solr/example/lib/ext/下的所有jar包复制到tomcat/webapps/solr/WEB-INF的lib目录中
  8. 修改web.xml文件,为: 
    <env-entry>
    <env-entry-name>solr/home</env-entry-name>
    <env-entry-value>${TOMCAT_HOME}/webapps/conf/multicore</env-entry-value>
    <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
  9. 配置分词,使用的是mmseg4j和搜狗词库:wget http://mmseg4j.googlecode.com/files/mmseg4j-1.9.1.zip -O mmseg4j; cp mmseg4j/dist/*.jar tomcat/webapps/solr/WEB-INF/lib
  10. 配置core0下面的schema.xml的types节点:
    <fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
    		<analyzer>
    			<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"></tokenizer>
    		</analyzer>
    	</fieldtype>
    
    	<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
    		<analyzer>
    			<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"></tokenizer>
    		</analyzer>
    	</fieldtype>
    
    	<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
    		<analyzer>
    			<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"></tokenizer>
    		</analyzer>
    	</fieldtype>

  11. 在 tomcat\webapps\conf\multicore\core0\conf\schema.xml  文件的  fields 节点里 添加如下节点 :
    <field name="simple" type="textSimple" indexed="true" stored="true" multiValued="true" />
      <field name="complex" type="textComplex" indexed="true" stored="true" multiValued="true" />
      <field name="max" type="textMaxWord" indexed="true" stored="true" multiValued="true" />

  12.  因为 solr4.5 里有两个 core , 所以针对 core1 重复 10,11 两步
  13. 对分词进行测试 , 访问  http://localhost:8080/solr/#/core0/analysis
  14. Field[Name]   输入:  complex
  15. Field Value(index)   输入:   中国银行第一分行  ,   Field Value(index)  下面的 verbose outpu 点选
  16. 点击Analyze  按钮 ,  查看分词结果    :  中国银行 |  第一 |  分行
  17. 此时 Solr3.5 已经可以进行 分词 , 接下来配置 solr 3.5 连接  mysql 数据库 , 生成索引 , 进行分词
  18. 每个core中都有两个文件,conf和data
    conf:主要用于存放core的配置文件,
    (1)、schema.xml用于定义索引库的字段及分词器等,这个配置文件是核心文件
    (2)、solrconfig.xml定义了这个core的配置信息,比如:

    <autoCommit> <maxTime>15000</maxTime> <openSearcher>false</openSearcher> </autoCommit>

    定义了什么时候自动提交,提交后是否开启一个新的searcher等等。
    data:主要用于存放core的数据,即index-索引文件和log-日志记录。


  19. 下载 java 的 mysql 驱动 , 本机解压 mysql-connector-java-5.1.18-bin.jar,  然后拷贝到 tomcat\webapps\solr\WEB-INF\lib  目录下
  20. 在 \Tomcat 6.0\webapps\solr  目录下 新建  db  文件夹
  21. 在 \Tomcat 6.0\webapps\solr\db 文件夹下面新建一个  db-data-config.xml 文件 , 内容如下 :

<dataConfig>
    <dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/test" user="root" password="123" />
    <document name="messages">
        <entity name="message" transformer="ClobTransformer" query="select * from test1">
            <field column="ID" name="id" />
            <field column="Val" name="text" />
        </entity>
    </document>
</dataConfig>

 url="jdbc:mysql://localhost:3306/test" user="root" password="123"  这里配置了 mysql 的连接路径 , 用户名 , 密码

 <field column="ID" name="id" /><field column="Val" name="text" />  这里配置的是 数据库里要索引的字段 , 注意name 是 11 步配置的

14.4   在 Tomcat 6.0\webapps\solr\conf\multicore\core0\conf 目录下的 solrconfig.xml 文件里 , 添加如下代码 :

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
      <str name="config">E:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/solr/db/db-data-config.xml</str> 
    </lst>
  </requestHandler>

“E:/Program Files/Apache Software Foundation/Tomcat 6.0/webapps/solr/db/db-data-config.xml” 是 14.3 配置文件的绝对路径

14.5  在Tomcat 6.0\webapps\solr\conf\multicore\core1\conf\solrconfig.xml   路径里重复 14.4

14.6  把本地下载解压的 solr3.5 文件里 , dist 目录下的  apache-solr-dataimporthandler-3.5.0.jar 和 apache-solr-dataimporthandler-extras-3.5.0.jar  Tomcat 6.0\webapps\solr\WEB-INF\lib  目录下

14.7   solr3.5 连接 mysql 已经配置完成 , 测试读取 mysql 生成 索引 , 访问 :   http://localhost:8180/solr/core0/dataimport?command=full-import 

14.8   测试分词查询 , 访问  http://localhost:8180/solr/core0/admin/  查询数据库里索引列里有的词

注意 , 这仅仅是配置 solr3.5 连接 mysql 生成索引 , 可以执行正常 词语  的查询 , 但是不能执行  对搜索短语的分词 查询

multicore  目录下面多个 core 文件夹 , 每一个都是一个接口 , 有独立的配置文件 , 处理某一类数据 。

multicore/core0/conf/  目录下的  schema.xml  文件 相当于数据表配置文件 , 它定义了加入索引的数据的数据类型 。文件里有一个 <uniqueKey>id</uniqueKey> 的配置 , 这里将 id 字段作为索引文档的唯一标示符 , 非常重要 。

 

FieldType 类型 , name 是这个 FieldType 的名称 , class 指向了 org.apache.solr.analysis 包里面对应的 class 名称 , 用来定义这个类型的定义 。在 FieldType 定义的时候最重要的就是定义这个类型的数据在建立索引和进行查询的时候要使用的分析器analyzer,包括分词和过滤 。

Fields 字段 :  结点内定义具体的字段(类似数据库中的字段) , 就是 field , 包含 name , type(为之前定义过的各种FieldType) , indexed(是否被索引) , stored(是否被存储) , multiValued(是否有多个值)

copeField(赋值字段): 建立一个拷贝字段 , 将所有的全文字段复制到一个字段中 , 以便进行统一的检索 。


转自:http://blog.csdn.net/iloveyin/article/details/7417860

相关问答

更多
  • 一、安装和系统环境变量设置 1、我使用的PHP为php-5.4.31,不用5.5以上版本的原因是,因为他们都是使用VC11编译的,需要一个DLL,win7及一下都不支持。下载VC9编译的PHP 5.4(5.4.31) for X86的已编译版本。我的安装目录是D:\Application\php-5.4.31, 将安装后的路径设置到系统环境变量path中。 2、perl直接下载安装即可(会自动配置环境变量,不用操心)。 3、Tomcat用的是7.0.41版本。很多文档要求将server/lib下servle ...
  • 首先安装jdk,安装好jdk以后再到“我的电脑”--》属性--》高级...,配置jdk。再安装tomcat8,自动寻找配置,然后在eclipse——>windows,搜索tomcat,把对应安装的tomcat地址找到,应用就可以了。
  • 安装Tomcat后总得先试一下: http://127.0.0.1:8080 如果这个不行的话,那说明你的Tomcat没有安装成功
  • 根据你的需要, MyEclipse集成的tomcat已经配置好可以直接使用 为了方便开发使用, 但是只能在MyEclipse中启动停止,发布不方便 启动内置的tomcat, 可以,绿色按钮就表示已经启动 红色按钮是终止
  • 安装配置tomcat 8过程如下, 1、首先是Tomcat的获取和安装。 获取当然得上Apache的官方网站下载,开源免费,而且带宽也足够。下载会很快。这是两种不同的下载,一个是普通安装版本,一个是解压安装版本。使用起来是一样的,只是在普通安装版本中有一些界面可提供对Tomcat的快捷设置,而且普通安装会将Tomcat作为系统服务进行注册。 2、Tomcat的运行环境搭建。 Tomcat的启动是一个bat文件(Windows下),在bin目录下。双击即可。 如果启动不成功,一般的情况是控制台出来一下立即消失 ...
  • 一、安装JDK和Tomcat 1,安装JDK:直接运行jdk-7-windows-i586.exe可执行程序,默认安装即可。 备注:路径可以其他盘符,不建议路径包含中文名及特殊符号。 2、安装Tomcat:直接解压缩下载文件“apache-tomcat-7.0.33-windows-x86.zip”到C盘下。安装路径建议修改为:c:\tomcat。 备注:如下载的是可执行文件,双击运行,默认安装即可。 二、配置JDK环境变量(在步骤查看如何配置环境变量) 1,新建变量名:JAVA_HOME,变量值:C:\P ...
  • 你是Linux系统还是window window直接用包就是了 不用环境配置 ,linux就需要环境配置 请问你是用什么开发工具
  • 进入apache官网下载tomcat 8.在左手边的菜单区,选择download下的tomcat8 版本。根据你操作系统选择不同的下载文件,建议下载.zip格式的软件包,这样免于安装直接用。如下图:   2   将安装文件下载到本地硬盘,如图:   下载完成后进入到文件目录,解压缩刚刚下载的软件包。   打开软件,可以看到软件包的目录,   bin -- 文件夹主要是存放Tomcat服务启动相关的执行档及相关设定。 conf -- 文件夹主要是存放Tomcat服务器相关的设定。 webapps -- 文件夹 ...
  • 首先安装jdk,安装好jdk以后再到“我的电脑”--》属性--》高级...,配置jdk。再安装tomcat8,自动寻找配置,然后在eclipse——>windows,搜索tomcat,把对应安装的tomcat地址找到,应用就可以了。
  • 1 进入apache官网下载tomcat 8.在左手边的菜单区,选择download下的tomcat8 版本。根据你操作系统选择不同的下载文件,建议下载.zip格式的软件包,这样免于安装直接用。 2 将安装文件下载到本地硬盘 3 下载完成后进入到文件目录,解压缩刚刚下载的软件包。 4 打开软件,可以看到软件包的目录, bin -- 文件夹主要是存放Tomcat服务启动相关的执行档及相关设定。 conf -- 文件夹主要是存放Tomcat服务器相关的设定。 webapps -- 文件夹主要是存放Tomcat管 ...