Elasticsearch教程(二),IK分词器安装

soゝso 2016-08-23 00:15:00 87695

Elasticsearch  目录

怕麻烦就看上面的(极速版),是我已经打包好的 IK分词器  需要的东西。

首先说说分词器,分词,英语分词很好分,就是按固定的英文的空格,或者“-”。中文分词就稍微有点复杂了,而 Elasticsearch  默认是带分词器了,我们来测试一下。

http://123.88.88.88:9200/_analyze?analyzer=standard&pretty=true&text=sojson在线工具

得出的结果如下:

{
  "tokens" : [ {
    "token" : "sojson",
    "start_offset" : 0,
    "end_offset" : 6,
    "type" : "",
    "position" : 0
  }, {
    "token" : "在",
    "start_offset" : 6,
    "end_offset" : 7,
    "type" : "",
    "position" : 1
  }, {
    "token" : "线",
    "start_offset" : 7,
    "end_offset" : 8,
    "type" : "",
    "position" : 2
  }, {
    "token" : "工",
    "start_offset" : 8,
    "end_offset" : 9,
    "type" : "",
    "position" : 3
  }, {
    "token" : "具",
    "start_offset" : 9,
    "end_offset" : 10,
    "type" : "",
    "position" : 4
  } ]
}

发现中文是一个字一个字的分对吧。我们要的需求应该是,sojson、在线、工具吧。

elasticsearch-analysis-ik  是一款中文的分词插件,支持自定义词库,也有默认的词库。


开始安装。

1、下载

下载地址为: https://github.com/medcl/elasticsearch-analysis-ik

或者从官网地址搜索:https://www.elastic.co 搜索IK即可。

本博客下面也提供了elasticsearch-analysis-ik.zip的下载链接。

2、解压。

把下载的 elasticsearch-analysis-ik.zip解压。

3、 Maven  打包

进入elasticsearch-analysis-ik-master/ 下,打包。注意:打包后的文件在elasticsearch-analysis-ik-master/target/目录下

mvn clean package

4.然后在elasticsearch-2.2.0/plugins下创建目录 ik

cd elasticsearch-2.2.0/plugins
mkdir ik
cd ik

然后将打包后的elasticsearch-analysis-ik-1.8.0.jar 放入当前目录下,然后解压。

5、设置(2.0以上可以不设置,我没有设置)。

Elasticsearch  config下的elasticsearch.yml文件中,添加如下代码。

index:  
      analysis:                     
        analyzer:        
          ik:  
              alias: [ik_analyzer]  
              type: org.elasticsearch.index.analysis.IkAnalyzerProvider  
          ik_max_word:  
              type: ik  
              use_smart: false  
          ik_smart:  
              type: ik  
              use_smart: true

或者简单配置:

index.analysis.analyzer.ik.type : “ik”

6、启动测试。

http://123.88.88.88:9200/_analyze?analyzer=ik&pretty=true&text=sojson在线工具

结果为:

{
  "tokens" : [ {
    "token" : "sojson",
    "start_offset" : 0,
    "end_offset" : 6,
    "type" : "ENGLISH",
    "position" : 0
  }, {
    "token" : "在线",
    "start_offset" : 6,
    "end_offset" : 8,
    "type" : "CN_WORD",
    "position" : 1
  }, {
    "token" : "工具",
    "start_offset" : 8,
    "end_offset" : 10,
    "type" : "CN_WORD",
    "position" : 2
  } ]
}

over了,当然我以前用的版本是0.9现在是2.0,跨度太大了,所以写这个Blog话费时间较多,中间可能有一点考虑不到的因素,如果你有疑问,可以联系我,或者加群找我,我有时间的情况下,可以和你探讨。


版权所属:SO JSON在线解析

原文地址:https://www.sojson.com/blog/82.html

转载时必须以链接形式注明原始出处及本声明。


附件下载:

备注:点击文件名下载,附件源来自云端,只能在本站下载。复制下载链接无效。


如果本文对你有帮助,那么请你赞助我,让我更有激情的写下去,帮助更多的人。

相关文章
Elasticsearch教程(三),IK分词器安装 (极速版)
Elasticsearch教程Elasticsearch Java API创建Mapping,指定分词器
Elasticsearch教程Elasticsearch 设置近义搜索,IK分词器实现同义搜索
Elasticsearch 分词Elasticsearch Java API 分词 操作
Elasticsearch教程(四) elasticsearch head 插件安装和使用
Elasticsearch教程(六) elasticsearch Client创建
Elasticsearch教程(五) elasticsearch Mapping的创建
Elasticsearch教程Elasticsearch count 查询,Elasticsearch 查询是否存在
Elasticsearch教程Elasticsearch配置文件 — elasticsearch.yml
Elasticsearch 教程Elasticsearch 日期查询详解,Elasticsearch Date 查询Java API
最新文章
iOS版淘宝打开提示“您使用的程序是内测版本,将于2020-03-28到期,到期将无法使用,请尽快下载最新版本” 879
关于一位“caoz的梦呓”的大佬在微信公众号喷我的整体回复 58165
DNS TXT记录添加方法,ICP备案信息屏蔽查询处理方案讲解 2857
SEO优化的最佳时间段即将来临,春节最佳SEO优化讲解 2304
SEO实战分析-排名最近突然掉光了问题排查,几个大站关键词下降SEO问题分析 2307
Java模拟WSS websocket ssl请求,Java WSS模拟请求代码示例 4982
Springboot 集成 Ehcache 代码讲解 5740
阿里云 RDS Specified key was too long; max key length is 767 bytes 解决方案 2196
Springboot HTTP Get/Post 请求讲解,Springboot几行代码完成Http请求 6096
天气免费API接口,天气API接口请求讲解及源码下载 28862
最热文章
我为什么要选择RabbitMQ ,RabbitMQ简介,各种MQ选型对比 370239
苹果电脑Mac怎么恢复出厂系统?苹果系统怎么重装系统? 343732
免费天气API,全国天气 JSON API接口,可以获取五天的天气预报 308150
免费天气API,天气JSON API,不限次数获取十五天的天气预报 215877
最新MyEclipse8.5注册码,有效期到2020年 (已经更新) 207649
Elasticsearch教程(四) elasticsearch head 插件安装和使用 181621
Jackson 时间格式化,时间注解 @JsonFormat 用法、时差问题说明 113981
Elasticsearch教程(一),全程直播(小白级别) 101493
谈谈斐讯路由器劫持,你用斐讯路由器,你需要知道的事情 101121
Elasticsearch教程(六) elasticsearch Client创建 90306

骚码加入我们 / 千人QQ群:259217951

入群需要5元为的是没有垃圾广告,如果没有QQ钱包,可以加群主拉进。

二维码生成 来自 >> 二维码生成器

支付扫码

所有赞助/开支都讲公开明细,用于网站维护:赞助名单查看

查看我的收藏

正在加载... ...