Elasticsearch教程(二),IK分词器安装

soゝso 2016-08-23 00:15:00 96578

Elasticsearch  目录

怕麻烦就看上面的(极速版),是我已经打包好的 IK分词器  需要的东西。

首先说说分词器,分词,英语分词很好分,就是按固定的英文的空格,或者“-”。中文分词就稍微有点复杂了,而 Elasticsearch  默认是带分词器了,我们来测试一下。

http://123.88.88.88:9200/_analyze?analyzer=standard&pretty=true&text=sojson在线工具

得出的结果如下:

{
  "tokens" : [ {
    "token" : "sojson",
    "start_offset" : 0,
    "end_offset" : 6,
    "type" : "",
    "position" : 0
  }, {
    "token" : "在",
    "start_offset" : 6,
    "end_offset" : 7,
    "type" : "",
    "position" : 1
  }, {
    "token" : "线",
    "start_offset" : 7,
    "end_offset" : 8,
    "type" : "",
    "position" : 2
  }, {
    "token" : "工",
    "start_offset" : 8,
    "end_offset" : 9,
    "type" : "",
    "position" : 3
  }, {
    "token" : "具",
    "start_offset" : 9,
    "end_offset" : 10,
    "type" : "",
    "position" : 4
  } ]
}

发现中文是一个字一个字的分对吧。我们要的需求应该是,sojson、在线、工具吧。

elasticsearch-analysis-ik  是一款中文的分词插件,支持自定义词库,也有默认的词库。


开始安装。

1、下载

下载地址为: https://github.com/medcl/elasticsearch-analysis-ik

或者从官网地址搜索:https://www.elastic.co 搜索IK即可。

本博客下面也提供了elasticsearch-analysis-ik.zip的下载链接。

2、解压。

把下载的 elasticsearch-analysis-ik.zip解压。

3、 Maven  打包

进入elasticsearch-analysis-ik-master/ 下,打包。注意:打包后的文件在elasticsearch-analysis-ik-master/target/目录下

mvn clean package

4.然后在elasticsearch-2.2.0/plugins下创建目录 ik

cd elasticsearch-2.2.0/plugins
mkdir ik
cd ik

然后将打包后的elasticsearch-analysis-ik-1.8.0.jar 放入当前目录下,然后解压。

5、设置(2.0以上可以不设置,我没有设置)。

Elasticsearch  config下的elasticsearch.yml文件中,添加如下代码。

index:  
      analysis:                     
        analyzer:        
          ik:  
              alias: [ik_analyzer]  
              type: org.elasticsearch.index.analysis.IkAnalyzerProvider  
          ik_max_word:  
              type: ik  
              use_smart: false  
          ik_smart:  
              type: ik  
              use_smart: true

或者简单配置:

index.analysis.analyzer.ik.type : “ik”

6、启动测试。

http://123.88.88.88:9200/_analyze?analyzer=ik&pretty=true&text=sojson在线工具

结果为:

{
  "tokens" : [ {
    "token" : "sojson",
    "start_offset" : 0,
    "end_offset" : 6,
    "type" : "ENGLISH",
    "position" : 0
  }, {
    "token" : "在线",
    "start_offset" : 6,
    "end_offset" : 8,
    "type" : "CN_WORD",
    "position" : 1
  }, {
    "token" : "工具",
    "start_offset" : 8,
    "end_offset" : 10,
    "type" : "CN_WORD",
    "position" : 2
  } ]
}

over了,当然我以前用的版本是0.9现在是2.0,跨度太大了,所以写这个Blog话费时间较多,中间可能有一点考虑不到的因素,如果你有疑问,可以联系我,或者加群找我,我有时间的情况下,可以和你探讨。


版权所属:SO JSON在线解析

原文地址:https://www.sojson.com/blog/82.html

转载时必须以链接形式注明原始出处及本声明。


附件下载:

备注:点击文件名下载,附件源来自云端,只能在本站下载。复制下载链接无效。


如果本文对你有帮助,那么请你赞助我,让我更有激情的写下去,帮助更多的人。

关于作者
一个低调而闷骚的男人。
相关文章
Elasticsearch教程(三),IK分词器安装 (极速版)
Elasticsearch教程Elasticsearch Java API创建Mapping,指定分词器
Elasticsearch教程Elasticsearch 设置近义搜索,IK分词器实现同义搜索
Elasticsearch 分词Elasticsearch Java API 分词 操作
Elasticsearch教程(四) elasticsearch head 插件安装和使用
Elasticsearch教程(六) elasticsearch Client创建
Elasticsearch教程(五) elasticsearch Mapping的创建
Elasticsearch教程Elasticsearch count 查询,Elasticsearch 查询是否存在
Elasticsearch教程Elasticsearch配置文件 — elasticsearch.yml
Elasticsearch 教程Elasticsearch 日期查询详解,Elasticsearch Date 查询Java API
最新文章
当我谈 HTTP 时,我谈些什么? 773
新浪短链(t.cn)最新申请官方API的方法讲解。 4320
QUIC / HTTP3 协议详细分析讲解 1471
恭喜那个做云存储的七牛云完成 F 轮 10 亿人民币的融资,开启新的云旅程 2249
Autojs怎么安全加密?Autojs在线加密工具注意事项。 3619
Java JSON 组件选型之 FastJson 为什么总有漏洞? 11373
使用七牛云存储实现图片API,自动删除图片方案合集 2930
神速ICP备案经验分享,ICP备案居然一天就通过了 4177
百度加强推送URL链接,百度SEO强行推送链接JavaScript代码案例讲解。 4269
SOJSON 拓展服务器被DDos攻击了一晚上,是如何解决的? 5339
最热文章
苹果电脑Mac怎么恢复出厂系统?苹果系统怎么重装系统? 475385
我为什么要选择RabbitMQ ,RabbitMQ简介,各种MQ选型对比 436809
免费天气API,全国天气 JSON API接口,可以获取五天的天气预报 372256
最新MyEclipse8.5注册码,有效期到2020年 (已经更新) 368209
免费天气API,天气JSON API,不限次数获取十五天的天气预报 333088
Elasticsearch教程(四) elasticsearch head 插件安装和使用 244489
Jackson 时间格式化,时间注解 @JsonFormat 用法、时差问题说明 212239
谈谈斐讯路由器劫持,你用斐讯路由器,你需要知道的事情 150465
Elasticsearch教程(一),全程直播(小白级别) 129429
Java 信任所有SSL证书,HTTPS请求抛错,忽略证书请求完美解决 111342
支付扫码

所有赞助/开支都讲公开明细,用于网站维护:赞助名单查看

查看我的收藏

正在加载... ...