Elasticsearch教程(二),IK分词器安装

JSON 2016-08-23 00:15:00 114402

Elasticsearch  目录

怕麻烦就看上面的(极速版),是我已经打包好的 IK分词器  需要的东西。

首先说说分词器,分词,英语分词很好分,就是按固定的英文的空格,或者“-”。中文分词就稍微有点复杂了,而 Elasticsearch  默认是带分词器了,我们来测试一下。

http://123.88.88.88:9200/_analyze?analyzer=standard&pretty=true&text=sojson在线工具

得出的结果如下:

{
  "tokens" : [ {
    "token" : "sojson",
    "start_offset" : 0,
    "end_offset" : 6,
    "type" : "",
    "position" : 0
  }, {
    "token" : "在",
    "start_offset" : 6,
    "end_offset" : 7,
    "type" : "",
    "position" : 1
  }, {
    "token" : "线",
    "start_offset" : 7,
    "end_offset" : 8,
    "type" : "",
    "position" : 2
  }, {
    "token" : "工",
    "start_offset" : 8,
    "end_offset" : 9,
    "type" : "",
    "position" : 3
  }, {
    "token" : "具",
    "start_offset" : 9,
    "end_offset" : 10,
    "type" : "",
    "position" : 4
  } ]
}

发现中文是一个字一个字的分对吧。我们要的需求应该是,sojson、在线、工具吧。

elasticsearch-analysis-ik  是一款中文的分词插件,支持自定义词库,也有默认的词库。


开始安装。

1、下载

下载地址为: https://github.com/medcl/elasticsearch-analysis-ik

或者从官网地址搜索:https://www.elastic.co 搜索IK即可。

本博客下面也提供了elasticsearch-analysis-ik.zip的下载链接。

2、解压。

把下载的 elasticsearch-analysis-ik.zip解压。

3、 Maven  打包

进入elasticsearch-analysis-ik-master/ 下,打包。注意:打包后的文件在elasticsearch-analysis-ik-master/target/目录下

mvn clean package

4.然后在elasticsearch-2.2.0/plugins下创建目录 ik

cd elasticsearch-2.2.0/plugins
mkdir ik
cd ik

然后将打包后的elasticsearch-analysis-ik-1.8.0.jar 放入当前目录下,然后解压。

5、设置(2.0以上可以不设置,我没有设置)。

Elasticsearch  config下的elasticsearch.yml文件中,添加如下代码。

index:  
      analysis:                     
        analyzer:        
          ik:  
              alias: [ik_analyzer]  
              type: org.elasticsearch.index.analysis.IkAnalyzerProvider  
          ik_max_word:  
              type: ik  
              use_smart: false  
          ik_smart:  
              type: ik  
              use_smart: true

或者简单配置:

index.analysis.analyzer.ik.type : “ik”

6、启动测试。

http://123.88.88.88:9200/_analyze?analyzer=ik&pretty=true&text=sojson在线工具

结果为:

{
  "tokens" : [ {
    "token" : "sojson",
    "start_offset" : 0,
    "end_offset" : 6,
    "type" : "ENGLISH",
    "position" : 0
  }, {
    "token" : "在线",
    "start_offset" : 6,
    "end_offset" : 8,
    "type" : "CN_WORD",
    "position" : 1
  }, {
    "token" : "工具",
    "start_offset" : 8,
    "end_offset" : 10,
    "type" : "CN_WORD",
    "position" : 2
  } ]
}

over了,当然我以前用的版本是0.9现在是2.0,跨度太大了,所以写这个Blog话费时间较多,中间可能有一点考虑不到的因素,如果你有疑问,可以联系我,或者加群找我,我有时间的情况下,可以和你探讨。


版权所属:SO JSON在线解析

原文地址:https://www.sojson.com/blog/82.html

转载时必须以链接形式注明原始出处及本声明。


附件下载:

备注:点击文件名下载,附件源来自云端,只能在本站下载。复制下载链接无效。


如果本文对你有帮助,那么请你赞助我,让我更有激情的写下去,帮助更多的人。

关于作者
一个低调而闷骚的男人。
最新文章
Flink 在又拍云日志批处理中的实践 2865
个推异常值检测和实战应用-又拍云 369
TCP 和 UDP协议详细讲解,优缺点分析讲解 5455
URL中乱七八糟的字符讲解,来源以及如何解决 3452
HTTP/3 来了,您真的了解它么? 4732
技术选型:为什么批处理我们却选择了Flink 1623
这些表情包你有吗?一起来 Battle 啊 2060
当我谈 HTTP 时,我谈些什么? 10658
新浪短链(t.cn)最新申请官方API的方法讲解。 63896
QUIC / HTTP3 协议详细分析讲解 8004
最热文章
苹果电脑Mac怎么恢复出厂系统?苹果系统怎么重装系统? 635244
最新MyEclipse8.5注册码,有效期到2020年 (已经更新) 586248
我为什么要选择RabbitMQ ,RabbitMQ简介,各种MQ选型对比 488563
免费天气API,全国天气 JSON API接口,可以获取五天的天气预报 467204
Jackson 时间格式化,时间注解 @JsonFormat 用法、时差问题说明 433749
Elasticsearch教程(四) elasticsearch head 插件安装和使用 386029
Java 信任所有SSL证书,HTTPS请求抛错,忽略证书请求完美解决 202203
谈谈斐讯路由器劫持,你用斐讯路由器,你需要知道的事情 194919
免费天气API,天气JSON API,不限次数获取十五天的天气预报 189232
Elasticsearch教程(一),全程直播(小白级别) 175671
支付扫码

所有赞助/开支都讲公开明细,用于网站维护:赞助名单查看

查看我的收藏

正在加载... ...