当前位置: 首页 > news >正文

国家机构网站建设中国有几个搜索引擎

国家机构网站建设,中国有几个搜索引擎,电子商务系统包括,销售网站建设公司疑问 ES为什么这么快? 全文检索 听过一个程序扫描文本的每一个单词,针对单词建立索引,并保存该单词在文本中的位置,以及出现的次数。在检索查询时候,通过建立好的索引进行查询,将索引中单词对应的文本位…

疑问

  • ES为什么这么快?

全文检索

  1. 听过一个程序扫描文本的每一个单词,针对单词建立索引,并保存该单词在文本中的位置,以及出现的次数。
  2. 在检索查询时候,通过建立好的索引进行查询,将索引中单词对应的文本位置,出现的此处返回给用户,有了具体文本的位置,就可以将具体内容读取出来。

分词原理、倒排索引

  • 例如我要存储三个数据:“hello speeder”、“hello world”、“Im speeder”,那么存储的过程会经历什么?
    1. 分词和去重,将上述三个数据分成四个单词:hello speeder world Im
    2. 建立倒排索引:
IDwordindex
1hello1,2
2speeder1,3
3world2
4Im3
  • 正排索引:根据index查询数据信息,例如根据ID查询name
  • 倒排索引:根据数据信息查询对应的index,也叫反向索引,上述根据word查询index就是倒排索引
  • 在用户检索查询时,流程如下:
    1. 先根据关键词查word查询到index。
    2. 再根据index查询到对应的整条数据记录,包含其他所有的field。(我认为这一步类似于关系型数据库中聚集索引的回表操作)
    3. 展示信息。

ES、Lucene、Solr

  • lucene只能用在java项目中,需要引入jar包
  • lucene不支持集群环境
  • Solr实时建立索引时,Solr会产生IO阻塞,查询性能较差,Solr用的是Zookeeper进行分布式管理,而ES自带有分布式协调管理功能。
  • Solr支持JSON/XML/CSV,但是ES只支持json文件,但是ES实时搜索应用效率高于Solr
  • ES是基于Lucene的搜索框架

ES、kibana、logstash

  • ES搜索引擎
  • kibana可视化管理界面
  • logstash存储库

ES和关系型数据库比较

ES关系型数据库
Index(索引)Database(数据库)
Type或者_Doc(类型)Table(表)
Document(文档)Row(行)
Field(字段)Column(列)

ES中的重要概念

  • Index
  • Mapping
  • Type
  • Document
  • Field
  • Cluster
  • node
  • 分片和副本

文档映射

查看映射关系:get /index_name/_mapping,加上_下划线表示查看ES内置对象

  • 动态映射,自动映射字段类型
  • 静态映射,自己指定字段映射类型
  • text类型中,会有type为keyword的类型字段,因为text默认是要拆分分词进行检索,keyword是为了保留原文本的不拆分而存在的,keyword也算一种类型,例如人员表中的name就可以设置为keyword,不必设置成text进行分词拆分。

IK分词器

  • ES中默认的分词器是单字分词器,会把一句汉字中的所有字都拆开,所以默认的在中文环境下十分不好用,所以要用第三方分词器。
  • IK直接放在ES安装目录下的plugins,重启ES后即可生效。
  • IK分词器两种模式:
    • ik_smart,粗粒度拆分,运用比较少。
    • ik_max_word,最细粒度拆分,常用。
  • ES中指定IK分词器作为默认分词器
put /index_name
{"settings"	: {"index": {"analysis.analyzer.default.type" : "ik_max_word"}}
}

基本操作

  • 创建索引库:put /index_name
  • 查询索引库:get /inex_name
  • 删除索引库:delete /index_name
  • 添加一条记录:put /index_name/_doc/id,例如put /test/user/1
  • 条件查询
  • 范围查询
  • 批量查询
  • 分页查询

DSL语言高级查询(ES中最核心的查询语法)

  • match,拆分查询
  • term,不拆分查询
  • multi_match,多词查询

ES-Header集群管理可视化界面

待更新。。

http://www.khdw.cn/news/33062.html

相关文章:

  • 网站建设意义模板能打开任何网站浏览器
  • 网站建设 关于我们疫情排行榜最新消息
  • 做系统哪个网站上的好爱站长尾词挖掘工具
  • 网站推广公司兴田德润在哪里关键词排名关键词快速排名
  • 个人简历免费模板石家庄百度seo排名
  • 微信app网站新乡seo优化
  • wordpress做公司网站app代理推广平台
  • 电子产品商务网站模板百度怎么创建自己的网站
  • 网站升级改版需要几天樱桃电视剧西瓜视频在线观看
  • 做网站需要交钱吗seo站长教程
  • html网站建设代码seo一般包括哪些内容
  • 在浏览器上建设网站搜索引擎优化的作用
  • 小说网站分页关键字怎么做短视频推广平台有哪些
  • 网站建设税收编码产品推广计划怎么写
  • 怎么自己做网站服务器linux信息流广告素材网站
  • 建站网站模板长春网络推广优化
  • 做网站商城靠谱360搜索引擎优化
  • 做网站图片失真seo排名软件怎么做
  • 网站开发人员任职资格seo关键词优化举例
  • 网站3级目录可以做导航分类么无限制搜索引擎排名
  • 苏州工业园区两学一做教育网站大数据营销案例分析
  • 手机的网站有哪些海外网站seo优化
  • 西安网站seo推广销售网络平台
  • 做的好的中医网站口碑营销的产品有哪些
  • 东莞外贸网站设计企业qq
  • 桂林北站客服咨询电话花钱推广的网络平台
  • 开发一个社交软件需要多少钱优化营商环境心得体会2023
  • 网站内页标题怎么填晋城今日头条新闻
  • wordpress备份整站新站seo快速排名 排名
  • h5网站开发流程环球网广东疫情最新消息