2023-12-09
中间件
0

上文我们深入理解了 Elasticsearch 的架构与实现原理,通过倒排索引实现了搜索,你是否考虑过关键词的搜索中,其中关键词是如何从文档中拆分的呢?这实际上是通过分词器实现的,然而,在处理中文文本时,Elasticsearch 内置的标准分词器往往表现不佳,它会将句子逐字分割,无法理解词汇的边界,导致搜索准确率低下。

例如,句子 "我是中国人" 会被拆分为 "我","是","中","国","人" 这五个独立的字。当用户搜索 "中国" 时,可能无法精准匹配到这条文档。

IK 分词器 正是为了解决这一问题而生的。它是 Elasticsearch 的一款开源中文分词插件,提供了智能、细粒度的中文分词能力,并支持丰富的自定义词典,从而极大地提升了中文搜索的准确性和用户体验。接下来本文将手把手带你完成从 Elasticsearch 环境搭建到 IK 分词器集成的全过程。

2023-12-02
中间件
0

在实际生产业务中经常会遇到高性能、高并发的查询场景,也就是需要再极短的时间内快速响应用户的查询内容,提高用户的体验性,此时就需要用到搜索技术了,接下来我们将深入了解搜索引擎的核心。

2023-10-17
中间件
0

总结整理了一些常见的 Redis 缓存,前面全面学习了 Redis,结合此处常见的面试题就可以进行回答了,整理自己的话术语言,做出关键词的提示构思,自信的对面试官说出来你的理解。

2023-10-12
中间件
0

主从同步是 Redis 分布式的基础,由此联想到分布式理论的基础 - CAP 原理,如何保证数据一致性,但凡分布式就离不开它。Redis 的高可用离开了主从同步将无从进行,其中 Redis Cluster 集群模式的节点数据同步,也是依赖于主从同步,本文将总结主从同步到底是如何做的,Redis Cluster 集群的架构实现原理。

2023-10-08
中间件
0

Redis 所有的数据结构都可以设置过期时间,时间一到,就会自动删除。你可以想象 Redis 内部有一个死神,时刻盯着所有设置了过期时间的 key,寿命一到就会立即收割。

你还可以进一步站在死神的角度思考,会不会因为同一时间太多的 key 过期,以至于忙不过来。同时因为 Redis 是单线程的,收割的时间也会占用线程的处理时间,如果收割的太过于繁忙,会不会导致线上读写指令出现卡顿?

接下来我们带着疑问深入了解 Redis 的过期策略与内存淘汰策略。