当前位置:首页 > 科技  > 软件

Elasticsearch 使用误区之将 Elasticsearch 视为关系数据库!

来源: 责编: 时间:2024-06-27 07:52:52 88观看
导读Elasticsearch 是一个强大的工具,尤其在全文检索、实时分析、机器学习、地理数据应用、日志和事件数据分析、安全信息和事件管理等场景有大量的应用。然而,Elastic Stack 技术栈的选型及应用效能取决于正确的使用方式。

Elasticsearch 是一个强大的工具,尤其在全文检索、实时分析、机器学习、地理数据应用、日志和事件数据分析、安全信息和事件管理等场景有大量的应用。Ygc28资讯网——每日最新资讯28at.com

然而,Elastic Stack 技术栈的选型及应用效能取决于正确的使用方式。选型错误或者误用 Elasticsearch 可能会导致扩展性问题、性能问题(如为解决一个问题使用非常复杂的脚本导致性能极差)等,从而使整体体验感变差。所以,本文区别于之前的正向讲解的方式,更多的讲解反例或者负面应用案例。“以史为鉴”,以便于大家更好地使用 Elasticsearch。Ygc28资讯网——每日最新资讯28at.com

本系列文章会有 10 几篇左右,一篇一个知识点讲解 Elasticsearch 使用误区解读,敬请期待!Ygc28资讯网——每日最新资讯28at.com

误区1:将 Elasticsearch 视为关系数据库Ygc28资讯网——每日最新资讯28at.com

Elasticsearch 常被误解为 MySQL 或者 PostgreSQL 等关系数据库的直接替代品,用户除了直接替代使用外更看其全文搜索和快速聚合的能力。Ygc28资讯网——每日最新资讯28at.com

然而,咱们必须清晰的认知:Elasticsearch 设计初衷不是处理复杂事务和关系数据模型的。Ygc28资讯网——每日最新资讯28at.com

我们从下面几个维度逐一展开讨论:Ygc28资讯网——每日最新资讯28at.com

1、该不该选型 Elasticsearch ?

个人建议先了解 Elasticsearch 的适用场景以及不适用场景,这样能清楚 Elastic Stack 技术栈更适合哪些业务需求。Ygc28资讯网——每日最新资讯28at.com

例如,咱们文章之前图解的六大应用场景是非常适合的。然而,对于需要处理复杂事务、多表联查操作和高一致性要求的应用,如银行系统的交易处理和ERP系统等,Elasticsearch 则不太适合。Ygc28资讯网——每日最新资讯28at.com

图片图片Ygc28资讯网——每日最新资讯28at.com

Elasticsearch 更适用场景:Ygc28资讯网——每日最新资讯28at.com

图片图片Ygc28资讯网——每日最新资讯28at.com

图片图片Ygc28资讯网——每日最新资讯28at.com


Ygc28资讯网——每日最新资讯28at.com

通过对比这些场景,反观自己的业务需求,就能判断是否应该选型 Elasticsearch 甚至 Elastic Stack 作为技术栈。Ygc28资讯网——每日最新资讯28at.com

2、理解 Elasticsearch 的设计

图片来自官方博客图片来自官方博客Ygc28资讯网——每日最新资讯28at.com

Elasticsearch 是一种面向文档的搜索引擎,专为快速搜索大量数据而设计。Ygc28资讯网——每日最新资讯28at.com

Elasticsearch 基于 Apache Lucene 构建,提供了强大的全文搜索、分析和数据聚合功能。Ygc28资讯网——每日最新资讯28at.com

以下是 Elasticsearch 的主要特点:Ygc28资讯网——每日最新资讯28at.com

  • 全文搜索:Elasticsearch 提供了高效的全文搜索功能,能够快速检索和匹配大规模文本数据。
  • 分布式架构:Elasticsearch 采用分布式架构,能够水平横向扩展,处理海量数据(PB级甚至以上都不是问题)和高并发请求。
  • 数据分析:Elasticsearch 支持复杂的聚合查询,可以做多维度的快速统计和分析数据,但聚合、去重等结果不是精准的。有精准需求的企业场景也要评估和掂量一下。
  • ......

图片来自官方博客图片来自官方博客Ygc28资讯网——每日最新资讯28at.com

如前所述,Elasticsearch 并不是设计用来处理关系数据和事务的。它的主要优势在于分析和搜索能力,而不是数据关系的严格维护。Ygc28资讯网——每日最新资讯28at.com

3、理解 Elasticsearch 与关系数据库的比较

关系数据库(如 MySQL、Oracle 及 PostgreSQL 等)和 Elasticsearch 之间有几个关键区别:Ygc28资讯网——每日最新资讯28at.com

3.1 数据模型比较

  • 关系数据库使用结构化的表和行来存储数据,并通过外键和约束来维护数据的一致性。
  • Elasticsearch 则使用文档(document,本质是 JSON 格式)来存储数据,每个文档可以包含不同的字段和数据类型。

特性Ygc28资讯网——每日最新资讯28at.com

关系数据库Ygc28资讯网——每日最新资讯28at.com

ElasticsearchYgc28资讯网——每日最新资讯28at.com

数据存储结构Ygc28资讯网——每日最新资讯28at.com

结构化的表和行Ygc28资讯网——每日最新资讯28at.com

文档Ygc28资讯网——每日最新资讯28at.com

数据类型Ygc28资讯网——每日最新资讯28at.com

每个表的字段类型固定Ygc28资讯网——每日最新资讯28at.com

每个文档可以包含不同的字段和数据类型Ygc28资讯网——每日最新资讯28at.com

数据一致性Ygc28资讯网——每日最新资讯28at.com

通过外键和约束来维护数据的一致性Ygc28资讯网——每日最新资讯28at.com

不提供数据一致性保障Ygc28资讯网——每日最新资讯28at.com

查询能力Ygc28资讯网——每日最新资讯28at.com

支持复杂的 SQL 查询、事务和联接操作Ygc28资讯网——每日最新资讯28at.com

主要用于全文搜索和数据聚合Ygc28资讯网——每日最新资讯28at.com

事务支持Ygc28资讯网——每日最新资讯28at.com

完整的事务支持Ygc28资讯网——每日最新资讯28at.com

不支持事务Ygc28资讯网——每日最新资讯28at.com

性能优化Ygc28资讯网——每日最新资讯28at.com

索引、缓存和查询优化Ygc28资讯网——每日最新资讯28at.com

分片、索引和缓存Ygc28资讯网——每日最新资讯28at.com

主要优势Ygc28资讯网——每日最新资讯28at.com

关系数据处理和数据一致性维护Ygc28资讯网——每日最新资讯28at.com

快速搜索和高效的数据聚合Ygc28资讯网——每日最新资讯28at.com

3.2 查询能力比较

  • 关系数据库支持复杂的 SQL 查询、事务和多表关联操作,以保证数据的一致性和完整性。
  • Elasticsearch 主要侧重于全文搜索和数据聚合,不支持复杂的事务和多表关联操作。

在关系数据库中,我们可以使用复杂的 SQL 查询、事务和多表关联操作来保证数据的一致性和完整性。例如:Ygc28资讯网——每日最新资讯28at.com

BEGIN TRANSACTION;-- 更新订单状态UPDATE ordersSET status = 'shipped'WHERE order_id = 123;-- 减少库存UPDATE productsSET stock = stock - 1WHERE product_id = 456;-- 记录客户活动INSERT INTO customer_activity (customer_id, activity)VALUES (789, 'Order 123 shipped');COMMIT;

图片图片Ygc28资讯网——每日最新资讯28at.com

上述事务示例能确保所有相关操作(更新订单状态、减少库存和记录客户活动)要么全部成功,要么全部失败,从而保证数据的一致性(事务的本质)。Ygc28资讯网——每日最新资讯28at.com

在 Elasticsearch 中,我们主要侧重于全文搜索和数据聚合分析,而不支持复杂的事务和多表关联操作。Ygc28资讯网——每日最新资讯28at.com

比如:用户需求如下:Ygc28资讯网——每日最新资讯28at.com

“想请教下大佬们,假设 es 中 有两个表,一个会员表,一个订单表,如果想关联查询,例如查询24年注册的所有的会员的订单总数,通过什么方式能快速查询?”Ygc28资讯网——每日最新资讯28at.com

咱们文章做过剖析,Elasticsearch 不是一丁点也不支持多表关联,只是支持的力度有限,支持的形式核心有如下几种:Ygc28资讯网——每日最新资讯28at.com

  • 自己业务层面实现
  • Nested 嵌套数据类型
  • Join 父子文档类型
  • 宽表冗余存储
  • Enrich processor 预处理方式

本文链接:http://www.28at.com/showinfo-26-96746-0.htmlElasticsearch 使用误区之将 Elasticsearch 视为关系数据库!

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 关于时间知识图谱问答的一篇综述

下一篇: 12306火车购票系统登录验证码的智能校验机制

标签:
  • 热门焦点
  • 印度登月最关键一步!月船三号今晚进入环月轨道

    印度登月最关键一步!月船三号今晚进入环月轨道

    8月5日消息,据印度官方消息,月船三号将于北京时间今晚21时30分左右开始近月制动进入环月轨道。这是该探测器能够成功的最关键步骤之一,如果成功将开始围
  • 把LangChain跑起来的三个方法

    把LangChain跑起来的三个方法

    使用LangChain开发LLM应用时,需要机器进行GLM部署,好多同学第一步就被劝退了,那么如何绕过这个步骤先学习LLM模型的应用,对Langchain进行快速上手?本片讲解3个把LangChain跑起来
  • 一篇聊聊Go错误封装机制

    一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 使用LLM插件从命令行访问Llama 2

    使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    【Techweb评测】中端机型用户群体巨大,占了中国目前手机市场的大头,一直以来都是各手机品牌的“必争之地”,其中OPPO K系列机型一直以来都以高品质、
  • OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    OPPO K11采用全方位护眼屏:三大护眼能力减轻视觉疲劳

    日前OPPO官方宣布,全新的OPPO K11将于7月25日正式发布,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼IMX890主摄,堪称是2000档位影像表
  • 微软发布Windows 11新版 引入全新任务栏状态

    微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
  • SN570 NVMe SSD固态硬盘 价格与性能兼具

    SN570 NVMe SSD固态硬盘 价格与性能兼具

    SN570 NVMe SSD固态硬盘是西部数据发布的最新一代WD Blue系列的固态硬盘,不仅闪存技术更为精进,性能也得到了进一步的跃升。WD Blue SN570 NVMe SSD的包装外
  • 利用职权私自解除被封帐号 Meta开除20多名员工

    利用职权私自解除被封帐号 Meta开除20多名员工

    11月18日消息,据外媒援引知情人士表示,过去一年时间内,Facebook母公司Meta解雇或处罚了20多名员工以及合同工,指控这些人通过内部系统以不当方式重置用户帐号,其
Top