当前位置：首页 > 科技 > 软件

自己动手写数据库：解析 Select 语句并生成查询树

来源：责编：时间：2023-12-15 17:17:38 440观看

导读首先，我们需要给原来代码打个补丁，在SelectScan 结构体初始化时需要传入 UpdateScan 接口对象，但很多时候我们需要传入的是 Scan 对象，因此我们需要做一个转换，也就是当初始化 SelectScan 时，如果传入的是 Scan 对象，那么我

首先，我们需要给原来代码打个补丁，在SelectScan 结构体初始化时需要传入 UpdateScan 接口对象，但很多时候我们需要传入的是 Scan 对象，因此我们需要做一个转换，也就是当初始化 SelectScan 时，如果传入的是 Scan 对象，那么我们就将其封装成 UpdateScan 接口对象，因此在 query 目录下增加一个名为 updatescan_wrapper.go 的文件，在其中输入内容如下：

package queryimport (    "record_manager")type UpdateScanWrapper struct {    scan Scan}func NewUpdateScanWrapper(s Scan) *UpdateScanWrapper {    return &UpdateScanWrapper{        scan: s,    }}func (u *UpdateScanWrapper) GetScan() Scan {    return u.scan}func (u *UpdateScanWrapper) SetInt(fldName string, val int) {    //DO NOTHING}func (u *UpdateScanWrapper) SetString(fldName string, val string) {    //DO NOTHING}func (u *UpdateScanWrapper) SetVal(fldName string, val *Constant) {    //DO NOTHING}func (u *UpdateScanWrapper) Insert() {    //DO NOTHING}func (u *UpdateScanWrapper) Delete() {    //DO NOTHING}func (u *UpdateScanWrapper) GetRid() *record_manager.RID {    return nil}func (u *UpdateScanWrapper) MoveToRid(rid *record_manager.RID) {    // DO NOTHING}

上面代码逻辑简单，如果调用 Scan 对象接口时，他直接调用其 Scan 内部对象的接口，如果调用到 UpdateScan 的接口，那么它什么都不做。完成上面代码后，我们在select_plan.go 中进行一些修改：

func (s *SelectPlan) Open() interface{} {    scan := s.p.Open()    updateScan, ok := scan.(query.UpdateScan)    if !ok {        updateScanWrapper := query.NewUpdateScanWrapper(scan.(query.Scan))        return query.NewSelectionScan(updateScanWrapper, s.pred)    }    return query.NewSelectionScan(updateScan, s.pred)}

上面代码在创建 SelectScan 对象时，先判断传进来的对象是否能类型转换为 UpdateScan，如果不能，那意味着s.p.Open 获取的是 Scan 对象，因此我们使用前面的代码封装一下再用来创建 SelectScan 对象。完成这里的修改后，我们进入正题。

前面我们在实现 sql 解析器后，在解析完一条查询语句后会创建一个 QueryData 对象，本节我们看看如何根据这个对象构建出合适的查询规划器(Plan)。我们将采取由简单到负责的原则，首先我们直接构建 QueryData 的信息去构建查询规划对象，此时我们不考虑它所构造的查询树是否足够优化，后面我们再慢慢改进构造算法，直到算法能构建出足够优化的查询树。

我们先看一个具体例子，假设我们现在有两个表 STUDENT, EXAM，第一个表包含两个字段分别是学生 id 和姓名：
id | name
———— | ——-
1 | Tom
2 | Jim
3 | John

第二个表包含的是学生 id,科目名称，考试乘机：
stuid | exam|grad
———— | ——-|——-|
1 | math| A|
1 | algorithm| B
2 | writing| C |
2| physics| C|
3|chemical|B|
3|english| C|

现在我们使用 sql 语句查询所有考试成绩得过 A 的学生：

select name from STUDENT, EXAM where id = student_id and grad='A'

当 sql 解释器读取上面语句后，他就会创建一个 QueryData 结构，里面 Tables 对了就包含两个表的名字，也就是 STUDENT, EXAM。由于这两个表不是视图，因此上面代码中判断 if viewDef != nil 不成立，于是进入 else 部分，也就是代码会为这两个表创建对应的 TablePlan 对象，接下来直接对这两个表执行 Product 操作，也就是将左边表的一行跟右边表的每一行合起来形成新表的一行，Product 操作在 STUDENT 和 EXAM 表后所得结果如下：
id|name|student_id | exam|grad
————|——-|———— | ——-|——-|
1|Tom|1|math|A|
1|Tom|1|algorithm|B|
1|Tom|2|writing|A|
1|Tom|2|physics|C|
1|Tom|3|chemical|B|
1|Tom|3|english|A|
…..|….|…..|…|…|

接下来代码创建 ScanSelect 对象在上面的表上，接着获取该表的每一行，然后检测该行的 id 字段是否跟 student_id 字段一样，如果相同，那么查看其 grad 字段，如果该字段是’A’，就将该行的 name 字段显示出来。

下面我们看看如何使用代码把上面描述的流程实现出来。首先我们先对接口进行定义，在 Planner 目录下的 interface.go 文件中增加如下内容：

type QueryPlanner interface {    CreatePlan(data *query.QueryData, tx tx.Transaction) Plan}

接着在 Planner 目录下创建文件 query_planner.go，同时输入以下代码，代码的实现逻辑将接下来的文章中进行说明：

package plannerimport (    "metadata_management"    "parser"    "tx")type BasicQueryPlanner struct {    mdm *metadata_management.MetaDataManager}func CreateBasicQueryPlanner(mdm *metadata_management.MetaDataManager) QueryPlanner {    return &BasicQueryPlanner{        mdm: mdm,    }}func (b *BasicQueryPlanner) CreatePlan(data *parser.QueryData, tx *tx.Transaction) Plan {    //1,直接创建 QueryData 对象中的表    plans := make([]Plan, 0)    tables := data.Tables()    for _, tblname := range tables {        //获取该表对应视图的 sql 代码        viewDef := b.mdm.GetViewDef(tblname, tx)        if viewDef != nil {            //直接创建表对应的视图            parser := parser.NewSQLParser(viewDef)            viewData := parser.Query()            //递归的创建对应表的规划器            plans = append(plans, b.CreatePlan(viewData, tx))        } else {            plans = append(plans, NewTablePlan(tx, tblname, b.mdm))        }    }    //将所有表执行 Product 操作，注意表的次序会对后续查询效率有重大影响，但这里我们不考虑表的次序，只是按照    //给定表依次执行 Product 操作，后续我们会在这里进行优化    p := plans[0]    plans = plans[1:]    for _, nextPlan := range plans {        p = NewProductPlan(p, nextPlan)    }    p = NewSelectPlan(p, data.Pred())    return NewProjectPlan(p, data.Fields())}

上面代码中 QueryData就是解析器在解析 select 语句后生成的对象，它的 Tables 数组包含了 select 语句要查询的表，所以上面代码的 CreatePlan 函数先从 QueryData 对象获得 select 语句要查询的表，然后使用遍历这些表，使用 NewProductPlan 创建这些表对应的 Product 操作，最后在 Product 的基础上我们再创建 SelectPlan，这里我们就相当于使用 where 语句中的条件，在 Product 操作基础上将满足条件的行选出来，最后再创建 ProjectPlan，将在选出的行基础上，将需要的字段选择出来。

下面我们测试一下上面代码的效果，首先在 main.go 中，我们先把 student, exam 两个表构造出来，代码如下：

func createStudentTable() (*tx.Transation, *metadata_manager.MetaDataManager) {    file_manager, _ := fm.NewFileManager("student", 2048)    log_manager, _ := lm.NewLogManager(file_manager, "logfile.log")    buffer_manager := bmg.NewBufferManager(file_manager, log_manager, 3)    tx := tx.NewTransation(file_manager, log_manager, buffer_manager)    sch := record_manager.NewSchema()    mdm := metadata_manager.NewMetaDataManager(false, tx)    sch.AddStringField("name", 16)    sch.AddIntField("id")    layout := record_manager.NewLayoutWithSchema(sch)    ts := query.NewTableScan(tx, "student", layout)    ts.BeforeFirst()    for i := 1; i <= 3; i++ {        ts.Insert() //指向一个可用插槽        ts.SetInt("id", i)        if i == 1 {            ts.SetString("name", "Tom")        }        if i == 2 {            ts.SetString("name", "Jim")        }        if i == 3 {            ts.SetString("name", "John")        }    }    mdm.CreateTable("student", sch, tx)    exam_sch := record_manager.NewSchema()    exam_sch.AddIntField("stuid")    exam_sch.AddStringField("exam", 16)    exam_sch.AddStringField("grad", 16)    exam_layout := record_manager.NewLayoutWithSchema(exam_sch)    ts = query.NewTableScan(tx, "exam", exam_layout)    ts.BeforeFirst()    ts.Insert() //指向一个可用插槽    ts.SetInt("stuid", 1)    ts.SetString("exam", "math")    ts.SetString("grad", "A")    ts.Insert() //指向一个可用插槽    ts.SetInt("stuid", 1)    ts.SetString("exam", "algorithm")    ts.SetString("grad", "B")    ts.Insert() //指向一个可用插槽    ts.SetInt("stuid", 2)    ts.SetString("exam", "writing")    ts.SetString("grad", "C")    ts.Insert() //指向一个可用插槽    ts.SetInt("stuid", 2)    ts.SetString("exam", "physics")    ts.SetString("grad", "C")    ts.Insert() //指向一个可用插槽    ts.SetInt("stuid", 3)    ts.SetString("exam", "chemical")    ts.SetString("grad", "B")    ts.Insert() //指向一个可用插槽    ts.SetInt("stuid", 3)    ts.SetString("exam", "english")    ts.SetString("grad", "C")    mdm.CreateTable("exam", exam_sch, tx)    return tx, mdm}

然后我们用解析器解析select查询语句生成 QueryData 对象，最后使用BasicQueryPlanner创建好执行树和对应的 Scan 接口对象，最后我们调用 Scan 对象的 Next 接口来获取给定字段，代码如下：

func main() {    //构造 student 表    tx, mdm := createStudentTable()    queryStr := "select name from student, exam where id = stuid and grad=/"A/""    p := parser.NewSQLParser(queryStr)    queryData := p.Query()    test_planner := planner.CreateBasicQueryPlanner(mdm)    test_plan := test_planner.CreatePlan(queryData, tx)    test_interface := (test_plan.Open())    test_scan, _ := test_interface.(query.Scan)    for test_scan.Next() {        fmt.Printf("name: %s/n", test_scan.GetString("name"))    }}

上面代码运行后所得结果如下：

本文链接：http://www.28at.com/showinfo-26-46475-0.html自己动手写数据库：解析 Select 语句并生成查询树

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：在Linux系统中实现容器化的大规模数据分析平台：Hadoop和Spark

下一篇：玩转C++方法模板，编程技能秒提升

标签：

热门焦点

JavaScript 混淆及反混淆代码工具

介绍在我们开始学习反混淆之前，我们首先要了解一下代码混淆。如果不了解代码是如何混淆的，我们可能无法成功对代码进行反混淆，尤其是使用自定义混淆器对其进行混淆时。什么是混
Rust中的高吞吐量流处理

作者 | Noz编译 | 王瑞平本篇文章主要介绍了Rust中流处理的概念、方法和优化。作者不仅介绍了流处理的基本概念以及Rust中常用的流处理库，还使用这些库实现了一个流处理程序
掘力计划第 20 期：Flutter 混合开发的混乱之治

在掘力计划系列活动第20场，《Flutter 开发实战详解》作者，掘金优秀作者，Github GSY 系列目负责人恋猫的小郭分享了Flutter 混合开发的混乱之治。Flutter 基于自研的 Skia 引擎
多线程开发带来的问题与解决方法

使用多线程主要会带来以下几个问题：（一）线程安全问题　　线程安全问题指的是在某一线程从开始访问到结束访问某一数据期间，该数据被其他的线程所修改，那么对于当前线程而言，该线程
花7万退货退款无门：谁在纵容淘宝珠宝商家造假？

来源：极点商业作者：杨铭在淘宝购买珠宝玉石后，因为保证金不够赔付，店铺关闭，退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书，支持全国复检，可以30天无理由退换货。&
网红炒股不为了赚钱，那就是耍流氓！

来源：首席商业评论6月26日高调宣布入市，网络名嘴大v胡锡进居然进军了股市。在一次财经媒体峰会上，几个财经圈媒体大佬就“胡锡进炒股是否知道认真报道”展开讨论。有
重估百度丨大模型，能撑起百度的“今天”吗?

自象限原创作者｜程心罗辑2023年之前，对于自己的“今天”，百度也很迷茫。“新业务到 2022 年底还是 0，希望 2023 年出来一个 1。”这是2022年底，李彦宏
余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

8月4日消息，2023年华为开发者大会（HDC.Together）今天正式开幕，华为发布HarmonyOS 4、全新升级的鸿蒙开发套件、HarmonyOS Next开发者预览版本等一系列
英特尔Xe-HP项目终止，将专注Xe-HPC/HPG系列显卡

据10 月 31 日消息报道，英特尔高级副总裁兼加速计算系统和图形事业部总经理表示，Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服

自己动手写数据库：解析 Select 语句并生成查询树

JavaScript 混淆及反混淆代码工具

Rust中的高吞吐量流处理

掘力计划第 20 期：Flutter 混合开发的混乱之治

多线程开发带来的问题与解决方法

花7万退货退款无门：谁在纵容淘宝珠宝商家造假？

网红炒股不为了赚钱，那就是耍流氓！

重估百度丨大模型，能撑起百度的“今天”吗?

余承东:AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验

英特尔Xe-HP项目终止，将专注Xe-HPC/HPG系列显卡

最新推荐

猜你喜欢

热门推荐

相关资讯