2024-01-18
原文作者:hashcon 原文地址: https://zhanghaoxin.blog.csdn.net/article/details/51487294

5. 路由模块

5.5 AST语义解析路由

DruidParser结构:
基本使用解析代码:

    //sql是一组SQL语句
    MySqlStatementParser parser = new MySqlStatementParser(sql);
    //获取每个语句粗粒度的parse结果
    List<SQLStatement> statementList = parser.parseStatementList();
    //获取每个语句更细粒度的parse结果
    for(SQLStatement statement:statementList){
        MySqlSchemaStatVisitor visitor = new MySqlSchemaStatVisitor();
        statemen.accept(visitor);
    }

202401182020503281.png
我们来看下一个例句解析出来的结果是啥:
例句:

    select concat(s.id,'_',s.name),s.value,t.name from student s,teacher t where s.value>60 and s.teacher=t.name order by s.value

解析代码:

    MySqlStatementParser parser = new MySqlStatementParser("selectconcat(s.id,'_',s.name),s.value,t.name from student s,teacher t where s.value>60 and s.teacher=t.name order by s.value");
    List<SQLStatement> statementList = parser.parseStatementList();
    SQLStatement stmt = statementList.get(0);
    MySqlSchemaStatVisitor visitor = new MySqlSchemaStatVisitor();
    stmt.accept(visitor);

首先第一步粗粒度解析,解析出来的是一个SQLStatement,对于本条语句实际实现和涉及到的主要类是:

202401182020508022.png
这里解释下,对于本语句,具体实现为SQLSelectStatement。SQLSelectStatement里面包含一个SQLSelect类。由于我们用的是MySqlStatementParser解析,所以dbType为mysql。parent为空,因为这句SQL的select是AST语意树的根节点。attributes为空,因为没有设置一些特殊参数。

202401182020512153.png
SQLSelect类由如下几部分组成:

  • withSubQuery:对于MySQL无意义
  • query:这里对应的实现是SQLSelectQueryBlock
  • orderBy:对于MySQL无意义
  • hints:对于MySQL无意义
  • parent: 指向刚刚的SQLSelectStatement实例
  • attributes:一些特殊参数

202401182020516074.png
然后我们看下query对应的MySqlSelectQueryBlock,里面的属性比较一目了然,这里就不一一详细解释:

202401182020520825.png
首先我们的语句里面,有select列,有目标表,有where条件,有order by。这里对应的都有。
select列:

202401182020526086.png
注意,这里我们可以看到,解析出来的并没有考虑别名。
目标表:

202401182020531667.png
where条件:

202401182020536338.png
注意,这里where条件可以看出是个这样的树结构:

202401182020542809.png
order by:

2024011820205469610.png
然后,我们看下,经过visitor之后,解析出了啥:

2024011820205510611.png
首先一个明显的区别就是将别名解析出来,之后还有一些对于模式结构的解析。
在MyCat中,我们按照需要,进行不同程度的解析。

回归正题,来看routeNormalSqlWithAST()方法

2024011820205562912.png

具体的源代码这里先不放。我们具体分析DruidParser解析步骤,这里是MyCat内自己实现的一套继承于源DruidParser的一些类。

2024011820205650213.png
以DruidSelectParser为例 ,说明接下来的DruidParser解析步骤:

2024011820205707014.png
visitor解析操作:

2024011820205757515.png
注意mergedConditionList包含所有condition,包括子查询的
需要考虑or语句必定为真的路由:权威指南是这么说的,其实后来没必要了,druidparser已经自动过滤了or为永远真的条件

    select * from hotnews where id =1 or 1 = 1;

转换为:

    select * from hotnews

现在主要要做的就是将OR语句拆成OR块。为什么要根据OR拆呢?AND运算优先级更高,OR运算优先级低。然后,还有OR是最影响分片的

    select * from hotnews where id =1 and score > 60 or title = 'a';

这句话需要路由到后台每个分片上,而不是id=1的

接下来:

2024011820205804716.png
主要是将mergedConditionList中需要做路由计算的元素提取并记录下来。
下一步是Statement解析操作:

2024011820205860017.png
Statement解析主要做别名记录(主要针对order by,group by还有一些聚合函数。这样在之后的结果集合并有理可循)
最后一步是改写SQL操作:

2024011820205939418.png
首先是tryRoute方法:

2024011820205996419.png
遍历之前记录的路由字段和值,计算路由,如果语句中全为global的表,则只计算一遍,这个具体步骤是:

2024011820210051220.png
改写limit步骤:

2024011820210121221.png

2024011820210177222.png
最后是判断是否需要缓存:

2024011820210221823.png
至此,路由模块结束

阅读全文