2023-03-21
原文作者:简单教程 原文地址:https://www.twle.cn/c/yufei/mysqlfav/mysqlfav-basic-distinct.html

在 MySQL 中,有一条忠告,就是 「 不要使用浮点类型,不要使用浮点类型,不要使用浮点类型 」,如果真要使用,那么也请使用 DECIMAL 类型。

为什么呢 ?

因为浮点类型的值是 「 近似 」精度,而且,因为它们都有使用 4 或 8 字节存储,而会带来另一些往往想不到的雪上加霜的问题。

近似值的浮点类型

浮点数有时会引起混淆,因为它们存储的是近似值而不是精确值,这就可能直接导致了在 SQL 语句中写入的浮点值可能与内部存储的值不同。

另一方面,在比较操作中,尤其是想等于操作 ( = ),尝试将浮点值视精确值可能会导致问题。

更惨的是,它们还受平台或实现依赖性的影响。

因为 FLOAT 和 DOUBLE 数据类型受这些问题的影响,所以, MySQL 推出了更好的数据类型 DECIMAL

对于 DECIMAL 列,MySQL 执行的是精度为 65 位十进制数的操作,这可以解决最常见的不准确问题。

下面的范例,使用 DOUBLE 演示浮点运算是如何受浮点错误的影响

    mysql> DROP TABLE IF EXISTS t1;
    
    mysql> CREATE TABLE t1 (i INT, d1 DOUBLE, d2 DOUBLE);
    
    mysql> INSERT INTO t1 VALUES (1, 101.40, 21.40), (1, -80.00, 0.00),
         (2, 0.00, 0.00), (2, -13.20, 0.00), (2, 59.60, 46.40),
         (2, 30.40, 30.40), (3, 37.00, 7.40), (3, -29.60, 0.00),
         (4, 60.00, 15.40), (4, -10.60, 0.00), (4, -34.00, 0.00),
         (5, 33.00, 0.00), (5, -25.80, 0.00), (5, 0.00, 7.20),
         (6, 0.00, 0.00), (6, -51.40, 0.00);
    
    mysql> SELECT i, SUM(d1) AS a, SUM(d2) AS b FROM t1 GROUP BY i HAVING a <> b;
    +------+-------+------+
    | i    | a     | b    |
    +------+-------+------+
    |    1 |  21.4 | 21.4 |
    |    2 |  76.8 | 76.8 |
    |    3 |   7.4 |  7.4 |
    |    4 |  15.4 | 15.4 |
    |    5 |   7.2 |  7.2 |
    |    6 | -51.4 |    0 |
    +------+-------+------+

结果是正确的。

虽然前五个记录看起来不应该满足比较 ( a 和 b 的值看起来并不相同),但它们可能会这样做,因为数字之间的差异只体现在十分位左右,具体因素取决于计算机体系结构或编译器版本或优化级别。例如,不同的 CPU 可以不同地评估浮点数。

但如果我们将列 d1d2 定义为 DECIMAL 而不是 DOUBLE ,那么 SELECT 查询的结果将只包含一行 ( 上面显示的最后一行 )。

进行浮点数比较的正确方法是首先确定数字之间差异的可接受容差,然后与容差值进行比较。

例如,如果我们认为浮点数在精度为万分之一( 0.0001 )内相同时应该被认为是相同的,则应该进行减法操作,然后比较以找出大于容差值的差异。

    mysql> SELECT i, SUM(d1) AS a, SUM(d2) AS b FROM t1
        -> GROUP BY i HAVING ABS(a - b) > 0.0001;
    +------+-------+------+
    | i    | a     | b    |
    +------+-------+------+
    |    6 | -51.4 |    0 |
    +------+-------+------+
    1 row in set (0.00 sec)

相反,要获得数字相同的行,测试应找到容差值内的差异:

    mysql> SELECT i, SUM(d1) AS a, SUM(d2) AS b FROM t1
        -> GROUP BY i HAVING ABS(a - b) <= 0.0001;
    +------+------+------+
    | i    | a    | b    |
    +------+------+------+
    |    1 | 21.4 | 21.4 |
    |    2 | 76.8 | 76.8 |
    |    3 |  7.4 |  7.4 |
    |    4 | 15.4 | 15.4 |
    |    5 |  7.2 |  7.2 |
    +------+------+------+
    5 rows in set (0.03 sec)

浮点值取决于平台或实现依赖性。假设我们执行以下语句:

    CREATE TABLE t1(c1 FLOAT(53,0), c2 FLOAT(53,0));
    
    INSERT INTO t1 VALUES('1e+52','-1e+52');
    
    SELECT * FROM t1;

在某些平台上,SELECT 语句返回 inf-inf。在其他情况下,它返回 0-0

这个问题非常严重,如果我们尝试通过在主服务器上使用 mysqldump 转储表内容并将转储文件重新加载到从服务器来创建复制从服务器,则包含浮点列的表可能在两个主机之间有所不同

阅读全文