一条SQL差点引发离职
文章首发于微信公众号:云舒编程
关于我: 字节、阿里资深工程师。 做过营销、支付、百万级Feed流优化、权限系统、网关。 专注于技术原理分享,用最简单的话分享最复杂的技术原理
背景
最近组里的小伙伴在开发一个更新功能时踩了MySQL的一个类型转换的坑,差点造成线上故障。
本来是一个很简单的逻辑,就是根据唯一的id去更新对应的MySQL数据,代码简化后如下:
var updates []*model.Goods
for id, newGoods := range update {
if err := model.GetDB().Model(&model.Goods{}).Where("id = ?", id).Updates(map[string]interface{}{
"selling_price": newGoods.SellingPrice,
"sell_type": newGoods.SellType,
"status": newGoods.Status,
"category_id": newGoods.CategoryID,
}).Error; err != nil {
return nil, err
}
}
很明显,本来应该是想声明为 类型的,然后key是唯一id。这样下面的更新逻辑才是对的,否则拿到的id其实是数组的下标。
但是code review由于跟着一堆代码一起评审了,并且这段更新很简单,同时测试的时候也测试过了(能测试通过也是“机缘巧合”),所以没有发现这段异常。
发到线上后,进行了灰度集群的测试,这个时候发现只要调用了这个接口,灰度集群的数据全部都变成了一样,回滚后正常。
分析
回滚后在本地进行复现,由于本地环境是开启了SQL打印的,于是看到了这么一条SQL:很明显是拿数组的下标去比较了
update db_name set selling_price = xx,sell_type = xx where id = 0;
由于我们的id是全部是通过uuid生成的,所以下意识的认为这条sql应该啥也不会更新才对,但是本地的确只执行了这条sql,没有别的sql,并且db中的数据全部都被修改了。
这个时候想起福尔摩斯的名言 ,于是抱着试一试的心态直接拿这条sql去db控制台执行了一遍,发现果然所有的数据又都被修改了。
也就是 这个条件对于所有的记录都是恒为true,就会导致所有记录都被更新。在这个时候,想起曾经看到过MySQL对于不同类型的比较会有 ,难道是这个原因导致的?
隐式转换规则
在MySQL官网找到了不同类型比较的规则:
最后一段的意思是:对于其他情况,将按照浮点(双精度)数进行比较。例如,字符串和数字的比较就按照浮点数规则进行比较。
也就是id会首先被转换成浮点数,然后再跟0进行比较。
MySQL字符转为浮点数时会按照如下规则进行:
1.如果字符串的第一个字符就是非数字的字符,那么转换结果就是0;
2.如果字符串以数字开头:
(1)如果字符串都是数字,转换结果就是整个字符串对应的数字;
(2)如果字符串中存在非数字,转换结果就是开头的那些数字对应的值;
举例说明:
"test" -> 0
"1test" -> 1
"12test12" -> 12
由于我们生成的uuid没有数字开头的字符串,于是都会转变成0。那么这条SQL就变成了:
update db_name set selling_price = xx,sell_type = xx where 0 = 0;
就恒为true了。
修复就很简单了,把取id的逻辑改成正确的就行。
为什么测试环境没有发现
前面有提到这段代码在测试环境是测试通过了的,这是因为开发和测试同学的环境里都只有一条记录,每次更新他发现都能正常更新就认为是正常的了。同时由于逻辑太简单了,所以都没有重视这块的回归测试。
幸好在灰度集群就发现了这个问题,及时进行了回滚,如果发到了线上影响了用户数据,可能就一年白干了。
最后
代码无小事,事事需谨慎啊。一般致命问题往往是一行小小的修改导致的。
推荐阅读
#晒一晒我的offer##数据人的面试交流地##互联网公司评价#MySQL面试知识点分享