开发说查询一张表老是丢数据,sql是这样的:select * from CLICK where id >= xxx and id < xxx;

id是主键,自增字段。

经常丢失最大id附近的一些数据。

写个sql复现这种情况,select id from CLICK where id >= (select max(id)-100 from CLICK) and id < (select max(id) from CLICK);

正常情况应该是会查到100条记录。但循环执行这个sql发现有时只能查到99条。找到那个丢失的id,select * from CLICK where id=“丢失的id”;发现数据是正常的。

怀疑是不是表损坏了,check table后是正常的。

到底什么原因呢?

打开binlog看数据插入的情况,发现max(id)先于max(id)-1插入了,这是什么情况?仔细看binlog,原来这两个数据插入不是一个线程执行的。

这样大概能猜测到原因了:

线程1从计数器获得自增的max(id)(这儿假设是99),去插入数据。之后线程2从计数器获得max(id)(这儿应该是100),去像同一个表插入数据。

线程2的速度比线程1快,所以线程2先插入了id=100的数据,线程1还没有执行完。

这时去查询:select id from CLICK where id >= (select max(id)-100 from CLICK) and id < (select max(id) from CLICK);

就会发现少了id=99的那条记录。

简单表示一下:

找到原因,那个开发的问题就很好解决了:select * from CLICK where id >= xxx and id < (select max(id)-100 from CLICK);

其实线程间的速度差距是很微小的,应该在微妙或者毫秒级别,一般是感觉不到这种差距的。