4 调节其他参数 针对 select 具体语句
优化阶段1 结果:程序本身抽取数据虽然比之前快了,但是仍然不是理想速度六 业务角度 尝试解决 1 由于随机表查询较多而且不固定,尝试对表查询进行整合,针对同一表的查询进行汇总集中查询 2 查询语句本身包含in集合的ID过多,将近万个,将in集合内部条件降低数量到千个 3 由于减少了in集合,所以增大调整并发数,保证总量不变优化阶段2 结果:结果非常不错,可以预期时间内完成抽取数据任务七 总结: 1 从数据库来说,减少其他IO操作,加大缓存的数据 2 从业务角度来说,集中查询,采用in集合少但是并发多的模式效率远远高于in集合大但是并发少的模式 3 还可以通过横向扩展机器的方式提高查询效率八 历史问题 1 机械硬盘的查询效率远远不如SSD,但是硬件问题无法解决 2 分库分表的纬度制定方案不行,而且集群本身堆积的数据太多,存储了一年数据,超出了硬件本身的承受水平