网上有很多介绍分库分表的文章,方法很多:
```
分区表切分
垂直切分
水平切分
区间切分
取模切分
```
这里不细说
分库分表简单,但后期会带来一系列的难题:
```
事务
Join
分页
```
**数据库:**
<img src="https://raw.githubusercontent.com/bccber/imageshow/master/db.png" />
```
master和slave是一个主从架构
imagespider_db:[ImageSpider](https://github.com/bccber/imagespider)项目采集回来的数据,不需要部署主从分离。
imageshow_db_1、imageshow_db_2、imageshow_db_3、imageshow_db_4:
四个分库的结构一模一样。(注意,分库的个数最好是2的N次方,不然基因取模算法可能会失效)
```
**t_users用户表:**
```
用户登录和注册时,需要用name来定位分库;查看用户资料时,需要用uid定位分库,
所以,把name的基因加入到uid中,uid的最后2bit为name的crc32的最后2bit,这样通过uid和name都能定位到分库。
```
**t_images图片表:**
```
按 id % 4分库,分页时采用“禁止跳页法”。
```
**t_comments评论表:**
```
id的最后2bit为imgid的2bit,保证一张图片的所有评论和图片切分到同一个数据库中。
用户评论时,t_images表的comment_count字段加1,因为是同一个数据库,仍然可以使用事务处理;
所有评论都切分到同一个数据库,分页时可以使用传统方法。
```
**t_likes点赞表:**
```
和t_comments表一样,也使用imgid最后2bit作为分库基因。
```
```
在某些场景下,使用基因切分法,把相关表都切分到同一个数据库中,在后期的操作中仍然可以使用事务,Join等操作,
但可能会导致分库数据不均衡。
ImageShow只是一个水平切分的例子,功能,代码都很简单,肯定不能涵盖分库分表的所有应用场景。
```
[github](https://github.com/bccber/imageshow)
有疑问加站长微信联系(非本文作者))