MySQL數據庫設計規範（僅供參考）

時間：2021-07-26 16:38:19 阅读：0 評論：0 收藏：0 [點我收藏+]

MySQL數據庫設計規範（僅供參考）

規範背景與目的
設計規範
2.1 數據庫设计
2.1.1 库名
2.1.2 表结构
2.1.3 列数据类型优化
2.1.4 索引设计
2.1.5 分库分表、分区表
2.1.6 字符集
2.1.7 程序DAO层设计建议
2.1.8 一个规范的建表语句示例
2.2 SQL编写
2.2.1 DML语句
2.2.2 多表连接
2.2.3 事务
2.2.4 排序和分組
2.2.5 线上禁止使用的SQL语句

1. 規範背景與目的

MySQL數據庫与 Oracle、 SQL Server 等數據庫相比，有其内核上的优势与劣势。我们在使用MySQL數據庫的时候需要遵循一定规范，扬长避短。本规范旨在帮助或指导RD、QA、OP等技术人员做出适合线上业务的數據庫设计。在數據庫变更和处理流程、數據庫表设计、
SQL編寫等方面予以規範，從而爲公司業務系統穩定、健康地運行提供保障。

2. 設計規範

2.1 數據庫设计

以下所有規範會按照【高危】、【強制】、【建議】三個級別進行標注，遵守優先級從高到低。

對于不滿足【高危】和【強制】兩個級別的設計，DBA會強制打回要求修改。

2.1.1 库名

【強制】庫的名稱必須控制在32個字符以內，相關模塊的表名與表名之間盡量提現join的關系，如user表和user_login表。
【強制】庫的名稱格式：業務系統名稱_子系統名，同一模塊使用的表名盡量使用統一前綴。
【強制】一般分庫名稱命名格式是库通配名_編號，編號从0开始递增，比如wenda_001以時間進行分庫的名稱格式是“庫通配名_時間”
【强制】创建數據庫时必须显式指定字符集，並且字符集只能是utf8或者utf8mb4。创建數據庫SQL举例：create database db1 default character set utf8;。

2.1.2 表结构

【強制】表和列的名稱必須控制在32個字符以內，表名只能使用字母、數字和下劃線，一律小寫。
【強制】表名要求模塊名強相關，如師資系統采用”sz”作爲前綴，渠道系統采用”qd”作爲前綴等。
【強制】創建表時必須顯式指定字符集爲utf8或utf8mb4。
【强制】创建表时必须显式指定表存储引擎类型，如无特殊需求，一律为InnoDB。当需要使用除InnoDB/MyISAM/Memory以外的存储引擎时，必须通过DBA审核才能在生产环境中使用。因爲Innodb表支持事务、行锁、宕机恢复、MVCC等关系型數據庫重要特性，为业界
使用最多的MySQL存儲引擎。而這是其他大多數存儲引擎不具備的，因此首推InnoDB。
【強制】建表必須有comment
【建議】建表時關于主鍵：(1)強制要求主鍵爲id，類型爲int或bigint，且爲auto_increment(2)標識表裏每一行主體的字段不要設爲主鍵，建議設爲其他字段如user_id，order_id等，并建立unique key索引（可参考cdb.teacher表設計）。因爲如果設爲
主鍵且主鍵值爲隨機插入，則會導致innodb內部page分裂和大量隨機I/O，性能下降。
【建議】核心表（如用戶表，金錢相關的表）必須有行數據的創建時間字段create_time和最後更新時間字段update_time，便于查問題。
【建議】表中所有字段必須都是NOT NULL屬性，業務可以根據需要定義DEFAULT值。因爲使用NULL值会存在每一行都会占用额外存储空間、数据迁移容易出错、聚合函数计算结果偏差等问题。
【建議】建議對表裏的blob、text等大字段，垂直拆分到其他表裏，僅在需要讀這些對象的時候才去select。
【建議】反範式設計：把經常需要join查詢的字段，在其他表裏冗余一份。如user_name屬性在user_account，user_login_log等表裏冗余一份，減少join查詢。
【強制】中間表用于保留中間結果集，名稱必須以tmp_開頭。備份表用于備份或抓取源表快照，名稱必須以bak_開頭。中間表和備份表定期清理。
【強制】對于超過100W行的大表進行alter table，必須經過DBA審核，並在業務低峰期執行。因爲alter table會産生表鎖，期間阻塞對于該表的所有寫入，對于業務可能會産生極大影響。

2.1.3 列数据类型优化

【建議】表中的自增列（auto_increment屬性），推薦使用bigint類型。因爲無符號int存儲範圍爲-2147483648~2147483647（大約21億左右），溢出後會導致報錯。
【建議】業務中選擇性很少的狀態status、類型type等字段推薦使用tinytint或者smallint类型节省存储空間。
【建議】業務中IP地址字段推薦使用int類型，不推薦用char(15)。因爲int只占4字節，可以用如下函數相互轉換，而char(15)占用至少15字节。一旦表数据行数到了1亿，那么要多用1.1G存储空間。 SQL：select inet_aton(‘192.168.2.12‘); select in et_ntoa(3232236044); PHP: ip2long(‘192.168.2.12’); long2ip(3530427185);
【建議】不推薦使用enum，set。因为它们浪费空間，且枚举值写死了，变更不方便。推荐使用tinyint或smallint。
【建議】不推薦使用blob，text等类型。它们都比较浪费硬盘和内存空間。在加载表数据时，会读取大字段到内存里从而浪费内存空間，影响系统性能。建议和PM、RD沟通，是否真的需要这么大字段。Innodb中当一行记录超过8098字节时，会将该记录中选取最
長的一個字段將其768字節放在原始page裏，該字段余下內容放在overflow-page裏。不幸的是在compact行格式下，原始page和overflow-page都會加載。
【建議】存儲金錢的字段，建議用int，程序端乘以100和除以100进行存取。因爲int占用4字節，而double占用8字節，空間浪费。
【建議】文本數據盡量用varchar存储。因爲varchar是變長存儲，比char更省空間。MySQL server层规定一行所有文本最多存65535字节，因此在utf8字符集下最多存21844個字符，超过会自动转换为mediumtext字段。而text在utf8字符集下最多存21844
個字符，mediumtext最多存2^24/3個字符，longtext最多存2^32個字符。一般建議用varchar類型，字符數不要超過2700。
【建議】時間類型盡量選取timestamp。因爲datetime占用8字節，timestamp僅占用4字節，但是範圍爲1970-01-01 00:00:01到2038-01-01 00:00:00。更爲高階的方法，選用int來存儲時間，使用SQL函數unix_timestamp()和from_unixtime()來進
行轉換。

2.1.4 索引设计

【強制】InnoDB表必須主鍵爲id int/bigint auto_increment,且主鍵值禁止被更新。
【建議】主鍵的名稱以“pk_”開頭，唯一鍵以“uk_”或“uq_”開頭，普通索引以“idx_”開頭，一律使用小寫格式，以表名/字段的名稱或縮寫作爲後綴。
【強制】InnoDB和MyISAM存儲引擎表，索引類型必須爲BTREE；MEMORY表可以根據需要選擇HASH或者BTREE類型索引。
【強制】單個索引中每個索引記錄的長度不能超過64KB。
【建議】單個表上的索引個數不能超過7個。
【建議】在建立索引時，多考慮建立聯合索引，並把區分度最高的字段放在最前面。如列userid的區分度可由select count(distinct userid)計算出來。
【建議】在多表join的SQL裏，保證被驅動表的連接列上有索引，這樣join執行效率最高。
【建議】建表或加索引時，保證表裏互相不存在冗余索引。對于MySQL來說，如果表裏已經存在key(a,b)，則key(a)爲冗余索引，需要刪除。

2.1.5 分库分表、分区表

【強制】分區表的分區字段（partition-key）必須有索引，或者是組合索引的首列。
【強制】單個分區表中的分區（包括子分區）個數不能超過1024。
【強制】上線前RD或者DBA必須指定分區表的創建、清理策略。
【強制】訪問分區表的SQL必須包含分區鍵。
【建議】單個分區文件不超過2G，總大小不超過50G。建議總分區數不超過20個。
【強制】對于分區表執行alter table操作，必須在業務低峰期執行。
【強制】采用分庫策略的，庫的數量不能超過1024
【強制】采用分表策略的，表的數量不能超過4096
【建議】單個分表不超過500W行，ibd文件大小不超過2G，這樣才能讓數據分布式變得性能更佳。
【建議】水平分表盡量用取模方式，日志、報表類數據建議采用日期進行分表。

2.1.6 字符集

【强制】數據庫本身库、表、列所有字符集必须保持一致，为utf8或utf8mb4。
【强制】前端程序字符集或者环境变量中的字符集，与數據庫、表的字符集必须一致，统一为utf8。

2.1.7 程序层DAO设计建议

【建議】新的代码不要用model，推薦使用手动拼SQL+绑定变量传入参数的方式。因爲model虽然可以使用面向对象的方式操作db，但是其使用不当很容易造成生成的SQL非常复杂，且model层自己做的强制类型转换性能较差，最终导致數據庫性能下降。
【建議】前端程序連接MySQL或者redis，必須要有連接超時和失敗重連機制，且失敗重試必須有間隔時間。
【建議】前端程序報錯裏盡量能夠提示MySQL或redis原生態的報錯信息，便于排查錯誤。
【建議】对于有连接池的前端程序，必须根据业务需要配置初始、最小、最大连接数，超时时间以及连接回收机制，否则会耗尽數據庫连接资源，造成线上事故。
【建議】對于log或history類型的表，隨時間增長容易越來越大，因此上線前RD或者DBA必須建立表數據清理或歸檔方案。
【建議】在应用程序设计阶段，RD必须考虑并规避數據庫中主从延迟对于业务的影响。尽量避免从库短时延迟（20秒以内）对业务造成影响，建议强制一致性的读开启事务走主库，或更新后过一段时间再去读从库。
【建議】多个并发业务逻辑访问同一块数据（innodb表）时，会在數據庫端产生行锁甚至表锁导致并发下降，因此建议更新类SQL尽量基于主键去更新。
【建議】業務邏輯之間加鎖順序盡量保持一致，否則會導致死鎖。
【建議】對于單表讀寫比大于10:1的數據行或單個列，可以將熱點數據放在緩存裏（如mecache或redis），加快訪問速度，降低MySQL壓力。

2.1.8 一个规范的建表语句示例

一個較爲規範的建表語句爲：

CREATE TABLE user (
  `id` bigint(11) NOT NULL AUTO_INCREMENT,
  `user_id` bigint(11) NOT NULL COMMENT ‘用户id’
  `username` varchar(45) NOT NULL COMMENT ‘真实姓名‘,
  `email` varchar(30) NOT NULL COMMENT ‘用户邮箱’,
  `nickname` varchar(45) NOT NULL COMMENT ‘昵称‘,
  `avatar` int(11) NOT NULL COMMENT ‘头像‘,
  `birthday` date NOT NULL COMMENT ‘生日‘,
  `sex` tinyint(4) DEFAULT ‘0‘ COMMENT ‘性别‘,
  `short_introduce` varchar(150) DEFAULT NULL COMMENT ‘一句话介绍自己，最多50个汉字‘,
  `user_resume` varchar(300) NOT NULL COMMENT ‘用户提交的简历存放地址‘,
  `user_register_ip` int NOT NULL COMMENT ‘用户注册时的源ip’,
  `create_time` timestamp NOT NULL COMMENT ‘用户记录创建的时间’,
  `update_time` timestamp NOT NULL COMMENT ‘用户资料修改的时间’,
  `user_review_status` tinyint NOT NULL COMMENT ‘用户资料审核状态，1为通过，2为审核中，3为未通过，4为还未提交审核’,
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_user_id` (`user_id`),
  KEY `idx_username`(`username`),
  KEY `idx_create_time`(`create_time`,`user_review_status`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT=‘网站用户基本信息‘;

2.2 SQL编写

2.2.1 DML语句

【強制】SELECT語句必須指定具體字段名稱，禁止寫成*。因爲select *會將不該讀的數據也從MySQL裏讀出來，造成網卡壓力。且表字段一旦更新，但model層沒有來得及更新的話，系統會報錯。
【強制】insert語句指定具體字段名稱，不要寫成insert into t1 values(…)，道理同上。
【建議】insert into…values(XX),(XX),(XX)…。這裏XX的值不要超過5000個。值過多雖然上線很很快，但會引起主從同步延遲。
【建議】SELECT语句不要使用UNION，推薦使用UNION ALL，並且UNION子句个数限制在5个以内。因爲union all不需要去重，节省數據庫资源，提高性能。
【建議】in值列表限制在500以内。例如select… where userid in(….500个以内…)，这么做是为了减少底层扫描，减轻數據庫压力从而加速查询。
【建議】事务里批量更新数据需要控制数量，进行必要的sleep，做到少量多次。
【強制】事務涉及的表必須全部是innodb表。否則一旦失敗不會全部回滾，且易造成主從庫同步終端。
【強制】寫入和事務發往主庫，只讀SQL發往從庫。
【強制】除靜態表或小表（100行以內），DML語句必須有where條件，且使用索引查找。
【強制】生産環境禁止使用hint，如sql_no_cache，force index，ignore key，straight join等。因爲hint是用來強制SQL按照某個執行計劃來執行，但隨著數據量變化我們無法保證自己當初的預判是正確的，因此我們要相信MySQL優化器！
【強制】where條件裏等號左右字段類型必須一致，否則無法利用索引。
【建議】SELECT|UPDATE|DELETE|REPLACE要有WHERE子句，且WHERE子句的條件必需使用索引查找。
【强制】生产數據庫中强烈不推荐大表上发生全表扫描，但对于100行以下的静态表可以全表扫描。查询数据量不要超过表行数的25%，否则不会利用索引。
【强制】WHERE 子句中禁止只使用全模糊的LIKE条件进行查找，必须有其他等值或范围查询条件，否则无法利用索引。
【建議】索引列不要使用函数或表達式，否则无法利用索引。如where length(name)=‘Admin‘或where user_id+2=10023。
【建議】减少使用or语句，可将or语句優化爲union，然后在各个where条件上建立索引。如where a=1 or b=2優化爲where a=1… union …where b=2, key(a),key(b)。
【建議】分页查询，当limit起点较高时，可先用过滤条件进行过滤。如select a,b,c from t1 limit 10000,20;優化爲: select a,b,c from t1 where id>10000 limit 20;。

2.2.2 多表连接

【强制】禁止跨db的join语句。因爲这样可以减少模块间耦合，为數據庫拆分奠定坚实基础。
【強制】禁止在業務的更新類SQL語句中使用join，比如update t1 join t2…。
【建議】不建议使用子查询，建议将子查询SQL拆开结合程序多次查询，或使用join来代替子查询。
【建議】线上环境，多表join不要超过3个表。
【建議】多表连接查询推荐使用别名，且SELECT列表中要用别名引用字段，數據庫.表格式，如select a from db1.table1 alias1 where …。
【建議】在多表join中，尽量选取结果集较小的表作为驱动表，来join其他表。

2.2.3 事务

【建議】事务中INSERT|UPDATE|DELETE|REPLACE語句操作的行數控制在2000以內，以及WHERE子句中IN列表的傳參個數控制在500以內。
【建議】批量操作数据时，需要控制事务处理间隔时间，进行必要的sleep，一般建议值5-10秒。
【建議】对于有auto_increment屬性字段的表的插入操作，並發需要控制在200以內。
【强制】程序设计必须考虑“數據庫事务隔离级别”带来的影响，包括脏读、不可重复读和幻读。线上建议事务隔离级别为repeatable-read。
【建議】事务里包含SQL不超过5个（支付业务除外）。因爲过长的事务会导致锁数据较久，MySQL内部缓存、连接消耗过多等雪崩问题。
【建議】事务里更新语句尽量基于主键或unique key，如update … where id=XX; 否则会产生间隙锁，内部扩大锁定范围，导致系统性能下降，产生死锁。
【建議】尽量把一些典型外部调用移出事务，如调用webservice，访问文件存储等，从而避免事务过长。
【建議】对于MySQL主从延迟严格敏感的select语句，请开启事务强制访问主库。

2.2.4 排序和分組

【建議】减少使用order by，和業務溝通能不排序就不排序，或將排序放到程序端去做。order by、group by、distinct这些语句较为耗费CPU，數據庫的CPU资源是极其宝贵的。
【建議】order by、group by、distinct這些SQL盡量利用索引直接檢索出排序好的數據。如where a=1 order by b可以利用key(a,b)。
【建議】包含了order by、group by、distinct這些查詢的語句，where條件過濾出來的結果集請保持在1000行以內，否則SQL會很慢。

2.2.5 线上禁止使用的SQL语句

【高危】禁用update|delete t1 … where a=XX limit XX; 这种带limit的更新语句。因爲会导致主从不一致，导致数据错乱。建议加上order by PK。
【高危】禁止使用關聯子查詢，如update t1 set … where name in(select name from user where…);效率極其低下。
【強制】禁用procedure、function、trigger、views、event、外键约束。因爲他们消耗數據庫资源，降低數據庫实例可扩展性。推荐都在程序端实现。
【強制】禁用insert into …on duplicate key update…在高並發環境下，會造成主從不一致。
【強制】禁止聯表更新語句，如update t1,t2 where t1.id=t2.id…。

MySQL數據庫設計規範（僅供參考）

標簽：union all 分組字段名空間編號 from 表達最大 time

原文地址：https://www.cnblogs.com/zeenzhou/p/15054759.html

踩

(0)

贊

(0)

舉報

評論一句话評論（0）

分享檔案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

亚洲春色欧美激情

MySQL數據庫設計規範（僅供參考）

MySQL數據庫設計規範（僅供參考）

目錄

1. 規範背景與目的

2. 設計規範

2.1 數據庫设计

2.1.1 库名

2.1.2 表结构

2.1.3 列数据类型优化

2.1.4 索引设计

2.1.5 分库分表、分区表

2.1.6 字符集

2.1.7 程序层DAO设计建议

2.1.8 一个规范的建表语句示例

2.2 SQL编写

2.2.1 DML语句

2.2.2 多表连接

2.2.3 事务

2.2.4 排序和分組

2.2.5 线上禁止使用的SQL语句