1.数据库基本概念
DQL:数据查询语言(凡是带有select关键字的都是查询语句)
DML:数据操作语言(凡是对表当中的数据进行增删改的都是DML) insert 增 delete 删 update 改
DDL:数据定义语言,凡是带有create、drop、alter的都是DDL DDL主要操作的是表的结构,不是表中的数据,与DML不同
TCL:事务控制语言,包括:事务提交(commit);事务回滚(rollback)
DCL:数据控制语言(例如:授权grant、撤销权限revoke)
在所有的数据库中,单引号是字符串的标准,但是MySQL中可以使用''来定义字符串,不过一般建议用''定义字符串
2.MySQL基本操作
起别名:mysql> select deptno,dname as deptname from dept;(只会改变显示的结果而不会改变原本表中的结果)
条件查询:mysql> select empno,ename from emp where sal > 800; 查询在某个值之间的值:mysql> select empno,ename,sal from emp where sal between 2450 and 3000;
and的优先级比or更高,如果不确定优先级,加小括号就好了
模糊查询:like,支持%或下划线匹配,%匹配任意字符,下划线只匹配一个字符 eg.找出名字中含有o的:select ename from emp where ename like '%o%'; 找出名字以T结尾的:select ename from emp where ename like '%T'; 找出名字第二个字母是A的:select ename from emp where ename like '_A%'; 找出名字第三个字母是'R'的
找出名字中含有'_'的(要使用转义字符):select name from emp where name like '%_%';
排序:
- 查询所有员工工资,排序(升序):mysql> select ename,sal from emp order by sal;
- 查询所有员工工资,排序(降序):mysql> select ename,sal from emp order by sal desc;
- 查询员工的名字和薪资,如果工资一样,按照名字首字母的升序排列:select ename,sal from emp order by sal asc,ename asc;
- 数据处理函数(单行处理函数) 单行处理函数的特点:一个输入对应一个输出 多行处理函数:多个输入对应一个输出
单行处理函数常见的: lower:转成小写:mysql> select lower(ename) from emp; upper:转成大写 str_to_date:将字符串转换为日期 date_format:格式化日期 format:设置千分位 round:四舍五入 rand():生成随机数 ifnull:将null转换成一个具体值 substr:截取字符串:select ename from emp where substr(ename,1,1) = 'A';(选取开头是A的名字) concat:字符串拼接:mysql> select concat(empno,ename) from emp;
分组函数(多行处理函数): 多行处理函数:输入多行,最终输出一行 count:计数 sum:求和 avg:平均值。计算工资的平均值mysql> select avg(sal) from emp; max:最大值 min:最小值 注意:分组函数在使用的时候必须先进行分组,然后才能使用。如果没有对数据进行分组,整张表默认为一组。
注意事项: 1. 分组函数会自动处理null,不用处理null 2. count(具体字段):表示统计该字段下所有不为null的元素的总和 count(*):统计表当中的总行数(只要有一行数据存在不为空就++) 3. 分组函数不能直接使用在where语句中 4. 所有的分组函数可以组合起来一起使用
- 分组查询 在实际的应用中,可能有这样的需求,需要先进行分组,然后对每一分组进行操作,这时候就要进行分组查询。 语法为:select ... from ... group by ... 为什么分组函数不能用在where后面:因为分组函数在使用的时候,必须先分组后才能使用,where执行的时候,还没有分组,所以where后面不能出现分组函数。
关键字的执行顺序: 1.from 2.where 3.group by 4.select 5.order by
结论:在一条select语句中,如果有group by语句的话,select后面只能跟:参加分组的字段,以及分组函数。其他的一律不能跟。
找出每个部门的最高薪资:mysql> select deptno,max(sal) from emp group by deptno;
mysql> select job,deptno,max(sal) from emp group by job,deptno;
- 找出每个部门的最高薪资,并且薪资大于3000:mysql> select deptno,max(sal) from emp group by deptno having max(sal) > 3000; 使用的是having语句,当分组完之后还需要过滤的话就需要saving语句,saving必须与group by一起使用,且不能代替where语句。
优化策略:where和having,优先选择where,where实在完成不了的话,再选择having。
- 去除重复数据:使用关键字(distinct) mysql> select distinct job,deptno from emp;
distinct出现在job,deptno两个字段之前,表示两个字段联合起来去重。mysql> select distinct job,deptno from emp;
- 连接查询 从一张表中单独查询,称为单表查询。emp表和sept表联合起来查询数据,从emp表中取员工名字,从dept表中取部门名字。这种跨表查询,多张表联合起来查询数据,被称为连接查询。
表连接的分类:
- 内连接: 等值连接 非等值连接 自连接
- 外连接 左外连接(左连接) 右外连接(右连接)
笛卡尔积:当两张表进行连接查询,没有任何条件限制的时候,最终查询结果条数,是两张表的条数的总和。这种现象称为笛卡尔积现象。
避免笛卡尔积现象:连接时加条件,满足条件的被筛选出来
mysql> select ename,dname from emp,dept where emp.deptno = dept.deptno; 最终的查询结果数是14条,但是匹配的过程中,匹配的次数并没有减少,只不过是进行了四选一。
内连接之等值连接: 查询每个员工所在部门名称,显示员工名1和部门名,条件是:e.deptno = d..deptno;
SQL99的语法和之前的不太一样: mysql> select e.ename,d.dname from emp e join dept d on e.deptno = d.deptno;
- 对比:
- mysql> select ename,dname from emp,dept where emp.deptno = dept.deptno;//这是SQL92,结构不清晰,表的连接条件和后期进一步筛选的条件都放到了一起,都放到了where后面。
- mysql> select e.ename,d.dname from emp e join dept d on e.deptno = d.deptno;//表的连接条件是独立的,连接之后,如果还需要进一步筛选,可以再往后继续添加where
SQL99的语法:select ... from a join b on a连接b的条件 where 筛选条件
内连接之非等值连接 有下表: +-------+--------+-----------+------+------------+---------+---------+--------+ | EMPNO | ENAME | JOB | MGR | HIREDATE | SAL | COMM | DEPTNO | +-------+--------+-----------+------+------------+---------+---------+--------+ | 7369 | SMITH | CLERK | 7902 | 1980-12-17 | 800.00 | NULL | 20 | | 7499 | ALLEN | SALESMAN | 7698 | 1981-02-20 | 1600.00 | 300.00 | 30 | | 7521 | WARD | SALESMAN | 7698 | 1981-02-22 | 1250.00 | 500.00 | 30 | | 7566 | JONES | MANAGER | 7839 | 1981-04-02 | 2975.00 | NULL | 20 | | 7654 | MARTIN | SALESMAN | 7698 | 1981-09-28 | 1250.00 | 1400.00 | 30 | | 7698 | BLAKE | MANAGER | 7839 | 1981-05-01 | 2850.00 | NULL | 30 | | 7782 | CLARK | MANAGER | 7839 | 1981-06-09 | 2450.00 | NULL | 10 | | 7788 | SCOTT | ANALYST | 7566 | 1987-04-19 | 3000.00 | NULL | 20 | | 7839 | KING | PRESIDENT | NULL | 1981-11-17 | 5000.00 | NULL | 10 | | 7844 | TURNER | SALESMAN | 7698 | 1981-09-08 | 1500.00 | 0.00 | 30 | | 7876 | ADAMS | CLERK | 7788 | 1987-05-23 | 1100.00 | NULL | 20 | | 7900 | JAMES | CLERK | 7698 | 1981-12-03 | 950.00 | NULL | 30 | | 7902 | FORD | ANALYST | 7566 | 1981-12-03 | 3000.00 | NULL | 20 | | 7934 | MILLER | CLERK | 7782 | 1982-01-23 | 1300.00 | NULL | 10 | +-------+--------+-----------+------+------------+---------+---------+--------+
薪资等级表: +-------+-------+-------+ | GRADE | LOSAL | HISAL | +-------+-------+-------+ | 1 | 700 | 1200 | | 2 | 1201 | 1400 | | 3 | 1401 | 2000 | | 4 | 2001 | 3000 | | 5 | 3001 | 9999 | +-------+-------+-------+ 找出每个员工的薪资等级,要求显示员工名、薪资、薪资与等级。 mysql> select e.ename,e.sal,s.grade from emp e join salgrade s on e.sal between s.losal and s.hisal;
内连接之自连接 查询员工的上级领导,要求显示员工名和对应的领导名。 对应的技巧就是将一张表看成两张表。 mysql> select a.ename as '员工名',b.ename as '领导名' from emp a join emp b on a.mgr = b.empno; +-----------+-----------+ | 员工名 | 领导名 | +-----------+-----------+ | SMITH | FORD | | ALLEN | BLAKE | | WARD | BLAKE | | JONES | KING | | MARTIN | BLAKE | | BLAKE | KING | | CLARK | KING | | SCOTT | JONES | | TURNER | BLAKE | | ADAMS | SCOTT | | JAMES | BLAKE | | FORD | JONES | | MILLER | CLARK | +-----------+-----------+
外连接 员工表: +-------+--------+-----------+------+------------+---------+---------+--------+ | EMPNO | ENAME | JOB | MGR | HIREDATE | SAL | COMM | DEPTNO | +-------+--------+-----------+------+------------+---------+---------+--------+ | 7369 | SMITH | CLERK | 7902 | 1980-12-17 | 800.00 | NULL | 20 | | 7499 | ALLEN | SALESMAN | 7698 | 1981-02-20 | 1600.00 | 300.00 | 30 | | 7521 | WARD | SALESMAN | 7698 | 1981-02-22 | 1250.00 | 500.00 | 30 | | 7566 | JONES | MANAGER | 7839 | 1981-04-02 | 2975.00 | NULL | 20 | | 7654 | MARTIN | SALESMAN | 7698 | 1981-09-28 | 1250.00 | 1400.00 | 30 | | 7698 | BLAKE | MANAGER | 7839 | 1981-05-01 | 2850.00 | NULL | 30 | | 7782 | CLARK | MANAGER | 7839 | 1981-06-09 | 2450.00 | NULL | 10 | | 7788 | SCOTT | ANALYST | 7566 | 1987-04-19 | 3000.00 | NULL | 20 | | 7839 | KING | PRESIDENT | NULL | 1981-11-17 | 5000.00 | NULL | 10 | | 7844 | TURNER | SALESMAN | 7698 | 1981-09-08 | 1500.00 | 0.00 | 30 | | 7876 | ADAMS | CLERK | 7788 | 1987-05-23 | 1100.00 | NULL | 20 | | 7900 | JAMES | CLERK | 7698 | 1981-12-03 | 950.00 | NULL | 30 | | 7902 | FORD | ANALYST | 7566 | 1981-12-03 | 3000.00 | NULL | 20 | | 7934 | MILLER | CLERK | 7782 | 1982-01-23 | 1300.00 | NULL | 10 | +-------+--------+-----------+------+------------+---------+---------+--------+
部门表: +--------+------------+----------+ | DEPTNO | DNAME | LOC | +--------+------------+----------+ | 10 | ACCOUNTING | NEW YORK | | 20 | RESEARCH | DALLAS | | 30 | SALES | CHICAGO | | 40 | OPERATIONS | BOSTON | +--------+------------+----------+
找出每个员工对应的岗位:mysql> select e.ename,d.dname from emp e join dept d on e.deptno = d.deptno; +--------+------------+ | ename | dname | +--------+------------+ | SMITH | RESEARCH | | ALLEN | SALES | | WARD | SALES | | JONES | RESEARCH | | MARTIN | SALES | | BLAKE | SALES | | CLARK | ACCOUNTING | | SCOTT | RESEARCH | | KING | ACCOUNTING | | TURNER | SALES | | ADAMS | RESEARCH | | JAMES | SALES | | FORD | RESEARCH | | MILLER | ACCOUNTING | +--------+------------+ 内连接的特点:完成能够匹配上这个连接的才显示出来
外连接查询:mysql> select e.ename,d.dname from emp e right (outer) join dept d on e.deptno = d.deptno;(右外连接,right表示将join关键字右边的表看成主表,主要是为了将这张表的数据全部查询出来,捎带着关联查询左边的表)outer关键字可以省略 在外连接中,两张表连接产生了主次关系。外连接的查询结果条数>=内连接的查询结果条数 +--------+------------+ | ename | dname | +--------+------------+ | MILLER | ACCOUNTING | | KING | ACCOUNTING | | CLARK | ACCOUNTING | | FORD | RESEARCH | | ADAMS | RESEARCH | | SCOTT | RESEARCH | | JONES | RESEARCH | | SMITH | RESEARCH | | JAMES | SALES | | TURNER | SALES | | BLAKE | SALES | | MARTIN | SALES | | WARD | SALES | | ALLEN | SALES | | NULL | OPERATIONS | +--------+------------+
- 三张表和四张表的连接方式
语法:select ... from a join b on a和b的连接条件 join c on a和c的连接条件 join d on a和d的连接条件(一条SQL中内连接和外连接可以混合,都可以出现) eg.找出每个员工的部门名称及工资等级,要求显示员工名、部门名、薪资、薪资等级
新用到的表如下: +-------+-------+-------+ | GRADE | LOSAL | HISAL | +-------+-------+-------+ | 1 | 700 | 1200 | | 2 | 1201 | 1400 | | 3 | 1401 | 2000 | | 4 | 2001 | 3000 | | 5 | 3001 | 9999 | +-------+-------+-------+
实现:mysql> select e.ename,e.sal,d.dname,s.grade from emp e join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal; +--------+---------+------------+-------+ | ename | sal | dname | grade | +--------+---------+------------+-------+ | SMITH | 800.00 | RESEARCH | 1 | | ALLEN | 1600.00 | SALES | 3 | | WARD | 1250.00 | SALES | 2 | | JONES | 2975.00 | RESEARCH | 4 | | MARTIN | 1250.00 | SALES | 2 | | BLAKE | 2850.00 | SALES | 4 | | CLARK | 2450.00 | ACCOUNTING | 4 | | SCOTT | 3000.00 | RESEARCH | 4 | | KING | 5000.00 | ACCOUNTING | 5 | | TURNER | 1500.00 | SALES | 3 | | ADAMS | 1100.00 | RESEARCH | 1 | | JAMES | 950.00 | SALES | 1 | | FORD | 3000.00 | RESEARCH | 4 | | MILLER | 1300.00 | ACCOUNTING | 2 | +--------+---------+------------+-------+
eg.找出每个员工的部门名称以及工资等级,还有上级领导,要求显示员工名、领导名、部门名、薪资、薪资等级。 mysql> select e.ename,e.sal,d.dname,s.grade,l.ename from emp e join dept d on e.deptno = d.deptno join salgrade s on e.sal between s.losal and s.hisal left join emp l on e.mgr = l.empno;
+--------+---------+------------+-------+-------+ | ename | sal | dname | grade | ename | +--------+---------+------------+-------+-------+ | SMITH | 800.00 | RESEARCH | 1 | FORD | | ALLEN | 1600.00 | SALES | 3 | BLAKE | | WARD | 1250.00 | SALES | 2 | BLAKE | | JONES | 2975.00 | RESEARCH | 4 | KING | | MARTIN | 1250.00 | SALES | 2 | BLAKE | | BLAKE | 2850.00 | SALES | 4 | KING | | CLARK | 2450.00 | ACCOUNTING | 4 | KING | | SCOTT | 3000.00 | RESEARCH | 4 | JONES | | KING | 5000.00 | ACCOUNTING | 5 | NULL | | TURNER | 1500.00 | SALES | 3 | BLAKE | | ADAMS | 1100.00 | RESEARCH | 1 | SCOTT | | JAMES | 950.00 | SALES | 1 | BLAKE | | FORD | 3000.00 | RESEARCH | 4 | JONES | | MILLER | 1300.00 | ACCOUNTING | 2 | CLARK | +--------+---------+------------+-------+-------+
- 子查询 select语句中嵌套select,被嵌套的select语句称为子查询。
- where子句中的子查询 eg.找出比最低工资高的员工姓名和工资 由于where子句中不能直接使用分组函数,所以使用嵌套 mysql> select ename,sal from emp where sal > (select min(sal) from emp);
结果为: +--------+---------+ | ename | sal | +--------+---------+ | ALLEN | 1600.00 | | WARD | 1250.00 | | JONES | 2975.00 | | MARTIN | 1250.00 | | BLAKE | 2850.00 | | CLARK | 2450.00 | | SCOTT | 3000.00 | | KING | 5000.00 | | TURNER | 1500.00 | | ADAMS | 1100.00 | | JAMES | 950.00 | | FORD | 3000.00 | | MILLER | 1300.00 | +--------+---------+
- from子句中的子查询 注意:from后面的子查询,可以将子查询的查询结果当作一张临时表。 eg.找出每个岗位的平均工资的薪资等级 实现:mysql> select t.*,s.grade from (select job,avg(sal) as avgsal from emp group by job) t join salgrade s on t.avgsal between s.losal and s.hisal;
结果: +-----------+-------------+-------+ | job | avgsal | grade | +-----------+-------------+-------+ | CLERK | 1037.500000 | 1 | | SALESMAN | 1400.000000 | 2 | | MANAGER | 2758.333333 | 4 | | ANALYST | 3000.000000 | 4 | | PRESIDENT | 5000.000000 | 5 | +-----------+-------------+-------+ (select job,avg(sal) as avgsal from emp group by job)相当于一个新的表avgsal,是临时的表。
select后面出现的子查询 eg.找出每个员工的部门名称,要求显示员工名,部门名 实现:mysql> select e.ename,(select d.dname from dept d where e.deptno = d.deptno) as dname from emp e; 结果: +--------+------------+ | ename | dname | +--------+------------+ | SMITH | RESEARCH | | ALLEN | SALES | | WARD | SALES | | JONES | RESEARCH | | MARTIN | SALES | | BLAKE | SALES | | CLARK | ACCOUNTING | | SCOTT | RESEARCH | | KING | ACCOUNTING | | TURNER | SALES | | ADAMS | RESEARCH | | JAMES | SALES | | FORD | RESEARCH | | MILLER | ACCOUNTING | +--------+------------+
union合并查询结果集 eg.查询工作岗位是MANAGER和SALESMAN的员工 方法1:select ename,job from emp where job = 'MANAGER' or job = 'SALESMAN'; 方法2:select ename,job from emp where job in('MANAGER','SALESMAN'); 方法3:select ename,job from emp where job = 'MANAGER' union select ename,job from emp where job = 'SALESMAN'; (这里的方法3的效率最高) 结果: +--------+----------+ | ename | job | +--------+----------+ | JONES | MANAGER | | BLAKE | MANAGER | | CLARK | MANAGER | | ALLEN | SALESMAN | | WARD | SALESMAN | | MARTIN | SALESMAN | | TURNER | SALESMAN | +--------+----------+ union在进行结果合并时,要求两个结果集的列数相等。
limit的作用 将查询结果的一部分取出来,通常使用在分页查询中。 eg.按照工资降序,取出排名在前5名的员工 实现:mysql> select ename,sal from emp order by sal desc limit 5; 结果: +-------+---------+ | ename | sal | +-------+---------+ | KING | 5000.00 | | SCOTT | 3000.00 | | FORD | 3000.00 | | JONES | 2975.00 | | BLAKE | 2850.00 | +-------+---------+
完整用法:limit startIndex,length MySQL中的limit在order by之后执行。
分页 limit (pageNo - 1) * pageSize,pageSize;
DQL语句的总结 select ... from ... where ... group by ... having ... order by ... limit ...
3. 数据库基本操作2(DDL)
表的创建 语法格式:create table 表名(字段1 数据类型, 字段2 数据类型, 字段3 数据类型); 表名建议以t_或者tbl_开始,可读性强。;见名知义
MySQL数据类型 varchar:可变长度的字符串,比较智能,节省空间,会根据实际的数据长度动态分配空间。 char:定长字符串,固定长度空间去存储数据数据。速度快,使用不当可能会造成空间的浪费。 int: longint:长整型 float: double: date:短日期类型 datetime:长日期类型 clob:字符大对象,最多可以存储4G的字符串,超过255个字符的都要采用CLOB大对象来存储。 blob:二进制大对象,专门用来存储图片、声音、视频等流媒体数据。插入数据时,要使用IO流。
创建表例子 mysql> create table t_student(no int, name varchar(32), sex char(1), age int(3), email varchar(255));
删除表:drop table if exists t_student;
- 插入数据(DML) 语法:insert into 表名(字段1,字段2,字段3) values(值1,值2,值3); 注意:字段名和值要一一对应
eg. mysql> insert into t_student(no,name,sex,age,email) values(1,'zhangsan','m',19,'zhangsan@gmail.com');
如果没有在创建的时候指定的话,默认值是null。 前面的字段名省略的话,等于都写上了,所以值也都要写上。
- insert插入日期 数字格式化:format 千分位显示:mysql> select ename,format(sal,'$999,999') as sal from emp; 结果: +--------+-------+ | ename | sal | +--------+-------+ | SMITH | 800 | | ALLEN | 1,600 | | WARD | 1,250 | | JONES | 2,975 | | MARTIN | 1,250 | | BLAKE | 2,850 | | CLARK | 2,450 | | SCOTT | 3,000 | | KING | 5,000 | | TURNER | 1,500 | | ADAMS | 1,100 | | JAMES | 950 | | FORD | 3,000 | | MILLER | 1,300 | +--------+-------+
str_to_date:将字符串varchar类型转化为date类型 格式:str_to_date('字符串日期','日期格式') mysql日期格式: %Y 年,%m 月,%d 日,%h 时,%i 分,%s 秒
data_format:将data类型转换为varchar类型 格式:data_format(日期类型数据,'日期格式')
*** 数据库的命名规范:所有的标识符都是全部小写,单词和单词之间用下划线分割。
mysql> insert into t_user(id,name,birth) values(1,'zhangsan',str_to_date('01-10-1990','%d-%m-%Y'));
结果: +------+----------+------------+ | id | name | birth | +------+----------+------------+ | 1 | zhangsan | 1990-10-01 | +------+----------+------------+
str_to_date函数可以把字符串varchar转换成日期,通常使用在insert里面,如果提供的日期字符串时%Y-%m-%d的格式,那么就不需要用该函数也可以达到一样的效果。
mysql> select id,name,date_format(birth,'%m/%d%Y') as birthday from t_user;
结果: +------+----------+-----------+ | id | name | birthday | +------+----------+-----------+ | 1 | zhangsan | 10/011990 | | 2 | lisi | 12/251991 | +------+----------+-----------+
mysql> select * from t_user; +------+----------+------------+ | id | name | birth | +------+----------+------------+ | 1 | zhangsan | 1990-10-01 | | 2 | lisi | 1991-12-25 | +------+----------+------------+ 上述的SQL语句其实是对数据进行了默认的数据类型转换,转换成为了varchar类型,且遵从的格式是:%Y-%d-%m
- date和datetime两个类型的区别 date是短日期:只包括年月日信息。 datetime:包括年月日时分秒信息。
短日期默认格式:%Y-%m-%d 长日期默认格式:%Y-%m-%d %h:%i:%s
eg.mysql> insert into t_user1 values(1,'zhangsan','1999-10-1 15:23:10'); 结果: +------+----------+------------+---------------------+ | id | name | birth | create_time | +------+----------+------------+---------------------+ | 1 | zhangsan | 1999-10-01 | 2000-02-04 13:23:10 | +------+----------+------------+---------------------+
mysql获取当前时间:now(),获取的时间是datetime类型的
- 修改(update DML语句) update 表名 set 字段名1=值1,字段名2=值2,字段名3=值3... where 条件
eg. mysql> update t_user1 set name = 'jack', birth = '2000-10-11' where id = 2;
- 删除delete(DML) 语法:delete from 表名 where 条件; 没有条件的话,整张表的数据会全部删除。
eg. delete from t_user where id=2;
一次插入多条数据 insert into t_user1(id,name,birth,create_time) values(3,'zs','1999-10-8',now()),(4,'zs','1999-10-8',now()),(3,'zs','1999-10-8',now());
快速创建一张表 mysql> create table emp2 as select * from t_user1;(完成的是表的快速复制) 查询部分结果保留为一张表: create table mytable as select empno,ename from emp where job = 'MANAGER';
将查询到的结果插入到另一张表中:mysql> insert into dept_bak select * from dept;
- 删除大表 delete from dept_bak; delete删除数据的时候,只是删除了数据,而这个数据在硬盘上的存储空间不会被删除,就相当于回收站的功能,缺点是删除效率比较低,优点是,支持回滚,后悔可以恢复。
另一种删除数据的方法:truncate。删除的效率比较高,表被一次截断,物理删除。这种删除不支持回滚。 用法:truncate table dept_bak;(属于DDL操作)
删除表的操作:drop table 表名;//这不是删除表中的数据,而是把表删除。
对表结构的增删改 很少进行表结构的修改,因为修改表结构成本较高。不需要写道程序中。
约束 约束的作用是为了保证表中的数据有效。 约束的分类:
- 非空约束(not null)
- 唯一性约束(unique)
- 主键约束(primary key)(简称PK)
- 外键约束(foreign key)(简称FK)
- 检查约束(check)(MySQL不支持,Oracle支持)
非空约束:not null 非空约束not null约束的字段不能为null,创建的时候可以加
create table t_vip(id int,name varchar(255) not null);
唯一性约束
如何创建两个联合起来唯一的? create table t_vip( id int, name varchar(255), email varchar(255), unique(name,email)//表级约束 ) unique有表级约束而not null 没有
- 主键约束 在MySQL中,如果一个字段同时被not null约束的话,该字段自动变为主键字段。(Oracle中不一样) 主键值是每一行记录的唯一标识,主键值是每一行记录的身份证号。
create table t_vip( id int primary key, name varchar(255) );
表级约束主要是用来给多个字段联合起来添加约束。 联合起来做主键: mysql> create table t_vip(id int,name varchar(255), email varchar(255), primary key(id,name));
在实际开发中不建议使用复合主键,复合主键比较复杂。 一张表,主键约束只能添加一个。 主键值建议使用:int,bigint,char等类型,不建议使用:varchar类型。主键值一般都是数字,一般是定长的。
主键的分类:自然主键和业务主键。 自然主键:主键值是一个自然数,和业务没关系。 业务主键:主键值和业务紧密关联,例如拿银行卡账号作主键值。
实际开发中使用自然主键的多,因为主键只需要做到不重复即可,不需要有意义。当业务发生变化时,可能会影响到主键值,所以业务主键不建议使用。
自增给自动维护一个主键值: create table t_vip2( id int primary key auto_increment, name varchar(255) ); insert into t_vip2(name) values('zhangsan'); insert into t_vip2(name) values('zhangsan'); insert into t_vip2(name) values('zhangsan'); insert into t_vip2(name) values('zhangsan'); insert into t_vip2(name) values('zhangsan'); insert into t_vip2(name) values('zhangsan'); 创建的表如下: +----+----------+ | id | name | +----+----------+ | 1 | zhangsan | | 2 | zhangsan | | 3 | zhangsan | | 4 | zhangsan | | 5 | zhangsan | | 6 | zhangsan | +----+----------+
外键约束(very important)FK 外键约束就是为了减少数据的冗余度,有一张t_class作为父表(用作约束),t_student是子表(施加约束)。 删除表的顺序:先删除子表,再删除父表 创建表的顺序:先创建父表,再创建子表 删除数据的顺序:先删除子表数据,再删除父表数据 插入数据的顺序:先插入父表,再插入子表
create table t_class( classno int primary key, classname varchar(255) ); create table t_student( no int primary key auto_increment, name varchar(255), cno int, foreign key(cno) references t_class(classno) );
数据库了解内容
- 存储引擎 存储引擎是MySQL中的特有的一个术语,实际上存储引擎是一个表,表存储数据的方式不同。
怎么给表添加指定的存储引擎? show create table t_student; 可以在建表的时候,可以在最后的后面使用ENGINE来指定存储引擎,CHARSET表示这张表的字符编码方式。MySQL的默认存储引擎是innodb。 MySQL支持九大存储引擎。
- 不同的存储引擎
- MYISAM存储引擎 使用三个文件表示表: 格式文件:存储表结构的定义(mytable.frm) 数据文件:存储表行的内容(mytable.MYD) 索引文件:存储表上的索引(mytable.MYI)
可被转换为压缩、只读表来节省空间。对于一张表来说,只要加有主键或者unique类型的,都会被自动加以索引。
- InnoDB存储引擎 是MySQL默认存储引擎,同时也是一个重量级的存储引擎。InnoDB支持事务,支持数据库崩溃后自动恢复机制。InnoDB存储引擎最主要的特点是:非常安全。
管理的表具有以下特征: - 每个InnoDB表在数据库目录中以.frm格式文件表示 - InnoDB表空间tablespace被用于存储表的内容 - 提供一组用来记录事务性活动的日志文件 - 用COMMIT(提交)、SAVEPOINT及ROLLBACK支持事务处理 - 提供全ACID兼容 - 在MySQL服务器崩溃后自动恢复 - 多版本和行级锁定 - 支持外键及引用的完整性,包括级联删除和更新 效率不是很高,也不能压缩,不能转换为只读,不能很好的节省存储空间。
- MEMORY存储引擎 使用MEMORY存储引擎的表,其数据存储在内存中,且行的长度固定。MEMORY存储引擎管理的表具有以下特征:
- 在数据库目录内,每个表都是以.frm格式文件存储。
- 表级锁机制
- 不能包含TEXT或BLOB字段 优点:查询效率是最高的,不需要和硬盘进行交互 缺点:不安全,关机之后数据消失,因为数据和索引都是在内存中
4. 事务
一个事务其实就是一个完整的业务逻辑。只有DML语句(insert、delete、update)才和事务有关系。因为只有以上的三条语句是数据库表中的增删改的,一旦涉及到数据的增删改就必须考虑到安全问题。正是因为做某件事的时候,需要多条DML语句共同联合在一起才能完成,所以需要事务的存在。本质上,一个事务就是多条DML语句同时成功或者同时失败。
事务是如何做到同时成功或者同时失败的?前文讲到,InnoDB提供了一组用来记录事务性活动的日志文件。在事务的执行过程中,,每一条DML的操作都会记录到日志文件中,在事务的执行过程中,既可以提交事务,也可以回滚事务。
- 提交事务:清空事务性活动的日志文件将数据全部彻底持久化到数据库表中,提交事务标志着事务的结束,并且是一种全部成功的标志
- 回滚事务:将之前所有的DML操作全部撤销,并且清空事务性活动的日志文件。回滚事务标志着事务的结束,并且是一种全部失败的结束。
在MySQL中,提交事务:commit语句,回滚事务:rollback(回滚永远只是回滚到上一次的提交点)。MySQL默认情况下是支持自动提交事务的,每执行一条DML语句,则提交一次。将MySQL自动提交关闭的方法是:start transaction
MySQL中的自动提交其实是不符合开发习惯的,为了保证数据的安全,必须要求同时成功之后再提交,不能执行一条就提交一条。
4.1 事务的4个特性
A: 原子性
说明事务时最小的工作单元,不可再分
C:一致性
所有的事务要求,在同一个事务当中,所有的操作必须同时成功或者同时失败,以保证数据的一致性。
I:隔离性
A事务和B事务之间有一定的距离。
D:持久性
事务最终结束的一个保障,就相当于将没有保存在硬盘上的数据保存在硬盘上。
4.2 事务的隔离级别
读未提交:read uncommitted(最低的隔离级别)
事务A可以读取到事务B未提交的数据,可能出现脏读的现象。这种隔离级别一般都是理论上的,大多数的数据库的隔离级别都是二档起步的。
读已提交:read committed
事务A只能读取到事务B提交之后的数据。解决了脏读的问题,但是引入了新的问题。
- 不可重复读取数据:在事务开启之后,第一次读取到的数据是3条,当前事务还没有结束,可能第二次再读取的时候,独到的数据是4条,3!=4称为不可重复读取。
这种隔离级别是比较真实的数据,每一次读到的数据是绝对的真实,Oracle数据库默认的隔离级别是:read uncommitted
可重复度:repeatable read(提交之后也读不到,永远读取的是刚开启事务时的数据)
事务A开启之后,不管过去多久,每一次在事务A中读取到的数据都是一致的,即使事务B将数据已经修改了,并且提交,事务A读取的数据还是没有发生改变,这就是可重复读。这种解决了不可重复读取的问题。这是MySQL的默认隔离级别。但是引入了新的问题:
- 每次读取到的数据都是幻象,不够真实,出现幻影读。
序列换/串行化:serializable(最高的隔离级别)
最高隔离级别,效率最低,解决了所有的问题,表示事务排队,不能并发。每一次读取到的数据都是最真实的,并且效率是最低的。
5. 索引
索引是在数据库表的字段上添加的,是为了提高查询效率存在的一种机制。一张表的一个字段可以添加一个索引,当然,多个字段联合起来也可以添加索引。索引相当于一本书的目录,是为了缩小扫描范围而存在的一种机制。
t_user id(idIndex) name(nameIndex) email(emailIndex) address (emailAddressIndex) ---------------------------------------------------------------------------------- 1 zhangsan... 2 lisi 3 wangwu 4 zhaoliu 5 hanmeimei 6 jack
select * from t_user where name = 'jack';
以上的这条SQL语句会去name字段上扫描,为什么?
因为查询条件是:name='jack'
如果name字段上没有添加索引(目录),或者说没有给name字段创建索引,MySQL会进行全扫描,会将name字段上的每一个值都比对一遍。效率比较低。在mysql数据库当中索引也是需要排序的,并且这个所以的排序和TreeSet数据结构相同。TreeSet(TreeMap)底层是一个自平衡的二叉树!在mysql当中索引是一个B-Tree数据结构。(遵循左小右大的原则存放,采用中序遍历的方式来取数据)
5.1 索引的实现原理
1 | 假设有一张用户表:t_user |
提醒1:在任何数据库当中主键上都会自动添加索引对象,id字段上自动有索引,因为id是PK。另外在mysql当中,一个字段上如果有unique约束的话,也会自动创建索引对象。
提醒2:在任何数据库当中,任何一张表的任何一条记录在硬盘存储上都有一个硬盘的物理存储编号。
提醒3:在mysql当中,索引是一个单独的对象,不同的存储引擎以不同的形式存在,在MyISAM存储引擎中,索引存储在一个.MYI文件中。在InnoDB存储引擎中索引存储在一个逻辑名称叫做tablespace的当中。在MEMORY存储引擎当中索引被存储在内存当中。不管索引存储在哪里,索引在mysql当中都是一个树的形式存在。(自平衡二叉树:B-Tree)
在MySQL中,主键上以及unique字段上都会自动添加索引,给字段添加索引的条件:
条件1:数据量庞大(到底有多么庞大算庞大,这个需要测试,因为每一个硬件环境不同) 条件2:该字段经常出现在where的后面,以条件的形式存在,也就是说这个字段总是被扫描。 条件3:该字段很少的DML(insert delete update)操作。(因为DML之后,索引需要重新排序。)
建议不要随意添加索引,因为索引也是需要维护的,太多的话反而会降低系统的性能。建议通过主键查询,建议通过unique约束的字段进行查询,效率是比较高的。
5.2 索引的创建和删除
创建索引:
mysql> create index emp_ename_index on emp(ename); 给emp表的ename字段添加索引,起名:emp_ename_index
删除索引:
mysql> drop index emp_ename_index on emp; 将emp表上的emp_ename_index索引对象删除。
索引失效的情况:
select * from emp where ename like '%T';
1
2
3
4ename上即使添加了索引,也不会走索引,为什么?
原因是因为模糊匹配当中以“%”开头了!
尽量避免模糊查询的时候以“%”开始。
这是一种优化的手段/策略。使用or的时候会失效,如果使用or那么要求or两边的条件字段都要有索引,才会走索引,如果其中一边有一个字段没有索引,那么另一个字段上的索引也会实现。所以这就是为什么不建议使用or的原因。
mysql> explain select * from emp where ename = 'KING' or job = 'MANAGER';
使用复合索引的时候,没有使用左侧的列查找,索引失效 什么是复合索引? 两个字段,或者更多的字段联合起来添加一个索引,叫做复合索引。
create index emp_job_sal_index on emp(job,sal); mysql> explain select * from emp where job = 'MANAGER';
在where当中索引列参加了运算,索引失效。
1
2mysql> create index emp_sal_index on emp(sal);
explain select * from emp where sal = 800;在where当中索引列使用了函数
1
explain select * from emp where lower(ename) = 'smith';
6. 视图
视图view:站在不同的角度去看待同一份数据。
怎么创建视图对象?怎么删除视图对象?
1 | 表复制: |
用视图做什么?
我们可以面向视图对象进行增删改查,对视图对象的增删改查,会导致
原表被操作!(视图的特点:通过对视图的操作,会影响到原表数据。)
//面向视图查询
select * from dept2_view;
// 面向视图插入
insert into dept2_view(deptno,dname,loc) values(60,'SALES', 'BEIJING');
// 查询原表数据
mysql> select * from dept2;
+--------+------------+----------+
| DEPTNO | DNAME | LOC |
+--------+------------+----------+
| 10 | ACCOUNTING | NEW YORK |
| 20 | RESEARCH | DALLAS |
| 30 | SALES | CHICAGO |
| 40 | OPERATIONS | BOSTON |
| 60 | SALES | BEIJING |
+--------+------------+----------+
// 面向视图删除
mysql> delete from dept2_view;
// 查询原表数据
mysql> select * from dept2;
Empty set (0.00 sec)
1 | // 创建视图对象 |
视图对象在实际开发中到底有什么用?《方便,简化开发,利于维护》
1 | create view |
假设有一条非常复杂的SQL语句,而这条SQL语句需要在不同的位置上反复使用。每一次使用这个sql语句的时候都需要重新编写,很长,很麻烦,怎么办?可以把这条复杂的SQL语句以视图对象的形式新建。在需要编写这条SQL语句的位置直接使用视图对象,可以大大简化开发。并且利于后期的维护,因为修改的时候也只需要修改一个位置就行,只需要修改视图对象所映射的SQL语句。我们以后面向视图开发的时候,使用视图的时候可以像使用table一样。可以对视图进行增删改查等操作。视图不是在内存当中,视图对象也是存储在硬盘上的,不会消失。
再提醒一下: 视图对应的语句只能是DQL语句。 但是视图对象创建完成之后,可以对视图进行增删改查等操作。
小插曲: 增删改查,又叫做:CRUD。CRUD是在公司中程序员之间沟通的术语。一般我们很少说增删改查。一般都说CRUD。
C:Create(增) R:Retrive(查:检索) U:Update(改) D:Delete(删)
7. 数据库设计范式
第一范式:要求任何一张表必须有主键,每一个字段原子性不可再分。
第二范式:建立在第一范式的基础之上,要求所有非主键字段完全依赖主键,不要产生部分依赖。
第三范式:建立在第二范式的基础之上,要求所有非主键字段直接依赖主键,不要产生传递依赖。
设计数据库表的时候,按照以上的范式进行,可以避免表中数据的冗余,空间的浪费。
7.1 第一范式
最核心,最重要的范式,所有表的设计都需要满足。必须有主键,并且每一个字段都是原子性不可再分。
1 | 学生编号 学生姓名 联系方式 |
7.2 第二范式
建立在第一范式的基础之上,要求所有非主键字段必须完全依赖主键,不要产生部分依赖。
1 | 学生编号 学生姓名 教师编号 教师姓名 |
这张表描述了学生和老师的关系:(1个学生可能有多个老师,1个老师有多个学生) 这是非常典型的:多对多关系!
分析以上的表是否满足第一范式?不满足第一范式。
怎么满足第一范式呢?修改
1 | 学生编号+教师编号(pk) 学生姓名 教师姓名 |
学生编号 教师编号,两个字段联合做主键,复合主键(PK: 学生编号+教师编号)经过修改之后,以上的表满足了第一范式。但是满足第二范式吗?不满足,“张三”依赖1001,“王老师”依赖001,显然产生了部分依赖。产生部分依赖有什么缺点?数据冗余了。空间浪费了。“张三”重复了,“王老师”重复了。
为了让以上的表满足第二范式,你需要这样设计:使用三张表来表示多对多的关系!!!!
1 | 学生表 |
1 | 教师表 |
7.3 第三范式
第三范式建立在第二范式的基础之上要求所有非主键字典必须直接依赖主键,不要产生传递依赖。
1 | 学生编号(PK) 学生姓名 班级编号 班级名称 |
以上表的设计是描述:班级和学生的关系。很显然是1对多关系! 一个教室中有多个学生。
分析以上表是否满足第一范式?满足第一范式,有主键。
分析以上表是否满足第二范式?满足第二范式,因为主键不是复合主键,没有产生部分依赖。主键是单一主键。
分析以上表是否满足第三范式?第三范式要求:不要产生传递依赖!一年一班依赖01,01依赖1001,产生了传递依赖。不符合第三范式的要求。产生了数据的冗余。
那么应该怎么设计一对多呢?
1 | 班级表:一 |
7.4 表的设计总结
一对多:一对多,两张表,多的表加外键!!!!!!!!!!!!
多对多:多对多,三张表,关系表两个外键!!!!!!!!!!!!!!!
一对一:一对一放到一张表中不就行了吗?为啥还要拆分表?在实际的开发中,可能存在一张表字段太多,太庞大。这个时候要拆分表。 一对一怎么设计?
1 |
|
口诀:一对一,外键唯一!!!!!!!!!!