Q&A宝典-数据库基础篇
# 第一天
1. 分页怎么实现的
- Mysql分页使用limit:
select 列名 from 表名 limit 10,10;
- Oracle分页使用rownum:
select a.* from (select rownum rw, 列名 from 表名 where 条件) a where a.rw>数字 and a.rw<=y;
2. sql语句优化
- 合理使用索引
- 用exists代替in,exists是直接判断存不存在,而in会挨个比较
- 复杂的业务功能可以使用存储过程
- 应尽量避免在 where 子句中使用
!=
、<>
、or
、in
、not in
操作符,否则将引擎放弃使用索引而进行全表扫描 - 能多表关联的尽量不写子查询
- 避免%xxx式查询,前置%查询会导致查全表
3. Oracle中drop 和truncate的区别?
- drop是删除表,
不会释放表原先占有的内存空间
; - truncate是截断表,
能够释放表中数据所占有的内存空间,保留表结构
;
如果使用drop table 表名 purge;语句则能够直接释放表占有的内存空间。
4. delete,drop,truncate 区别?
delete,drop,truncate 都有删除表的作用,区别在于:
- delete 和 truncate 仅仅删除表数据,drop 连表数据和表结构一起删除,打个比方,delete 是单杀,truncate 是团灭,drop 是把电脑摔了。
- delete 是 DML 语句,操作完以后如果没有不想提交事务还可以回滚,truncate 和 drop 是 DDL 语句,操作完马上生效,不能回滚,打个比方,delete 是发微信说分手,后悔还可以撤回,truncate 和 drop 是直接扇耳光说滚,不能反悔。
- 执行的速度上,drop>truncate>delete,打个比方,drop 是神舟火箭,truncate 是和谐号动车,delete 是自行车。
5. 左外连接,右外连接,说一下?
左外连接:from 原表 left join 新表 on 关联关系
原表和新表能够关联的数据+无法通过关联关系关联到原表的数据
右外连接:from 原表 right join 新表 on 关联关系
原表和新表能够关联的数据+无法通过关联关系关联到新表的数据
6. sql语句中怎么判断一个字段是不是空
与空判断使用is null
或者is not null
7. 数据源、数据库连接池、DBCP三者的关系?
- 数据源:是连接数据库的一个标准
- 数据库:连接池是实现数据源的一种解决方案
- DBCP:是连接池的具体实现
# 第二天
1. Mysql和Oracle的区别
- Oracle使用rownum来实现分页,MySQL使用limit实现分页
-- - mysql查询行号
select
w.id,
@rowno := @rowno + 1 AS rowno,
-- 查到当前这一行的行号
CASE WHEN w.ID ='123456' THEN
@rowno END currentrowno
from table w order by w.rowno;
2
3
4
5
6
7
8
- Oracle没有主键自增特性,可以使用调用序列的方式来实现主键自增;MySQL可以在主键列之后添加auto_increment设置自增特性
- Oracle有表空间的概念,MySQL没有表空间
- Oracle的分组函数中select之后不能直接写非分组的其他列;MySQL如果没有聚组函数则可以写 其他列
- Oracle的表存放在用户(其实是schema对象)所属的表空间的数据文件中, mySQL的表存放在某个database中(mysql一个root用户下可以有很多database)
- Oracle中的一些函数和MySQL也不一样
如:
ORACLE:substr('abcd',2,2) ,MYSQL:substring('abcd',2,2)
,ORACLE:to_char(sysdate,'yyyy-mm-dd') ,MYSQL:date_format(now(),'%Y-%m-%d')
- Oracle中的字符类型可以使用varchar2,MySQL不能使用该类型
2. jdbc怎样执行sql语句?
- 加载驱动
- 通过驱动管理对象获得连接
- 获得执行器对象编写SQL语句,JAVA中用String类型表示SQL
- 通过执行器执行SQL语句
常用的执行SQL语句的方法有:execute()
boolean (执行select语句时返回true,因为select能够返回一个查询结果 其他命令开头的语句返回false);executeUpdate()
int;executeQuery()
ResultSet - 释放资源
3. 索引用过吗?在什么情况下会导致索引失效?用索引还需要注意哪些问题呢?索引分为几种?
用过;如果有索引的列空值比较多、重复数据比较多的话索引不起作用。 通常索引用在查询较多而增删改较少的列,因为索引也会花时间自己维护会降低增删改的效率。
常用的索引有普通索引、唯一性索引、位图索引,如果某个列上经常使用函数,还可以建一个函数索引。
4. like 用过吗?怎么用的?
like常用来实现模糊查询,与%和_匹配使用,如果需要匹配特殊字符,则需要使用escape逃离符。
例:搜索以“QA_”开头的数据:select code from 表 where code like 'QA/_%' escape '/'
5. union 和union all的区别
- 都是取并集,可以用来代替 or
例如:有{1,2,3}和{2,3,4}
union 能够去除重复数据 (做排序操作)(1,2,3,4)
union all 不会做去重操作 效率高 (1,2,2,3,3,4)
- 多个查询语句必须有相同的列数
多个查询语句中的列对应的数据类型必须一致
如:select ename,job from emp01 union select ename,job from emp02;
6. 事务的特性
- 事务四大特性(简称ACID)
- 原子性(Atomicity): 事务中的全部操作在数据库中是不可分割的,要么全部完成,要么均不执行。
- 一致性(Consistency): 事务必须是使数据库从一个一致性状态变到另一个一致性状态。一致性与原子性是密切相关的。
- 隔离性(Isolation): 事务的执行不受其他事务的干扰。
- 持久性(Durability): 能够将提交的数据持久化到数据库中。
7. 什么是事务?特征?JDBC如何控制事务?
多条sql语句作为 一个执行单元,要么全部执行,要么全不执行
四大特性:原子性,一致性,隔离性,持久性
JDBC控制事务:
- 开始事务:connection.setAutoCommit(false);
- 执行sql语句
- 提交:connection.commit();
- 回滚:Connection.rollback();
# 第三天
1. 存储过程、视图、触发器
存储过程 procedure: 在服务器端,能够被多个程序调用的一段SQL语句块。
简单来说就是事先用数据库语言写好的一段功能,能够像函数一样被程序调用,但是存储过程本身没有返回值,是通过返回参数的形式返回数据。视图 View : 视图其实就是伪表,将编译后的SQL语句保存在数据库中,拿出只想让用户看见的字段,这就是视图。
一般来讲视图不能创建索引(因为视图本身只是一个编译后的查询语句,索引只能创建在表的列上),但是Oracle提供了一种物化视图可以创建索引(物化视图:虽然叫视图但是实际类似于表,将数据暂时存储并在基表刷新或者提交数据时刷新本视图以便与基表数据保持一致)。触发器 trigger: 一种特殊的存储过程,不需要调用,在满足条件时触发。
触发条件:在对某个表做insert 、 update 或delete操作之前或之后(取决于如何实现)自动执行
2. 如何调用存储过程?
- JDBC中使用CallableStatement执行器对象,通过
execute("{call 过程名(?,?)}")
的方式来调用; - PL/SQL Developer工具中可以通过
declare begin 过程名(参数); end;
的方式调用;
3. 备份数据
- 第一种方式: 通过导入导出命令备份数据库中全部数据
Oracle用exp
命令导出数据,MySQL使用mysqldump
命令备份数据 - 第二种方式: 使用工具导出数据
4. in与exists的区别? 那个效率更高?
exists效率更高
- in :需要通过条件比较结果中的所有数据
- exists: 只关心子查询能够查询出数据
5. 悲观锁与乐观锁?
悲观锁: 在操作表时认为另外一个对表的操作会修改数据
1.所以每次在拿数据的时候都会上锁,这样别人想拿这个数据就会阻塞直到它拿到锁(共享资源每次只给一个线程使用,其它线程阻塞,用完后再把资源转让给其它线程)。
2.java中synchronized和ReentrantLock等独占锁就是悲观锁思想的实现。
3.传统的关系型数据库里边就用到了很多这种锁机制,比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁。乐观锁: 在操作表时认为别的操作不会对表有修改数据的操作
1.所以不会上锁,但是在更新的时候会判断一下在此期间别人有没有去更新这个数据,可以使用版本号机制(原子类)和CAS算法实现。
2.乐观锁适用于多读的应用类型,这样可以提高吞吐量。
6. Hibernate中常见的主键增长策略?
- Assigned:在调用save方法之前设置,自定义主键增长方式
- Identity:建表语句必须支持auto_increment
- Sequence:指定序列生成主键
- Native:底层自动选择合适的策略
- Increment:最大值+1的方式
- Uuid:生成32为字符串
# 第四天
1. 结构化查询语言都是什么?
- DDL alter drop truncate create
- DML insert delete update
- DQL select
- DCL grant revoke
- TCL commit rollback savepoint
2. drop和truncate的区别?
- drop:删除表结构和表数据(如果删除表空间的话需要+purge)
- truncate:删除表数据和表空间,会保留表结构
3. 组函数?多行函数?
- sum() avg() count() max() min()
4. 怎么去重?
- distinct 专业去重(支持多列)
select distinct salary,name from student;
- group by 聚合统计
5. 什么时候使用多表连接?什么时候使用子查询?
- 如果需要查询的数据在多个表中,一定要使用多表连接
- 不需要表A中的列,但是下需要表A中的条件,可以用子查询
- 子查询中如果使用了in some any all这几个关键字,效率比较低,可以转换成多表关联
6. 为什么要使用视图?
- 节省编译时间,提高查询效率
- 屏蔽原表中的字段,避免没有权限的用户查询到其他字段
- 视图的数据能够动态的来源于原表
- 简单的视图可以更新视图中的数据,复杂的视图无法更新
create view 视图名 as select name from student;
7. 为什么要给普通用户创建属于自己的表空间?
- 项目中很有可能与其他项目使用同一个数据库, 多个用户在使用用一个数据库时有可能访问同一个数据库文件, 就会产生资源争用的问题。给不同的用户指定不同的表空间, 就可以让他们使用不同的数据库文件,解决资源争用的问题。
- 给予用户部分权限
8. 约束有哪几种?
- 外键约束 foreign key references
- 唯一约束 unique
- 非空约束 not null
- 主键约束 primary key
- 检查约束 check
9. 索引有哪几种?
- 函数索引
- 普通索引 normal
- 唯一索引 unique
- 位图索引 bitmap(适合在数据量比较大,基数比较小的列 如:男/女)
10. 索引的优缺点?
- 能够更快的帮助我们提高查询效率
- 索引会降低数据库的增删改的效率,因为数据库需要花时间去维护索引,所以索引适合数据量比较大而且数据不经常改动的列
11. sql语句怎么优化?
- 尽量用exists代替in
- 合理使用索引
- 查询多个表中的数据时,尽量用多表连接
- 多表连接时尽量把多的数据放在where之后
- 多表连接时尽量使用表的别名,减少数据库的解析时间
- 在确保语句完整的情况下,多使用commit提交语句
- 优化group by,将不需要的记录在group by之前过滤掉
12. 查询语句常见的关键字的优先级?
- select 列名 优先级高于order by
- from 表明 优先级最高
- where 条件 优先级次高
- group by条件 优先级次于where
- having 条件 优先级一定在group by之后
- order by分组 优先级最低
13. Oracle分页
rownum
,这是Oracle对动态查询结果的编号,用来实现分页查询有序的整数列,每多一条自动加1
- 不能和 group by 在同一个查询语句中
- 不能用 表名.rownum
- 它肯定是从1开始
- 编号21-30,实现排序效果的分页
select rownum,a.*
from
(select rownum rn,b.*
from (select * from student order by salary) b
where rownum <=30) a
where
a.rn >=21;
2
3
4
5
6
7
# 第五天
1. mysql 引擎 b+树索引(文件系统常用索引)
https://www.cnblogs.com/tiancai/p/9024351.html (opens new window)
平衡二叉树:每个节点只保存一份数据
b树:每个节点可以保存多份数据,减少磁盘I/O所花的时间。
B树在提高了IO性能的同时并没有解决元素遍历的效率低下的问题,正是为了解决这个问题,B+树应用而生。B+树只需要去遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作或者说效率太低。
- b+树:只有最底层的叶子节点(文件)保存数据,非叶子节点只保存索引。
由于B+树的数据都存储在叶子结点中,分支结点均为索引,方便扫库,只需要扫一遍叶子结点即可,但是B树因为其分支结点同样存储着数据,我们要找到具体的数据,需要进行一次中序遍历按序来扫,所以B+树更加适合在区间查询的情况,所以通常B+树用于数据库索引。
非叶子节点的子树指针与关键字个数相同。B+树的查询效率更加稳定:由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当。