事务

  事务是数据库管理系统执行过程中的一个逻辑单位,由有限个数据库操作序列组成。
  事务四个特性:

1.原子性(Atomicity):事务作为一个整体被执行,包含其中的全部数据操作,要么全部执行,要么全部不执行,即回滚到执行前状态。
2.一致性(Consistency):事务应确保数据库状态从一个一致状态转变为另一个一致状态。一致状态是数据库中的数据应与数据库的定义一致,换句话说就是满足完整性约束。
3.隔离性(Isolation):多个事务并发执行时,一个事务的执行不影响其他事务执行,换句话说,每个事务只有自己执行的效果,没含带其他事务,具有独立性,最后,不同事务先后提交并执行后,最终呈现出来的效果是串行的。
3.持久性(Durability):已被提交的事务对数据库的修改应该是永久改变的。

  隔离性最简单的实现方式就是各个事务都串行执行了,如果前面的事务还没有执行完毕,后面的事务就都等待。但是这样的实现方式很明显并发效率不高,并不适合在实际环境中使用。为了解决上述问题,实现不同程度的并发控制,SQL的标准制定者提出了不同的隔离级别:未提交读、提交读、可重复读、序列化读。

1. 未提交读(READ UNCOMMITTED)
    最低级的的隔离级别,可以读取未提交事务的数据。
2. 提交读(READ COMMITTED)
    一个事务只能看见已经提交的事务所做的改变,大多数数据库系统的默认隔离级别(但不是MYSQL默认的)。
3. 可重复读(REPEATABLE READ)
    事务A在读到一条数据之后,此时事务B对该数据进行了修改并提交,那么事务A再读该数据,读到的还是原来的内容,可以说上了一个修改锁。
4. 可串行化(SERIALIZABLE)
    最高级别隔离,强制事务串行执行,时间消耗大,导致超市现象和锁竞争,一般不用该级别,而是采用乐观锁与悲观锁。

  较低的隔离级别能够提高效率,但是却会导致很多问题,常见的4个问题如下:

1.脏读
    脏读发生于未提交读级别,事务A读取事务B的修改的数据,但是事务B提交前回滚,即撤回操作,此时事务A读取的数据为无用数据,出现了脏读,脏读就是读取脏的数据(垃圾数据)。
2. 不可重复读问题(对于列说)
    不可重复读问题是说事务两次读取的数据不一致,发生于并发事务中,事务A第一次读取数据,随后,事务B修改数据的某一列,此时提交后,数据修改,此时事务A又再次读取数据,此时读取数据的某一列不一致,从而产生不可重复读问题。
3. 幻读问题(对于行说)
    幻读问题是说事务第一次读的数据与第二次读的数据数量不一致,从而产生幻觉的问题,事务A第一次读取数据,此时事务B增加或删减了一行数据后,此时事务A再次读取数据时产生了两者不一致的幻觉。
4. 丢失更新问题
    丢失更新问题是说事务A的更新被事务B的修改覆盖,从而丢失了更新,丢失问题分为两种,第一种为回滚丢失更新,在事务A执行更新时,事务B执行更新并提交,但是事务A最后回滚撤销,进而回滚到事务开始状态,此时事务B的更新也会被覆盖,第二种为提交覆盖数据更新,事务A的提交修改了期间事务B的更新的数据,从而导致了事务B更新消失,因为丢失更新1比较严重,所以数据库本身不允许这一类丢失更新的发生。

  对于不同隔离等级会出现的问题汇总如下:

隔离级别 脏读 不可重复读 幻读 丢失更新1 丢失更新2
未提交读 发生 发生 发生 不发生 发生
提交读 不发生 发生 发生 不发生 发生
可重复读 不发生 不发生 发生 不发生 不发生
可串行化 不发生 不发生 不发生 不发生 不发生

  前面说了乐观锁与悲观锁,但是这里要强调乐观锁与悲观锁是思想,不是具体实现,那些具体锁可以根据思想划分为乐观锁或悲观锁。乐观锁又叫乐观并发控制(OCC),悲观锁又叫悲观并发控制(PCC)。
  乐观锁是认为外界对数据的操作一般是不会发生冲突的,因此在操作过程不会进行加锁,而是当提交的时候才会进行检测加锁,数据库的乐观锁,并不是利用数据库本身的锁去实现的,可能是利用某种实现逻辑去实现做到乐观锁的思想。
  悲观锁是认为外界对数据的操作默认是会发生冲突的,所以在数据操作的整个过程都会处于加锁状态,保证同一时间只有一个线程可以访问到数据,通常利用数据库本身提供的锁机制去实现。
  乐观锁使用逻辑进行上锁,一般基于CAS思想进行设计,CAS思想是通过对比旧期望值a(在操作前进行读取,并进行赋值)与需要进行最终修改时读取值b进行比较,如果一致,则表明在此期间没有人进行修改,可以进行操作,而如果不一致,说明在此期间已经有人进行了修改,不执行更新,基于此思想数据库有两种方式:

1.基于数据版本的实现
    每一行另加一个版本VERSION字段,当用户修改时,版本会自动加1,通过比较版本是否一致,来执行是否更新,不更新时会返回冲突信息,让用户决定下一个动作。
2.基于时间戳的实现
    与数据版本类似,只不过替换成时间,通过比较时间来判断。