3.非叶子结点的左指针指向小于其主要字的子树,右指针指向大于其紧要字的子树

原文: http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html

原文: http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html

二叉查找树

二叉查找树

       1.有着非叶子结点至多所有五个外甥(Left和Right);

       1.存有非叶子结点至多有着七个外孙子(Left和Right);

       2.所有结点存储一个关键字;

       2.富有结点存储一个最紧要字;

       3.非叶子结点的左指针指向小于其紧要字的子树,右指针指向大于其重大字的子树;

       3.非纸牌结点的左指针指向小于其主要性字的子树,右指针指向大于其主要性字的子树;

       如:

       如:

       

       

图片 1

图片 2

       二叉查找树的搜索,从根结点开端,倘诺查询的紧要字与结点的紧要字格外,那么就击中;

       二叉查找树的探寻,从根结点起头,借使查询的机要字与结点的重大字出色,那么就命中;

要不然,即使查询关键字比结点关键字小,就进来左外甥;假设比结点关键字大,就进去

不然,即使查询关键字比结点关键字小,就进来左外甥;若是比结点关键字大,就进来

右孙子;若是左孙子或右外孙子的指针为空,则告知找不到对应的机要字;

右孙子;假设左孙子或右儿子的指针为空,则告诉找不到相应的首要性字;

       假若二叉查找树的拥有非叶子结点的左右子树的结点数目均保持几乎(平衡),那么二叉查找树

       借使二叉查找树的享有非叶子结点的左右子树的结点数目均保持几乎(平衡),那么二叉查找树

的物色质量逼近二分查找;但它比两次三番内存空间的二分查找的助益是,改变二叉查找树结构

的摸索质量逼近二分查找;但它比一连内存空间的二分查找的亮点是,改变二叉查找树结构

(插入与删除结点)不需求活动大段的内存数据,甚至普通是常数花费;

(插入与删除结点)不需求活动大段的内存数据,甚至普通是常数开销;

       如:

       如:

      

      

图片 3

图片 4

   但二叉查找树在通过一再插入与删除后,有只怕导致差其余布局:

   但二叉查找树在通过延续插入与删除后,有或许引致不一致的结构:

图片 5

图片 6

   右侧也是一个二叉查找树,但它的查找品质已经是线性的了;同样的要紧字集合有大概引致差别的

   左边也是一个二叉查找树,但它的搜索质量已经是线性的了;同样的要害字集合有大概引致区其他

树结构索引;所以,使用二叉查找树还要考虑尽只怕让二叉查找树保持左图的布局,和防止右图的结构,也就

树结构索引;所以,使用二叉查找树还要考虑尽只怕让二叉查找树保持左图的构造,和幸免右图的构造,也就

是所谓的“平衡”难题;      

是所谓的“平衡”难题;      

       实际应用的二叉查找树都以在原二叉查找树的底子上加上平衡算法,即“平衡二叉树”;怎么样有限帮助二叉查找树

       实际使用的二叉查找树都是在原二叉查找树的根底上添加平衡算法,即“平衡二叉树”;如何保持二叉查找树

结点分布均匀的平衡算法是平衡二叉树的首要;平衡算法是一种在二叉查找树中插入和删除结点的

结点分布均匀的平衡算法是平衡二叉树的机要;平衡算法是一种在二叉查找树中插入和删除结点的

策略;

策略;

 

 

 

 

B树

B树

       是一种多路搜索树(并不是二叉的):

       是一种多路搜索树(并不是二叉的):

       1.概念任意非叶子结点最几唯有M个外甥;且M>2;

       1.定义任意非叶子结点最多唯有M个外孙子;且M>2;

       2.根结点的幼子数为[2,
M];

       2.根结点的幼子数为[2,
M];

       3.除根结点以外的非叶子结点的外甥数为[M/2,
M];

       3.除根结点以外的非叶子结点的幼子数为[M/2,
M];

       4.每一个结点存放至少M/2-1(取上整)和至多M-1个紧要字;(至少2个紧要字)

       4.各样结点存放至少M/2-1(取上整)和至多M-1个根本字;(至少2个关键字)

       5.非纸牌结点的关键字个数=指向外甥的指针个数-1;

       5.非纸牌结点的重中之重字个数=指向外孙子的指针个数-1;

       6.非叶子结点的要紧字:K[1], K[2], …,
K[M-1];且K[i] <
K[i+1];

       6.非叶子结点的首要字:K[1], K[2], …,
K[M-1];且K[i] <
K[i+1];

       7.非纸牌结点的指针:P[1], P[2], …,
P[M];其中P[1]针对关键字小于K[1]的

       7.非纸牌结点的指针:P[1], P[2], …,
P[M];其中P[1]针对关键字小于K[1]的

子树,P[M]针对关键字大于K[M-1]的子树,其它P[i]针对关键字属于(K[i-1], K[i])的子树;

子树,P[M]针对关键字大于K[M-1]的子树,其它P[i]本着关键字属于(K[i-1], K[i])的子树;

       8.所有叶子结点位于同一层;

       8.所有叶子结点位于同一层;

       如:(M=3)

       如:(M=3)

图片 7

图片 8

       B树的寻找,从根结点早先,对结点内的根本字(有序)系列进行二分查找,若是

       B树的物色,从根结点先河,对结点内的重中之重字(有序)种类举办二分查找,假诺

猜中则停止,否则进入查询关键字所属范围的孙子结点;重复,直到所对应的幼子指针为

命中则截止,否则进入查询关键字所属范围的幼子结点;重复,直到所对应的外孙子指针为

空,或曾经是纸牌结点;

空,或曾经是纸牌结点;

B树的特色:

B树的表征:

       1.关键字集合分布在整颗树中;

       1.最首要字集合分布在整颗树中;

       2.其他一个紧要字出现且只现出在一个结点中;

       2.任何一个要害字出现且只出现在一个结点中;

       3.搜寻有大概在非叶子结点截止;

       3.物色有或者在非叶子结点截至;

       4.其搜索性能等价于在第一字全集内做三次二分查找;

       4.其搜索品质等价于在关键字全集内做两次二分查找;

       5.自动层次控制;

       5.自动层次控制;

       由于限制了除根结点以外的非叶子结点,至少含有M/2个孙子,确保了结点的起码

       由于限制了除根结点以外的非叶子结点,至少含有M/2个儿子,确保了结点的至少

利用率,其最底搜索品质为:

利用率,其最底搜索质量为:

图片 9

图片 10

    

    

       其中,M为设定的非叶子结点最多子树个数,N为关键字总数;

       其中,M为设定的非叶子结点最多子树个数,N为关键字总数;

       所以B树的习性总是等价于二分查找(与M值无关),也就没有B树平衡的题材;

       所以B树的性质总是等价于二分查找(与M值无关),也就从未有过B树平衡的难点;

       由于M/2的限制,在插入结点时,若是结点已满,须要将结点不一致为七个各占

       由于M/2的界定,在插入结点时,借使结点已满,须求将结点不一致为几个各占

M/2的结点;删除结点时,需将多少个不足M/2的汉子儿结点合并;

M/2的结点;删除结点时,需将七个不足M/2的小兄弟结点合并;

 

 

 

 

B+树

B+树

       B+树是B树的变体,也是一种多路寻找树:

       B+树是B树的变体,也是一种多路寻找树:

       1.其定义基本与B树同,除了:

       1.其定义基本与B树同,除了:

       2.非叶子结点的子树指针与首要字个数一致;

       2.非纸牌结点的子树指针与重点字个数一样;

       3.非纸牌结点的子树指针P[i],指向关键字值属于[K[i],
K[i+1])的子树

       3.非纸牌结点的子树指针P[i],指向关键字值属于[K[i],
K[i+1])的子树

(B树是开区间);

(B树是开区间);

       5.为具备叶子结点扩张一个链指针;

       5.为拥有叶子结点增添一个链指针;

       6.所有关键字都在叶子结点现身;

       6.所有关键字都在叶子结点出现;

       如:(M=3)

       如:(M=3)

图片 11

图片 12

   B+的探寻与B树也基本相同,不一致是B+树唯有达到叶子结点才命中(B树可以在

   B+的搜索与B树也基本相同,不一样是B+树唯有达到叶子结点才命中(B树可以在

非叶子结点命中),其属性也等价于在根本字全集做几回二分查找;

非叶子结点命中),其属性也等价于在首要字全集做一回二分查找;

       B+的特性:

       B+的特性:

       1.具有重大字都冒出在叶子结点的链表中(稠密索引),且链表中的关键字刚刚

       1.持有重点字都冒出在叶子结点的链表中(稠密索引),且链表中的关键字刚刚

是铁钉铁铆的;

是有序的;

       2.不容许在非叶子结点命中;

       2.不容许在非叶子结点命中;

       3.非叶子结点也就是是纸牌结点的目录(稀疏索引),叶子结点也就是是存储

       3.非纸牌结点相当于是纸牌结点的目录(稀疏索引),叶子结点也等于是存储

(关键字)数据的数据层;

(关键字)数据的数据层;

       4.更适合文件索引系统;

       4.更合乎文件索引系统;

  

  

B*树

B*树

       是B+树的变体,在B+树的非根和非叶子结点再充实指向兄弟的指针;

       是B+树的变体,在B+树的非根和非叶子结点再充实指向兄弟的指针;

图片 13

图片 14

   B*树定义了非叶子结点关键字个数至少为(2/3)*M,即块的最低使用率为2/3

   B*树定义了非叶子结点关键字个数至少为(2/3)*M,即块的最低使用率为2/3

(代替B+树的1/2);

(代替B+树的1/2);

       B+树的分崩离析:当一个结点满时,分配一个新的结点,并将原结点中四分之二的数目

       B+树的分崩离析:当一个结点满时,分配一个新的结点,并将原结点中54%的数据

复制到新结点,最终在父结点中加进新结点的指针;B+树的解体只影响原结点和父

复制到新结点,最终在父结点中增添新结点的指针;B+树的解体只影响原结点和父

结点,而不会影响兄弟结点,所以它不必要指向兄弟的指针;

结点,而不会潜移默化兄弟结点,所以它不须要指向兄弟的指针;

       B*树的分崩离析:当一个结点满时,即便它的下一个兄弟结点未满,那么将部分

       B*树的分崩离析:当一个结点满时,尽管它的下一个兄弟结点未满,那么将有些

数据移到兄弟结点中,再在原结点插入关键字,最终修改父结点中兄弟结点的首要字

数量移到兄弟结点中,再在原结点插入关键字,最终修改父结点中兄弟结点的主要字

(因为兄弟结点的机要字范围变更了);如若兄弟也满了,则在原结点与兄弟结点之

(因为兄弟结点的主要性字范围变更了);如若兄弟也满了,则在原结点与手足结点之

间伸张新结点,并各复制59%的数目到新结点,最后在父结点扩充新结点的指针;

间扩张新结点,并各复制50%的多寡到新结点,最终在父结点增加新结点的指针;

       所以,B*树分配新结点的几率比B+树要低,空间使用率更高;

       所以,B*树分配新结点的可能率比B+树要低,空间使用率更高;

  

  

小结

小结

       二叉查找树:二叉树,各个结点只存储一个第一字,等于则命中,小于走左结点,大于

       二叉查找树:二叉树,各种结点只存储一个根本字,等于则命中,小于走左结点,大于

走右结点;

走右结点;

       B树:多路搜索树,各种结点存储M/2到M个关键字,非叶子结点存储指向第一

       B树:多路搜索树,各种结点存储M/2到M个关键字,非叶子结点存储指向第一

字范围的子结点;

字范围的子结点;

       所有首要字在整颗树中出现,且只出现三遍,非叶子结点可以命中;

       所有首要字在整颗树中出现,且只现出两遍,非叶子结点可以命中;

       B+树:在B树基础上,为叶子结点伸张链表指针,所有首要字都在叶子结点

       B+树:在B树基础上,为叶子结点扩张链表指针,所有重大字都在叶子结点

中冒出,非叶子结点作为叶子结点的目录;B+树总是到叶子结点才命中;

中出现,非叶子结点作为叶子结点的目录;B+树总是到叶子结点才命中;

       B*树:在B+树基础上,为非叶子结点也大增链表指针,将结点的最低利用率

       B*树:在B+树基础上,为非叶子结点也平添链表指针,将结点的最低利用率

从1/2提高到2/3;

从1/2提高到2/3;

===============注释==============

===============注释==============

留意没有啥叫B-树的东西,是翻译难点导致的,B-Tree
被翻译成B-树,其实应当叫B树

专注没有怎么叫B-树的东西,是翻译难题造成的,B-Tree
被翻译成B-树,其实应该叫B树

相关文章