浅析Treap——平衡树

曦行夜落

2018-08-05 13:48:51

Algo. & Theory

Treap,一种数据结构,支持插入节点、删除节点、求第x大的节点、求权值为x的节点的排名、求权值比x小的最大节点、求权值比x大的最小节点

提示:以下图片均由Powerpoint出品,请原谅丑陋无比的图

【引子:二叉排序树和堆】

首先,我们要知道,Treap=Tree+Heap,Tree指的是二叉排序树,Heap则是指堆

1.Tree——二叉排序树

二叉排序树,是指根的左儿子比根小,右儿子比根大,且左右子树均为二叉排序树的树 通俗来说,就是左子树全部比根小,右子树全部比根大,如图:

这时候,我们要插入一个节点,就不断地判断与根的大小关系(假设没有节点相同):
1.比根小,去左子树
2.比根大,去右子树
直到来到一个空树,插入:

删除节点:
如果一个节点是叶子节点,直接销毁
否则,如果这个节点有一个子节点,直接将其连接到该节点的父亲
否则,沿着右子树的根一路向左到底,然后用那个值替换掉要删除的节点,例如我们要删7:

因为这个点必定小于右子树的其他值,且大于左子树的全部数,所以他是作为根的最好人选
接下来,交换8和7,然后销毁7:

查询x的排名:
这个很简单,查看x与根的大小关系,如果相等,排名为左子树元素个数+1
比根小,递归查询他在左子树的排名,排名为他在左子树的排名,空树排名为0
比根大,递归查询他在右子树的排名,排名为右子树的排名+左子树元素个数+1
查询排名为x的数:
这个也很好理解,判断左子树元素个数是否大于等于之
如果是就在左子树找
否则,如果刚好为左子树元素个数+1,就是根
如果大于左子树元素个数+1,则必定在右子树,这个和查询x排名对照起来就很好理解

查询x的前驱(求权值比x小的最大节点):
空节点返回-inf
如果根的权值小于等于x,就在左子树找
否则,取根和右子树查询结果的最大值(我们要求最大节点)
查询x的后继(求权值比x大的最小节点):
空节点返回inf
如果根的权值大于等于x,就去右子树
否则,取根和左子树查询结果的最小值(我们要求最小节点)
我才不会告诉你这两段我是Ctrl C+V的
其实上面的前驱后继对照看就很好记

这时候细心的人会发现,这六个操作不就是刚刚上面讲的Treap支持的操作吗?

好吧,那如果是这样我们还写个Treap干什么?

原因看下图


退化成一条链了!

恐怕是药丸了,虽然一般情况下二叉排序树复杂度不错,是O(logn)
但是,不排除有丧心病狂的出题人故意卡你的情况,这时候复杂度为O(n)
要怎么办呢?
堆!你值得拥有

2.Heap——堆

堆,一种完全二叉树(看看看,刚好防止了退化),保证根节点比左右子树都要大或小,大的称为大根堆,反之称小根堆。
注意,完全二叉树用数组存,i的儿子为2i和2i+1,父亲为i/2
这次先把模板呈上:

struct max_heap
{
    int size;
    int d[maxn];

    void clear()
    {
        size=0;
        memset(d,0,sizeof(d));
    }

    void push(int x)
    {
        d[++size]=x;
        int flag=1,p=size;
        while (flag && (p>1))
        {
            if (d[p/2]<d[p])
                swap(d[p/2],d[p]);
            else flag=0;
            p/=2;
        }
    }

    void pop()
    {
        swap(d[1],d[size]);
        size--;
        int p=1,t,flag=1;
        while (flag && (p*2<=size))
        {
            if (d[p*2]>d[p]) t=p*2;
            else t=p;
            if (p*2<size)
                if ((d[p*2+1]>d[p]) && (d[p*2+1]>d[p*2]))
                    t=p*2+1;
            if (t!=p)
            {
                swap(d[p],d[t]);
                p=t;
            } 
            else flag=0;
        } 
    }

    int top()
    {
        return d[1];
    }
}

此处以大根堆为例讲述
堆支持三种操作:插入,取极值,弹出极值(极值是最大或最小) 首先讲插入操作
如图所示,将新节点插入到二叉树底端:

然后不断让新节点向上跳,直到它小于它的父亲或成为根
如图:


删除操作:
弹出的是极值(也就是最小或最大值)
先交换堆顶和二叉树中的最后一个元素(最后一层最右边)
然后,设p=1,判断当前p的两个儿子是否均小于p,如果是,停止循环,否则p与其中较大的那个交换,然后p赋值为较大的那个儿子的编号(说白了就是让比较牛的儿子当爹,爹去做儿子),不断循环
看图:



取最小或最大就是取堆顶不讲
所以呢,讲堆有什么用呢?
就是啊,有什么用呢?
和排名、前驱有什么关系啊?
别急,慢慢往下看。

【Part1:Treap的基本内容】

首先,我们需要用到以下的数组(不知道没关系,下面慢慢讲)
size[i]——以i为根的子树的节点数
v[i]——i节点的权值
num[i]——由于可能有重复(上文讲的是没有重复的),所以,我们将权值一样的存在一个节点里面,num数组存储的是i节点存的个数
son[i][2]——存储i节点的儿子,注意,这里不是完全二叉树所以需要存储儿子,son[i][0]表示左儿子,son[i][1]表示右儿子。
rd[i]——i节点的一个随机值,它有什么用呢?
堆!没错,堆正是在这里派上了用场
我们要让全部节点按照这个随机值排成一个堆
so……我们究竟要怎么解决树退化为链的问题呢?
这就引出了平衡树最重要的概念——旋转

【Part2:rotate操作——旋转】

旋转分两种,左旋和右旋,他们的共同特点是不改变Treap的二叉查找树性质,且能够使得Treap更加平衡
首先看右旋:(别问我为什么先讲右旋)

这时候,我们来进行右旋操作!

彻底乱伦了
我们来看一下大小关系:
右旋前的大小关系:你<跌<小明<爷爷<叔叔
右旋后:你<跌<小明<爷爷<叔叔
神奇吧!没有变!

然后是左旋(图偷懒了):

        A                         
       / \              
      B   C               
         / \              
        D   E                          

然后让我们来进行一次左旋

        C
       / \
      A   E
     / \   
    B   D

左旋之前的大小关系:B<A<D<C<E
左旋之后:B<A<D<C<E
也就是说,左右旋对Treap的二叉查找树性质毫无影响
那么,左右旋究竟是来做什么的呢?
旋转可以维护Treap堆的性质,然后巧妙地防止退化,使得操作的时间复杂度趋于O(logn),从而完成任务
同时,在某些操作中需要移动节点的操作,可以直接旋转

【Part3:Treap的代码实地讲解】

模板题P3369
为了方便讲解,先挂上我巨丑无比的代码

#include<bits/stdc++.h>
#define maxn (100000+500)
#define inf 2000000005
using namespace std;
int sum=0,R=0;
int size[maxn],v[maxn],num[maxn],rd[maxn],son[maxn][2];

void pushup(int p)
{
    size[p]=size[son[p][0]]+size[son[p][1]]+num[p];
}

void rotate(int &p,int d)
{
    int k=son[p][d^1];
    son[p][d^1]=son[k][d];
    son[k][d]=p;
    pushup(p);
    pushup(k);
    p=k;
}

void ins(int &p,int x)
{
    if (!p)
    {
        p=++sum;
        size[p]=num[p]=1;
        v[p]=x;
        rd[p]=rand();
        return;
    }
    if (v[p]==x)
    {
        num[p]++;
        size[p]++;
        return;
    }
    int d=(x>v[p]);
    ins(son[p][d],x);
    if (rd[p]<rd[son[p][d]]) rotate(p,d^1);
    pushup(p);
}

void del(int &p,int x)
{
    if (!p) return;
    if (x<v[p]) del(son[p][0],x);
    else if (x>v[p]) del(son[p][1],x);
    else
    {
        if (!son[p][0] && !son[p][1])
        {
            num[p]--; size[p]--; 
            if (num[p]==0) p=0;
        } 
        else if (son[p][0] && !son[p][1])
        {
            rotate(p,1);
            del(son[p][1],x);
        }
        else if (!son[p][0] && son[p][1])
        {
            rotate(p,0);
            del(son[p][0],x);
        }
        else if (son[p][0] && son[p][1])
        {
            int d=(rd[son[p][0]]>rd[son[p][1]]);
            rotate(p,d);
            del(son[p][d],x);
        }
    }
    pushup(p);
}

int rank(int p,int x)
{
    if (!p) return 0;
    if (v[p]==x) return size[son[p][0]]+1;
    if (v[p]<x) return size[son[p][0]]+num[p]+rank(son[p][1],x);
    if (v[p]>x) return rank(son[p][0],x);
}

int find(int p,int x)
{
    if (!p) return 0;
    if (size[son[p][0]]>=x) return find(son[p][0],x);
    else if (size[son[p][0]]+num[p]<x)
        return find(son[p][1],x-num[p]-size[son[p][0]]);
    else return v[p];
}

int pre(int p,int x)
{
    if (!p) return -inf;
    if (v[p]>=x) return pre(son[p][0],x);
    else return max(v[p],pre(son[p][1],x));
}

int suc(int p,int x)
{
    if (!p) return inf;
    if (v[p]<=x) return suc(son[p][1],x);
    else return min(v[p],suc(son[p][0],x));
}

int main()
{
    int n;
    scanf("%d",&n);
    for (int i=0;i<n;++i)
    {
        int opt,x;
        scanf("%d%d",&opt,&x);
        if (opt==1) ins(R,x);
        else if (opt==2) del(R,x);
        else if (opt==3) printf("%d\n",rank(R,x));
        else if (opt==4) printf("%d\n",find(R,x));
        else if (opt==5) printf("%d\n",pre(R,x));
        else if (opt==6) printf("%d\n",suc(R,x));
    }

    return 0;
}

pushup(p)——顾名思义,拿儿子更新父亲p的节点数

void pushup(int p)
{
    size[p]=size[son[p][0]]+size[son[p][1]]+num[p];
}

p的节点数=左右儿子节点数之和+p本身存有数量

rotate(&p,d)——以p为根(可能有变)旋转,d=0左旋,d=1右旋

void rotate(int &p,int d)
{
    int k=son[p][d^1];
    son[p][d^1]=son[k][d];
    son[k][d]=p;
    pushup(p);
    pushup(k);
    p=k;
}

让我们以d=0时左旋为例:

        A(p)                         
       / \              
      B   C(k)               
         / \              
        D   E                          

k=p的右儿子(暂时保存) p的右儿子变成k的左儿子

        A(p)                         
       / \              
      B   D   C(k)               
               \              
                E                      

k的左儿子变成p

        C(k)
       / \
   (p)A   E
     / \   
    B   D

然后先pushup子代p的,再pushup父代k的 最后换根即可

        C(p)
       / \
      A   E
     / \   
    B   D

ins(&p,x)——根为p,插入节点x(因为需要rotate所以要传引用)

void ins(int &p,int x)
{
    if (!p)
    {
        p=++sum;
        size[p]=num[p]=1;
        v[p]=x;
        rd[p]=rand();
        return;
    }
    if (v[p]==x)
    {
        num[p]++;
        size[p]++;
        return;
    }
    int d=(x>v[p]);
    ins(son[p][d],x);
    if (rd[p]<rd[son[p][d]]) rotate(p,d^1);
    pushup(p);
}

首先是第一种情况——!p,也就是说当前是一个空节点
那么节点总数++,然后开辟一个新节点
size[p]=1,共有1个节点在树中
v[p]=x,值为x
num[p]=1,当前节点有一个重复数字
rd[p]=rand(),生成随机值,拿来维护堆

情况2,有一个数和要插入的x重复,那么直接个数加加即可

否则,我们需要找一个子树,使得Treap的二叉排序树性质成立
以x>v[p]的情况为例
d=1,此时去p的右子树。
如果加完以后p的随机值小于它的右儿子,直接左旋调整(重点,想一想,为什么这样转不破坏堆的性质
x<v[p]同理

del(&p,x)——根为p,删掉节点x

void del(int &p,int x)
{
    if (!p) return;
    if (x<v[p]) del(son[p][0],x);
    else if (x>v[p]) del(son[p][1],x);
    else
    {
        if (!son[p][0] && !son[p][1])
        {
            num[p]--; size[p]--; 
            if (num[p]==0) p=0;
        } 
        else if (son[p][0] && !son[p][1])
        {
            rotate(p,1);
            del(son[p][1],x);
        }
        else if (!son[p][0] && son[p][1])
        {
            rotate(p,0);
            del(son[p][0],x);
        }
        else if (son[p][0] && son[p][1])
        {
            int d=(rd[son[p][0]]>rd[son[p][1]]);
            rotate(p,d);
            del(son[p][d],x);
        }
    }
    pushup(p);
}

一个一个情况来看:
1.空节点,根本就没这个数,直接返回
2.如果x和v[p]不相等,直接去相应子树解决问题
3.如果x=v[p]
3a.x是叶子节点,直接扣掉个数,如果个数为零删掉节点
3b.有一个子节点,直接把子节点旋转上来,然后去相应子树解决
3c.两个子节点,把大的那个转上来,然后去另一个子树解决

rank(p,x)——根为p,查x在根为p的树中的排名

int rank(int p,int x)
{
    if (!p) return 0;
    if (v[p]==x) return size[son[p][0]]+1;
    if (v[p]<x) return size[son[p][0]]+num[p]+rank(son[p][1],x);
    if (v[p]>x) return rank(son[p][0],x);
}

1.空节点,直接返回掉
2.x==v[p],那么左子树的全部数必定小于x,直接返回左子树节点数+1
3.x>v[p],意味着x位于右子树,那么根和左子树一定比x小,先加上,然后再加上x在右子树里面的排名即可
4.x<v[p],x位于左子树,冲向左子树解决

find(p,x)——根为p,查在根为p的子树中排名为x的数

int find(int p,int x)
{
    if (!p) return 0;
    if (size[son[p][0]]>=x) return find(son[p][0],x);
    else if (size[son[p][0]]+num[p]<x)
        return find(son[p][1],x-num[p]-size[son[p][0]]);
    else return v[p];
}

1.空节点不解释
2.左子树节点数大于x,解在左子树中
3.左子树加根的节点数比x小,解在右子树中,查右子树的第x-<左子树节点个数>-<根储存个数>名即可
4.左子树加根的节点大于等于x,意味着要找的就是当前的根节点v[p]

pre(p,x)——根为p,查在根为p的子树中x的前驱

int pre(int p,int x)
{
    if (!p) return -inf;
    if (v[p]>=x) return pre(son[p][0],x);
    else return max(v[p],pre(son[p][1],x));
}

1.空节点,没有前驱
2.如果x是根或在右子树,去左子树找
3.否则要么是根要么右子树,取一个max就可以了(前驱定义为小于x,且最大的数)

suc(p,x)——根为p,查在根为p的子树中x的后继

int suc(int p,int x)
{
    if (!p) return inf;
    if (v[p]<=x) return suc(son[p][1],x);
    else return min(v[p],suc(son[p][0],x));
}

与前驱超级类似
1.空节点无后继
2.如果在根或者左子树,去右子树找
3.否则要么根要么左子树,取min就可以了(后继定义为大于x,且最小的数)

【Part4:Treap的拓展应用】

1.线段树套平衡树,求区间前驱后继排名(就是线段树的每个节点都是一个平衡树)
2.伸展树,翻转区间分割等(我才不会告诉你我也不会

【Part5:结语】

我也不知道这是哪个神仙想出来的,Treap十分的优美,实现简单(上面的代码,每个函数四五行),而且功能强大,思想巧妙。
这给我们很大的启发,Treap正是成功地结合了二叉排序树与堆的优点,秒杀众多数据结构,如果一个人能够结合两者或更多的优点加以运用,那么这个人的人生无疑是优美而且成功的