曦行夜落
2018-07-18 23:07:47
二分,是一种求极值的算法,通常已知答案的取值范围,然后每次取取值范围的中点,判断之是否可行,然后找可行的一半处理。
上面这段话比较难懂,那么我们举个栗子:
比如,我们要求使得革命能够成功的最低成本。
那么,此时这个成本的取值范围就是0~你所拥有的全部银子(假设为1000)。然后,我们取这个区间的中点(500),计算500块可不可以让革命成功,如果可以,那么我们下一步就要检查0~499元这个区间(因为500可以,那么比500元更多的钱必然可以),对0~499这个区间做同样处理的同时记录当前最优的500元。
反过来,如果500元不能让革命成功,那么0~499元更不可以,所以我们下一步就对501~1000这个区间做检查
最终,我们记录下的最优答案就是能让革命成功的最低成本
当然,二分要满足单调性:你用500块办不成,那么0~499块也办不成,你用500大洋办得成,那么501~inf大洋一定也办得成
一般是用l和r代表当前答案可能所在区间,然后每次取mid=(l+r)/2,判断mid是否可行,然后取l~mid-1区间或者mid+1~r区间
这是一个杯具,当你将二分的l+1<r写成l<r时,相信很多人都讨厌二分的边界,每次都弄不清楚二分的l和r要等于mid,还是mid-1,又或者是mid+1,这导致了很多人因此失分,那么,到底要怎么做才能区分二分的边界呢?
二分的思想主要分三种:
下面我们将依次讲解1、2两种,第三种不推荐使用,比较容易出错
注:下面的全部模板都是求最小的满足指定条件的数(例如洛谷P2370)
话不多说,先上模板:
while (l<=r)
{
int mid=(l+r)/2;
if (check(mid))
{
ans=mid;
r=mid-1;
}
else l=mid+1;
}
printf("%d",ans);
首先,限制条件为l小于等于r,也就意味着结束需要l>r
第一步显然就是找区间中点
check(mid)是一个bool函数,返回mid是否可行,下面就是分情况讨论
例如:要找出能够当飞行员的成绩最差的候选人,测试成绩居中的人,看他能不能胜任。
先上模板:
while (l<r)
{
int mid=(l+r)/2;
if (check(mid)) r=mid
else l=mid+1;
}
printf("%d",l); //r也可以
这里,当l==r时循环停止,此时无论输出l还是输出r都可以。取中点不讲。这里我们要保证l和r都是暂时可行的(没有证明不可行)的,所以当mid被判定为可行时,r应该取到mid而不是mid-1,因为这里没有ans来记录,如果r取了mid-1,我们就永远丢失了mid这个可行解(mid永远取不到了),从而导致答案错误
如果mid不可行,仍然取l=mid+1,因为mid是不可行的,而我们要保证l可行
这里就是说,当mid可行,就在l~mid区间里面找(往小了找),否则就在mid+1~r来找,始终要保证l、r均可行且尽量靠近
这里的重点:l和r都要暂时可行且l要极小,r要极大
前方高能,划重点:
**打个比方:一群选手按实力顺序排好,然后我们要找出能够AK IOI的实力最差的选手,那么我们选实力居中的那个,测试他能不能AK IOI:
注:此处满足单调性,就是说如果X能AK IOI,那么比他强的也一定能,否则比他弱的一定不能**
再举个例子:
要找不能AK IOI的最强选手(注意,题设相反),那么照样按实力排好,测试居中的那个:
但是这个例子要注意一个特殊情况,如果l=2,r=3,mid=5/2=2,此时测试的check(mid)如果为true,那么l和r将永远卡在2和3,所以在此处,我们取的中点要靠右,也就是(l+r+1)/2,这样就能保证l和r不死循环
通过上述几个例子,应该能够比较直观的认识到这个不记录式的用法
二分查找是利用二分的思想,在一个有序递增数列中查找某个值的算法。
例子:猜数游戏,老少咸宜,在1~100中想一个数key,然后让别人猜,每猜一次,就会告诉别人是大了还是小了。这个很经典了,先猜中间那个,然后如果大了就猜更小的,否则猜更大的,如果直接猜中就结束——与二分思想不谋而合
首先我们看看模板
int l=1,r=n;
while (l<=r)
{
int mid=(l+r)/2;
if (a[mid]==key) return mid;
else if (a[mid]>key) r=mid-1;
else l=mid+1;
}
return -1;
这里增加了一种情况,那就是a[mid]==key的情况,因为此处我们要精确地查找key,所以在发现a[mid]==key的时候立刻返回mid。
其它的情况都很好理解,如果偏大就在左半边找,否则在右半边找。
这个二分查找看上去很简单,但是,凶险的在后面。
int l=1,r=n;
while (l<r)
{
int mid=(l+r)/2;
if (a[mid]>=key) r=mid; //如果要求大于,可以将=去掉
else l=mid+1;
}
return l;
怎么样,似曾相识对不对?
我们其实就是在找水平最差的能AK的人,只要把大于等于key第一个元素看做找水平最差的能AK的人,就很好理解了吧?
大于等于可以视为能够AK 。那么,我们按照之前讲到的,如果一个人可以AK(a[mid]>=key),那么比这个人强的人必然可以AK(对于所有i>mid,a[i]>=key),而且不会更优,所以不要,就让r=mid
如果这个人不可以AK(a[mid]<key),那么比他弱的更不行(对于所有i<mid,a[i]<key),就令l=mid+1
只要我们拿之前讲过的找AK的例子来类比一下,一下子就理解了
int l=1,r=n;
while (l<r)
{
int mid=(l+r)/2;
if (a[mid]<=key) l=mid; //如果求小于,可以去掉=
else r=mid-1;
}
return l;
这里也是一个类比:就是上面讲过的,不能AK的最强选手,这里的“不能AK”指的是小于等于key。
这里,如果一个人可以AK(a[mid]>key,注意,没有等于,因为这里算的是小于等于),那么他和比他强的都不符合条件,此处是r=mid-1
如果他不能AK,那么留下他和比他水平更高的(l=mid)
总结一下,我们只需要把二分查找与之前的AK例子结合起来看,就不会写错边界了
简述:地上丢了A个瓶盖,为了简化问题,我们可以当作这A个瓶盖丢在一条直线上,现在要从这些瓶盖里找出B个,使得距离最近的2个距离最大
对应关系:
只要能对应起来就很好理解了,下面是示例代码:
#define maxn 100000+500
#include<cstdio>
#include<algorithm>
using namespace std;
int n,k;
int a[maxn];
int check(int m)
{
int tmp=a[1]+m,cnt=1;
for (int i=2;i<=n;++i)
if (a[i]>=tmp)
{
cnt++;
tmp=a[i]+m;
}
return cnt>=k;
}
int main()
{
scanf("%d%d",&n,&k);
int l=1,r=1000000000;
for (int i=1;i<=n;++i)
scanf("%d",&a[i]);
sort(a+1,a+1+n);
// for (int i=1;i<=n;++i) printf("%d ",a[i]); printf("\n");
int ans=0;
while (l<r)
{
int mid=(l+r+1)/2;
if (check(mid)) l=mid;
else r=mid-1;
}
printf("%d",l);
return 0;
}
只要能找出对应关系,就一定能理解二分答案的精髓
二分就是这样,维护一个当前可行区间,然后,尽量地取到更优,在当前值不可行的情况下牺牲优秀程度。诚心希望大家已经大概明白了二分的边界取值方法。
就像生活一样,在能够吃饱穿暖的情况下去旅行、去滑雪、去享受大自然、去为每一件小事感动……