数字组成的奥妙——数位dp

Mathison

2018-10-10 07:31:43

Theory

## 【序】 >数位dp就是套模板 ——lwz dalao _(数位dp确实可以套模板,但笔者建议还是要理解这个过程,这样才能灵活变化)_ ## 【引言】 数位dp一直以来是dp家族里比较冷门的一种,但一旦考察不会数位dp靠暴力很难骗分 今天我们就来分析一下数位dp的全过程 ## 【引入】 首先我们要清楚数位dp解决的是什么问题: #### 求出在给定区间$[A,B]$内,符合条件$f(i)$的数$i$的个数。条件$f(i)$一般与数的大小无关,而与数的组成有关 由于数是按位dp,**数的大小对复杂度的影响很小** ## 【设计搜索】 这里我们使用**记忆化搜索**实现数位dp。本质上记搜其实就是dp,下文会重点介绍dp值的使用和记录 ### 一、记搜过程 从起点向下搜索,到最底层得到方案数,一层一层向上返回答案并累加,最后从搜索起点得到最终答案。 对于$[l,r]$区间问题,我们一般把他转化为两次数位dp,即找$[0,r]$和$[0,l-1]$两段,再将结果相减就得到了我们需要的$[l,r]$ ### 二、状态设计 如果理解了上述过程,我们需要考虑的就是怎样判断现在在哪一层,怎样判断当前的状态——这就需要我们传进一些参量。 **$\text{dfs}$函数需要哪些参量**? 1. 首先是数位dp基本的量数字位数$pos$,记录答案的$st$,最高位限制$limit$(这个后面会讲) 2. 我们还需要一个判断判断前导0的标记$lead$(这个后面也会讲) 3. 由于数位dp解决的大多是数字组成问题,所以经常要比较当前位和前一位或前几位的关系(根据题意而定),所以一般在dfs()中也要记录前一位或前几位数$pre$方便比较。 4. 除此之外还可以传进更多参量以区分状态,视题意而定。 数位dp的状态能记录的最好都记录上 ——lwz dalao ## 【细节分析】 ### 一、前导0标记$\text{lead}$ 由于我们要搜的数可能很长,所以我们的直接最高位搜起 举个例子:假如我们要从$[0,1000]$找任意相邻两数相等的数 显然$111,222,888$等等是符合题意的数 但是我们发现右端点$1000$是四位数 因此我们搜索的起点是$0000$,而三位数的记录都是$0111,0222,0888$等等 而这种情况下如果我们直接找相邻位相等则$0000$符合题意而$0111,0222,0888$都不符合题意了 所以我们要加一个前导0标记 1. 如果当前位$lead=1$而且当前位也是0,那么当前位也是前导0,$pos+1$继续搜; 1. 如果当前位$lead=1$但当前位不是0,则本位作为当前数的最高位,$pos+1$继续搜;(注意这次根据题意st或其他参数可能发生变化) 当然前导$0$有时候是不需要判断的,上述的例子是一个有关数字结构上的性质,0会影响数字的结构,所以必须判断前导0;而如果我们研究的是数字的组成(例如这个数字有多少个$1$之类的问题),0并不影响我们的判断,这样就不需要前导0标记了。总之,这个因题而异,并不是必须要标记(当然记了肯定是不会出错的) ### 二、最高位标记$\text{limit}$ 我们知道在搜索的数位搜索范围可能发生变化; 举个例子:我们在搜索$[0,555]$的数时,显然最高位搜索范围是$0$~$5$,而后面的位数的取值范围会根据上一位发生变化: 1. 当最高位是$1$~$4$时,第二位取值为$[0,9]$; 2. 当最高位是$5$时,第二位取值为$[0,5]$(再往上取就超出右端点范围了) 为了分清这两种情况,我们引入了$\text{limit}$标记: 1. 若当前位$limit=1$而且已经取到了能取到的最高位时,下一位$limit=1$; 1. 若当前位$limit=1$但是没有取到能取到的最高位时,下一位$limit=0$; 1. 若当前位$limit=0$时,下一位$limit=0$。 我们设这一位的标记为$limit$,这一位能取到的最大值为$res$,则下一位的标记就是$i==res$&&$limit$($i$枚举这一位填的数) ### 三、$\text{dp}$值的记录和使用 最后我们考虑dp数组下标记录的值 本文介绍数位dp是在**记忆化搜索**的框架下进行的,每当找到一种情况我们就可以这种情况记录下来,等到搜到后面遇到相同的情况时直接使用当前记录的值。 dp数组的**下标**表示的是**一种状态**,只要**当前的状态和之前搜过的某个状态完全一样**,我们就可以直接返回原来已经记录下来的dp值。 再举个例子 假如我们找$[0,123456]$中符合某些条件的数 假如当我们搜到$1000??$时,dfs从下返上来的数值就是**当前位是第$5$位,前一位是$0$时的方案种数**,搜完这位会向上反,这是我们可以记录一下:当前位第$5$位,前一位是$0$时,有这么多种方案种数 当我们继续搜到$1010??$时,我们发现当前状态又是搜到了第$5$位,并且上一位也是$0$,这与我们之前记录的情况相同,这样我们就可以不继续向下搜,直接把上次的dp值返回就行了。 注意,我们返回的dp值必须和当前**处于完全一样的状态**,这就是为什么dp数组下标要记录$pos,pre$等参量了。 最重要的来了———————————————————— 接着上面的例子,范围$[0,123456]$ 如果我们搜到了$1234??$,我们能不能直接返回之前记录的:当前第$5$位,前一位是$4$时的dp值? 答案是否定的 我们发现,这个状态的dp值被记录时,当前位也就是第$5$位的取值是$[0,9]$,而这次当前位的取值是$[0,5]$,方案数一定比之前记录的dp值要小。 当前位的取值范围为什么会和原来不一样呢? 如果你联想到了之前所讲的知识,你会发现:现在的$limit=1$,最高位有取值的限制。 因此我们可以得到一个结论:**当$limit=1$时,不能记录和取用dp值!** 类似上述的分析过程,我们也可以得出:**当$lead=1$时,也不能记录和取用dp值!** p.s.~~当然没有这么绝对的说……因题而异的说……~~ 以上就是计划搜索的完整步骤。 附图: ![](https://cdn.luogu.com.cn/upload/pic/37265.png) ## 【模板】 ```cpp ll dfs(int pos,int pre,int st,……,int lead,int limit)//记搜 { if(pos>len) return st;//剪枝 if((dp[pos][pre][st]……[……]!=-1&&(!limit)&&(!lead))) return dp[pos][pre][st]……[……];//记录当前值 ll ret=0;//暂时记录当前方案数 int res=limit?a[len-pos+1]:9;//res当前位能取到的最大值 for(int i=0;i<=res;i++) { //有前导0并且当前位也是前导0 if((!i)&&lead) ret+=dfs(……,……,……,i==res&&limit); //有前导0但当前位不是前导0,当前位就是最高位 else if(i&&lead) ret+=dfs(……,……,……,i==res&&limit); else if(根据题意而定的判断) ret+=dfs(……,……,……,i==res&&limit); } if(!limit&&!lead) dp[pos][pre][st]……[……]=ret;//当前状态方案数记录 return ret; } ll part(ll x)//把数按位拆分 { len=0; while(x) a[++len]=x%10,x/=10; memset(dp,-1,sizeof dp);//初始化-1(因为有可能某些情况下的方案数是0) return dfs(……,……,……,……);//进入记搜 } int main() { scanf("%d",&T); while(T--) { scanf("%lld%lld",&l,&r); if(l) printf("%lld",part(r)-part(l-1));//[l,r](l!=0) else printf("%lld",part(r)-part(l));//从0开始要特判 } return 0; } ``` ## 【例题详解】 _注: 推荐此题的原因是这道题涉及到的需要记录的量较多,比较典型,如果觉得比较难理解也没关系,先看下面的例题推荐_ 【题意简述】 定义一个正整数的价值是把这个数的十进制写出来之后,最长的等差子串的长度。 求$[l,r]$范围内数字价值的总和。 【分析】 这道题很显然是一道数位dp,那么我们应该怎么样设计状态和转移呢? 数位位置,前一位数,等差数列共差是一定要记录的 我们还要把当前最大价值和整个数最大值也作为状态 dp过程见代码注释(数位dp主要还是套板子呀) ```cpp #include<bits/stdc++.h> using namespace std; typedef long long ll; int T,n,m,len,a[20]; ll l,r,dp[20][15][25][25][20]; ll dfs(int pos,int pre,ll st,ll sum,int d,int lead,int limit) //pos搜到的位置 //pre前一位数 //st当前公差最大差值 //sum整个数字的最大价值 //d共差 //lead判断是否有前导0 //limit判断是否有最高位限制 { if(pos>len) return sum;//dp结束 //记录状态(计划搜索) //注意d有负数,最小可以到-9,所以记录时数组下标是d+10 if((dp[pos][pre][st][sum][d+10]!=-1&&(!limit)&&(!lead))) return dp[pos][pre][st][sum][d+10]; ll ret=0; int res=limit?a[len-pos+1]:9;//最高位最大值 for(int i=0;i<=res;i++) { //有前导0且这位也是前导0,一切不变只有位数变化 if((!i)&&lead) ret+=dfs(pos+1,0,0,0,-38,1,limit&&(i==res)); //有前导0但这位不是前导0(这位是数字的最高位)开始有前一位,一个数形成等差数列 else if(i&&lead) ret+=dfs(pos+1,i,1,1,-38,0,limit&&(i==res)); //之前刚搜到1位还没有共差,两位数形成等差数列,记录共差 else if(d<-9) ret+=dfs(pos+1,i,2ll,2ll,i-pre,0,limit&&(i==res)); //搜到2位以后,共差若与前两位相同当前等差数列长度增加,若公差变化则更新整个数字的最大价值,等差数列长度又变为2 else if(d>=-9) ret+=dfs(pos+1,i,(i-pre==d)?st+1:2,max(sum,(i-pre==d)?st+1:2),(i-pre==d)?d:i-pre,0,limit&&(i==res)); } //没有前导0和最高限制时可以直接记录当前dp值以便下次搜到同样的情况可以直接使用。 return (!limit&&!lead)?dp[pos][pre][st][sum][d+10]=ret:ret; } ll part(ll x) { len=0; while(x) a[++len]=x%10,x/=10; memset(dp,-1,sizeof dp); return dfs(1,0,0,0,-38,1,1);//-38是随便赋的其实赋成-10就行了…… } int main() { scanf("%d",&T); while(T--) { scanf("%lld%lld",&l,&r); //l是0的时候要特别注意! printf("%lld\n",l?(part(r)-part(l-1)):(part(r)-part(l)+1)); } return 0; } ``` ## 【题目推荐】 - [[HDU2089]不要62](http://acm.hdu.edu.cn/showproblem.php?pid=2089) 入门题,如果上面的例题没看懂可以先尝试一下这道题,如果上面的例题理解了这题可以秒切 - [P2657 [SCOI2009]windy数](https://www.luogu.org/problemnew/show/P2657) - [P2602 [ZJOI2010]数字计数](https://www.luogu.org/problemnew/show/P2602) 这两题是数位dp题目里的基础题,多体会上述的讲解就能够顺利地想出解法~~(实在不行还可以背板子的吧)~~ - [P3413 萌数](https://www.luogu.org/problemnew/show/P3413) 这道题是笔者接触数位dp的第一题,当时学长讲完之后还有点懵,现在发现不是特别难的题目,还是比较套路的 - [P4127 [AHOI2009]同类分布](https://www.luogu.org/problemnew/show/P4127) - [P4317 花神的数论题](https://www.luogu.org/problemnew/show/P4317) 相比前面,这道题就显得灵活一些,可能在统计答案的方法上有一些变化,但相信当你做完上面的题之后,这两道题也不在话下! 当然也有些题看起来不是数位dp,但是可能依靠一些数论知识把问题转化成一道数位dp题(比如一些**数字本身的性质**转化成**数字组成的特点**),这里就不再过多赘述。 ## 【后记】 数位dp虽然大多在套模板,但是里面的判断和细节还是很多的,多写几道数位dp之后才能发现其中的规律,完全将其掌握。 ## 【特别鸣谢】 本文是笔者听过了两位dalao的讲解后撰写而成 初识数位dp:学长Vergil 【[LVYOUYW](https://www.luogu.org/space/show?uid=12736)】 知识巩固:dalao lwz 【[lwz2002](https://www.luogu.org/space/show?uid=75010)】