Great_Influence
2018-05-11 18:37:51
此处多项式算法,主要针对基于快速傅里叶变换
[TOC]
点我
一切算法的基础。直接做为
配合预处理单位根可以提升精度和速度。
inline void FFT(comp*F,int tl)
{
rep(i,0,Len)if(i<rev[i])swap(F[rev[i]],F[i]);
for(register int i=2,ii=1,t=1;i<=Len;i<<=1,ii<<=1,++t)
for(register int j=0;j<Len;j+=i)rep(k,0,ii)
{
comp x=F[j+k+ii]*g[t][k];
F[j+k+ii]=F[j+k]-x;
F[j+k]=F[j+k]+x;
}
if(tl==-1)
{
reverse(F+1,F+Len);
rep(i,0,Len)F[i]=F[i]/Len;
}
}
inline void NTT(int*F,int typ)
{
Rep(i,1,Len-1)if(i<rev[i])swap(F[i],F[rev[i]]);
for(register int i=2,ii=1,t=1;i<=Len;i<<=1,ii<<=1,++t)
for(register int j=0;j<Len;j+=i)rep(k,0,ii)
{
register int tt=(uint64)F[j+k+ii]*g[t][k]%mod;
F[j+k+ii]=ad(F[j+k],mod-tt);
F[j+k]=ad(F[j+k],tt);
}
if(typ==-1)
{
reverse(F+1,F+Len);
register uint64 invn=power(Len,mod-2);
rep(i,0,Len)F[i]=invn*F[i]%mod;
}
}
int X[MAXN],Y[MAXN];
inline void mul(int *a,int *b,int *c,int lenl,int lenr)
{
if(lenl<=300/lenr)
{
Rep(i,0,lenl+lenr)c[i]=0;
Rep(i,0,lenl)Rep(j,0,lenr)c[i+j]=(c[i+j]+a[i]*b[j])%mod;
return;
}
for(Len=2;Len<=lenl+lenr;Len<<=1);
Rep(i,0,lenl)X[i]=a[i];
Rep(i,0,lenr)Y[i]=b[i];
rep(i,lenl+1,Len)X[i]=0;
rep(i,lenr+1,Len)Y[i]=0;
NTT(X,1),NTT(Y,1);
rep(i,0,Len)X[i]=(ll)X[i]*Y[i]%mod;
NTT(X,-1);
Rep(i,0,lenl+lenr)c[i]=X[i];
}
注意
以下几个操作大多基于取模来实现,存在一个特殊的模数,满足其减
点我
也算是基础吧。
设要求
设
假设已知
两边平方,则
同乘
利用这个公式直接倍增就好了。时间复杂度利用主定理可以证明为
inline void Inv(int*F,int*G,int ln)
{
Iv[0]=power(F[0],mod-2);
rep(i,0,ln)X[i]=Y[i]=0;
for(register int Ln=2;Ln<=ln;Ln<<=1)
{
rep(i,0,Ln)X[i]=F[i];
rep(i,0,(Ln>>1))Y[i]=Iv[i];
Len=Ln,calrev();
NTT(X,1),NTT(Y,1);
rep(i,0,Ln)X[i]=(uint64)X[i]*Y[i]%mod;
NTT(X,-1);
rep(i,0,(Ln>>1))X[i]=0;
NTT(X,1);
rep(i,0,Ln)X[i]=(uint64)X[i]*Y[i]%mod;
NTT(X,-1);
rep(i,(Ln>>1),Ln)Iv[i]=mod-X[i];
}
rep(i,0,ln)G[i]=Iv[i];
}
点我
已知函数
保证
先考虑一种操作:
拆开发现该操作的作用就是将
然后开始化式子。
为了简便,设
将这个式子放在模
多项式求逆即可。至于
static int X[MAXN],Y[MAXN];
inline void Div(int *a,int n,int *b,int m)
{
memcpy(X,a,sizeof X);memcpy(Y,b,sizeof Y);
reverse(b,b+m+1);reverse(X,X+n+1);
Rep(i,n-m+1,n)X[i]=0;
Inv(b,n-m+1);
while(Len<=(n<<2))Len<<=1;
calrev(Len);
mul(X,b);reverse(X,X+n-m+1);
Rep(i,n-m+1,n)X[i]=0;
mul(Y,X);
Rep(i,0,m-1)b[i]=ad(a[i],mod-Y[i]);
memcpy(a,X,sizeof X);
}
点我
开始有点麻烦了。依旧采用倍增来求。
已知
假设求出
有
因为存在平方,所以存在2个解。设
又因为
直接倍增计算即可。时间复杂度依旧
inline void Sqrt(int*F,int*G,int ln)
{
G[0]=1;
for(register int Ln=2;Ln<=ln;Ln<<=1)
{
mul(G,G,ExX,Ln>>1,Ln>>1);
rep(i,0,Ln>>1)ExX[i]=ad(mod-ExX[i+(Ln>>1)],F[i+(Ln>>1)]);
rep(i,Ln>>1,Ln)ExX[i]=0;
Inv(G,ExY,Ln>>1);
Len=Ln,calrev();
NTT(ExX,1),NTT(ExY,1);
rep(i,0,Ln)ExX[i]=(ll)ExX[i]*ExY[i]%mod;
NTT(ExX,-1);
rep(i,0,Ln>>1)G[i+(Ln>>1)]=(ll)ExX[i]*inv2%mod;
}
}
这就不要例题了吧...
设
定义:
直接
inline void Direv(int *a,int n)
{Rep(i,1,n)a[i-1]=(ll)a[i]*i%mod;a[n]=0;}
inline void Inter(int *a,int n)
{Repe(i,n,1)a[i]=(ll)a[i-1]*power(i,mod-2)%mod;a[0]=0;}
模板题点我
做完模板可以点我
其中,
直接计算即可。
函数
因为
因此后面几项在
因此得到关系式
整理即得上式。
(代码依
考虑对方程
可以得到递推式:
考虑对方程
可以得到递推式:
见下文。
使用牛顿法,我们通常需要多次求出
可以发现,因为
例如,多项式开方的公式为
点我
由泰勒展开可得
已知函数
可以知道
所以
直接套用上方多项式牛顿迭代的公式,可得
倍增即可。时间复杂度
该算法常数巨大,经验算大约在
最近发现常数过大还没有分治
static int ExX[MAXN],ExY[MAXN];
inline void Exp(int *F,int *G,int ln)
{
G[0]=1;
for(register int Lx=2;Lx<=ln;Lx<<=1)
{
rep(i,Lx>>1,Lx)G[i]=0;
Ln(G,ExX,Lx);
rep(i,0,Lx>>1)ExX[i]=ad(F[i+(Lx>>1)],mod-ExX[i+(Lx>>1)]);
rep(i,0,Lx>>1)ExY[i]=G[i];
rep(i,Lx>>1,Lx)ExX[i]=0;
Len=Lx;
calrev();
NTT(ExY,1),NTT(ExX,1);
rep(i,0,Len)ExX[i]=(ll)ExX[i]*ExY[i]%mod;
NTT(ExX,-1);
rep(i,0,Len>>1)G[i+(Len>>1)]=ExX[i];
}
}
例题见10.拉格朗日反演。
直接上式子吧...
当
否则,设最低项为
直接按照式子计算即可。时间复杂度
直接求
inline void Pow(int*F,int*G,int ln,ll k)
{
int lst=ln+1;
Rep(i,0,ln)if(F[i]){lst=i;break;}
if(ln&&(__int128)lst*k>ln)
{memset(G,0,sizeof(int)*(ln+1));return;}
int md=ln-k*lst,bs=F[lst],iv=power(bs,mod-2);
Rep(i,lst,ln)G[i]=(ll)G[i]*iv%mod;
Ln(G+lst,G,md);
k%=mod;
Rep(i,0,md)G[i]=(ll)G[i]*k%mod;
Exp(G,G,md);
bs=power(bs,k);
Repe(i,md,0)G[i+lst*k]=(ll)G[i]*bs%mod;
memset(G,0,sizeof(int)*(lst*k));
}
在膜意义下,存在一下转化:
直接套用上面的幂次即可。复杂度为
代码就咕了。
点我
已知
经过复杂的推理,存在关系式:
其中
直接按照式子模拟即可。时间复杂度
inline int Lagrange(int *a,int n)
{
Rep(i,0,n-1)a[i]=a[i+1];
Inv(a,n);
pow(a,n,n);
return (ll)a[n-1]*power(n,mod-2)%mod;
}
其实就是另一个式子。
点我
已知
其实哪怕是
考虑利用分治。
假设我们求出了
这部分可以利用卷积来快速计算。计算完以后,答案直接加到答案数组就可以了。
需要注意的是,如果要求左边点对右边点的影响,首先整个区间以左对该区间的贡献应该先求出。所以分治过程为先分治左边,在求出中间,然后在递归右边。
时间复杂度
有一个简单卡常方法。求一层的时候,我们会做长度为
代码(求
void cdq_FFT(int l,int r)
{
if(l==r)
{
if(!l)F[l]=1;
else F[l]=(ll)F[l]*iv[l]%mod;
return;
}
int md=(l+r)>>1;cdq_FFT(l,md);
for(Len=2;Len<=r-l;Len<<=1);
calrev();
memset(X,0,sizeof(int)*Len);
memset(Y,0,sizeof(int)*Len);
memcpy(X,F+l,sizeof(int)*(md-l+1));
memcpy(Y,a,sizeof(int)*(r-l));
NTT(X,1),NTT(Y,1);
rep(i,0,Len)X[i]=(ll)X[i]*Y[i]%mod;
NTT(X,-1);
Rep(i,md+1,r)F[i]=ad(F[i],X[i-l-1]);
cdq_FFT(md+1,r);
}
点我
先假设你会前面的推式子部分。
你现在得到了一个长得很丑的式子,大概长这样:
换句话说,你得到了一个类似于
这时候,你就需要对你的分治
void cdqFFT(int *f,int l,int r)
{
if(l==r)
{
f[l]=ad(f[l],(uint64)(l-1)*f[l-1]%mod);
return;
}
int mid=(l+r)>>1;
cdqFFT(f,l,mid);
for(Len=r-l+1;Len>(Len&-Len);Len+=(Len&-Len));
Rep(i,0,Len)A[i]=B[i]=0;
Rep(i,l,mid)A[i-l]=(uint64)f[i]*(i-1)%mod,B[i-l]=f[i];
calrev(Len);mul(A,B);
Rep(i,mid+1,r)if(i>=l*2)f[i]=ad(f[i],A[i-2*l]);
if(l^2)
{
Rep(i,0,Len)A[i]=B[i]=0;
Rep(i,2,min(l-1,r-l))A[i-2]=f[i];
Rep(i,l,mid)B[i-l]=f[i];
mul(A,B);
Rep(i,mid+1,r)if(i>=l+2)
f[i]=ad(f[i],(uint64)(i-2)*A[i-l-2]%mod);
}
cdqFFT(f,mid+1,r);
}
稍微解释一下。
首先,前面的
问题就在于后面的
其余部分和一般分治
注意,我程序内部有一个
点我
主要就是推式子。
推导过程和代码见线性递推。
经过审稿管理员提示,我发现原来这东西还是有用的。。。
已知
首先,可以知道,如果求出了
根据欧拉定理可知:
其中,
那么同理可得
将
注意以上的内容是
由
可得
因为
至于
推得:
同理得:
static int Sn[MAXN],Cs[MAXN];
inline void Cos(int*F,int*G,int ln)
{
Rep(i,0,ln)Cs[i]=(ll)F[i]*w4%mod;
Exp(Cs,Cs,ln),Inv(Cs,G,ln);
Rep(i,0,ln)G[i]=((ll)Cs[i]+G[i])*inv2%mod;
}
const int w43div2=(ll)w4*w4%mod*w4%mod*inv2%mod;
inline void Sin(int*F,int*G,int ln)
{
Rep(i,0,ln)Sn[i]=(ll)F[i]*w4%mod;
Exp(Sn,Sn,ln),Inv(Sn,G,ln);
Rep(i,0,ln)G[i]=((ll)Sn[i]+mod-G[i])*w43div2%mod;
}
这个东西和上面的没有半毛钱关系。。。
根据积分表可以知道:
那么同理可得:
直接计算即可。
代码:
inline void Arcsin(int*F,int*G,int ln)
{
memcpy(Sn,F,sizeof(int)*(ln+1));
for(Len=2;Len<=ln*2;Len<<=1);calrev();
NTT(Sn,1);rep(i,0,Len)Sn[i]=(ll)Sn[i]*Sn[i]%mod;
NTT(Sn,-1);
Sn[0]=1;rep(i,ln+1,Len)Sn[i]=0;
Rep(i,1,ln)Sn[i]=mod-Sn[i];
Sqrt(Sn,Sn,ln);
Inv(Sn,Sn,ln);
Deriv(F,G,ln);
mul(G,Sn,G,ln,ln);
Rep(i,ln+1,ln<<1)G[i]=0;
Inter(G,G,ln);
}
inline void Arctan(int*F,int*G,int ln)
{
memcpy(Sn,F,sizeof(int)*(ln+1));
for(Len=2;Len<=ln*2;Len<<=1);calrev();
NTT(Sn,1);rep(i,0,Len)Sn[i]=(ll)Sn[i]*Sn[i]%mod;
NTT(Sn,-1),Sn[0]=1;
rep(i,ln+1,Len)Sn[i]=0;Inv(Sn,Sn,ln);
Deriv(F,G,ln),mul(G,Sn,G,ln,ln);
Rep(i,ln+1,ln<<1)G[i]=0;
Inter(G,G,ln);
}
点我
已知函数
直接计算是
构造一个函数
可以发现,
因此,
于是,设
直接分治即可。时间复杂度为
static int solv[18][2][MAXN];
inline void calc(int*a,int l,int r,int lev,int dir)
{
if(l==r)
{
solv[lev][dir][0]=mod-a[l];
solv[lev][dir][1]=1;return;
}
int md=(l+r)>>1;
calc(a,l,md,lev+1,0),calc(a,md+1,r,lev+1,1);
mul(solv[lev+1][0],solv[lev+1][1],solv[lev][dir],md-l+1,r-md);
}
static int pol[18][MAXN],Q[MAXN];
void getnum(int*a,int*ans,int l,int r,int lev,int n)
{
if(n>r-l)
{
calc(a,l,r,0,0);
Div(pol[lev-(lev>0)],solv[0][0],Q,pol[lev],n,r-l+1);
n=r-l;
}
else if(lev){Rep(i,0,n)pol[lev][i]=pol[lev-1][i];}
if(l==r)
{
ans[l]=pol[lev][0];
return;
}
int md=(l+r)>>1;
getnum(a,ans,l,md,lev+1,n);
getnum(a,ans,md+1,r,lev+1,n);
}
点我
给定二维平面上点集
核心内容是优化拉格朗日插值。
具体过程见多项式快速插值。
点我还有我
上面的所有函数基于模数为一个
inline void mul(int*F,int*G)
{
rep(i,0,Len)A[i]=comp(F[i]>>15,F[i]&32767),
C[i]=comp(G[i]>>15,G[i]&32767);
DBLFFT(A,B,1),DBLFFT(C,D,1);
rep(i,0,Len)
{
register comp t=A[i];
A[i]=B[i]*C[i]+A[i]*D[i];
B[i]=B[i]*D[i];
C[i]=C[i]*t;
}
DBLFFT(A,B,-1),FFT(C,-1);
rep(i,0,Len)
{
register int lz=(((ll)floor(C[i].re+0.5))%mod*73741817
+((ll)floor(A[i].re+0.5))%mod*32768+(ll)floor(B[i].re+0.5))%mod;
F[i]=i<=k?lz:0;
}
}
其中
简单解释其实就是将系数拆成
具体还是看
顺便一提,配合共轭优化后可以做到
这个算例题吧
已知多项式
被这个东西送到了退役边缘。。。只怪我自己没有认真看论文。。。
因为
设
那么,将式子写出,得:
设这个东西为
运用套路,得:
因此有:
因为我们每一项都要卷到
我们设
时间复杂度
这个过程被称为
算出这个东西后,我们就可以将他当做以
代码:
inline void Blue_Stein(int*F,int*G,int ln)
{
rep(i,0,ln)A[i]=(ll)F[i]*power(ome,ln-(ll)i*(i-1)/2%ln,mod)%mod;
Rep(i,0,2*ln-2)B[i]=power(ome,ln+(ll)(ln-1-i)*(ln-2-i)/2%ln,mod);
mul(A,B,A,ln-1,2*ln-2);
reverse(A+1,A+k);
rep(i,0,ln)G[i]=(ll)A[i+k-1]*power(ome,ln-(ll)(-i)*(-i-1)/2%ln,mod)%mod;
}
注意使用的时候大部分情况下模数都不会很友好,因此结合上面的
根据经验可以发现,多项式方面的常数差异非常大,有的时候别人跑过了但是你没跑过就凉了。因此,常数优化是非常重要的。限于篇幅就只推荐这篇和这篇了。后面那篇的详细内容和不详细证明可以参考毛爷爷的国家队论文。
此处放出共轭优化的代码。该代码可以同时对
static comp Z[MAXN];
inline void DBLFFT(comp*F,comp*G,int tl)
{
if(tl==1)
{
memcpy(Z,F,sizeof(comp)*Len);
FFT(Z,1);
memcpy(F,Z,sizeof(comp)*Len);
reverse(F+1,F+Len);
rep(i,0,Len)F[i].im=-F[i].im;
rep(i,0,Len)G[i]=(Z[i]-F[i])/2,F[i]=(Z[i]+F[i])/2
,swap(G[i].re,G[i].im),G[i].im=-G[i].im;
}
else
{
rep(i,0,Len)F[i]=comp(F[i].re-G[i].im,F[i].im+G[i].re);
FFT(F,-1);
rep(i,0,Len)G[i]=comp(F[i].im,0),F[i]=comp(F[i].re,0);
}
}
点我
和
限于篇幅在另一篇文章作说明。
已知
这道题汇集了几乎所有的多项式基础操作,有兴趣的可以尝试做一下,练练手。
#include<bits/stdc++.h>
#define Rep(i,a,b) for(register int i=(a);i<=(b);++i)
#define Repe(i,a,b) for(register int i=(a);i>=(b);--i)
#define rep(i,a,b) for(register int i=(a);i<(b);++i)
#define pb push_back
#define mx(a,b) (a>b?a:b)
#define mn(a,b) (a<b?a:b)
typedef unsigned long long uint64;
typedef unsigned int uint32;
typedef long long ll;
using namespace std;
namespace IO
{
const uint32 Buffsize=1<<15,Output=1<<24;
static char Ch[Buffsize],*S=Ch,*T=Ch;
inline char getc()
{
return((S==T)&&(T=(S=Ch)+fread(Ch,1,Buffsize,stdin),S==T)?0:*S++);
}
static char Out[Output],*nowps=Out;
inline void flush(){fwrite(Out,1,nowps-Out,stdout);nowps=Out;}
template<typename T>inline void read(T&x)
{
x=0;static char ch;T f=1;
for(ch=getc();!isdigit(ch);ch=getc())if(ch=='-')f=-1;
for(;isdigit(ch);ch=getc())x=x*10+(ch^48);
x*=f;
}
template<typename T>inline void write(T x,char ch='\n')
{
if(!x)*nowps++='0';
if(x<0)*nowps++='-',x=-x;
static uint32 sta[111],tp;
for(tp=0;x;x/=10)sta[++tp]=x%10;
for(;tp;*nowps++=sta[tp--]^48);
*nowps++=ch;
}
}
using namespace IO;
void file(void)
{
FILE*DSD=freopen("polynomial.in","r",stdin);
FILE*CSC=freopen("polynomial.out","w",stdout);
}
const int MAXN=1<<21;
namespace poly
{
const int mod=998244353,gen=3;
static int g[23],iv[MAXN];
inline int power(int u,int v)
{
register int sm=1;
for(;v;v>>=1,u=(uint64)u*u%mod)if(v&1)
sm=(uint64)sm*u%mod;
return sm;
}
inline void predone()
{
Rep(i,1,21)g[i]=power(gen,(mod-1)>>i);
iv[1]=1;
Rep(i,2,1e5)iv[i]=mod-(uint64)mod/i*iv[mod%i]%mod;
}
static int Len,rev[MAXN];
inline void calrev()
{
int II=log(Len)/log(2)-1;
Rep(i,1,Len-1)rev[i]=rev[i>>1]>>1|(i&1)<<II;
}
inline int ad(int u,int v){return(u+=v)>=mod?u-mod:u;}
inline void NTT(int*F,int typ)
{
Rep(i,1,Len-1)if(i<rev[i])swap(*(F+i),*(F+*(rev+i)));
for(register int i=2,ii=1,t=1;i<=Len;i<<=1,ii<<=1,++t)
{
register int wn=*(g+t);
for(register int j=0;j<Len;j+=i)
{
register int w=1;
rep(k,0,ii)
{
register int tt=(uint64)*(F+j+k+ii)*w%mod;
*(F+j+k+ii)=ad(*(F+j+k),mod-tt);
*(F+j+k)=ad(*(F+j+k),tt);
w=(uint64)w*wn%mod;
}
}
}
if(typ==-1)
{
reverse(F+1,F+Len);
register uint64 invn=power(Len,mod-2);
rep(i,0,Len)*(F+i)=invn**(F+i)%mod;
}
}
static int X[MAXN],Y[MAXN],Iv[MAXN];
inline void mul(int *a,int *b,int *c,int lenl,int lenr)
{
if((ll)lenl*lenr<=300)
{
Rep(i,0,lenl+lenr)X[i]=0;
Rep(i,0,lenl)Rep(j,0,lenr)
X[i+j]=(X[i+j]+(ll)a[i]*b[j])%mod;
Rep(i,0,lenl+lenr)c[i]=X[i];
return;
}
for(Len=2;Len<=lenl+lenr;Len<<=1);
calrev();
Rep(i,0,lenl)X[i]=a[i];
Rep(i,0,lenr)Y[i]=b[i];
rep(i,lenl+1,Len)X[i]=0;
rep(i,lenr+1,Len)Y[i]=0;
NTT(X,1),NTT(Y,1);
rep(i,0,Len)X[i]=(ll)X[i]*Y[i]%mod;
NTT(X,-1);
Rep(i,0,lenl+lenr)c[i]=X[i];
rep(i,lenl+lenr+1,Len)c[i]=0;
}
inline void Inv(int*F,int*G,int ln)
{
Iv[0]=power(F[0],mod-2);
for(register int Ln=2;Ln>>1<=ln;Ln<<=1)
{
rep(i,ln+1,Ln)F[i]=0;
rep(i,0,Ln)X[i]=F[i],Y[i]=0;
rep(i,0,(Ln>>1))Y[i]=Iv[i];
Len=Ln,calrev();
NTT(X,1),NTT(Y,1);
rep(i,0,Ln)X[i]=(uint64)X[i]*Y[i]%mod;
NTT(X,-1);
rep(i,0,(Ln>>1))X[i]=0;
NTT(X,1);
rep(i,0,Ln)X[i]=(uint64)X[i]*Y[i]%mod;
NTT(X,-1);
rep(i,(Ln>>1),Ln)Iv[i]=mod-X[i];
}
Rep(i,0,ln)G[i]=Iv[i];
}
static int ExX[MAXN],ExY[MAXN],Op[MAXN];
inline void Div(int*F,int*G,int*Q,int*R,int lenf,int leng)
{
Rep(i,0,lenf)ExX[i]=F[lenf-i];
Rep(i,0,leng)ExY[i]=G[leng-i];
Rep(i,leng+1,lenf-leng)ExY[i]=0;
Inv(ExY,ExY,lenf-leng);
Rep(i,lenf-leng+1,lenf)ExX[i]=0;
Rep(i,lenf-leng+1,leng)ExY[i]=0;
mul(ExX,ExY,ExY,lenf-leng,lenf-leng);
Rep(i,lenf-leng+1,(lenf-leng)<<1)ExY[i]=0;
Rep(i,0,(lenf-leng)>>1)swap(ExY[i],ExY[lenf-leng-i]);
mul(ExY,G,ExX,lenf-leng,leng);
assert(F[leng]==ExX[leng]);
Rep(i,0,leng-1)R[i]=ad(F[i],mod-ExX[i]);
Rep(i,0,lenf-leng)Q[i]=ExY[i];
}
const int inv2=(mod+1)>>1;
inline void Sqrt(int*F,int*G,int ln)
{
Op[0]=sqrt(F[0]);
for(register int Ln=2;Ln>>1<=ln;Ln<<=1)
{
mul(Op,Op,ExX,Ln>>1,Ln>>1);
rep(i,0,Ln>>1)ExX[i]=ad(mod-ExX[i+(Ln>>1)],F[i+(Ln>>1)]);
rep(i,Ln>>1,Ln)Op[i]=ExX[i]=0;
Inv(Op,ExY,Ln>>1);
Len=Ln,calrev();
NTT(ExX,1),NTT(ExY,1);
rep(i,0,Ln)ExX[i]=(ll)ExX[i]*ExY[i]%mod;
NTT(ExX,-1);
rep(i,0,Ln>>1)Op[i+(Ln>>1)]=(ll)ExX[i]*inv2%mod;
}
Rep(i,0,ln)G[i]=Op[i];
}
inline void Deriv(int*F,int*G,int ln)
{Rep(i,1,ln)G[i-1]=(uint64)F[i]*i%mod;G[ln]=0;}
inline void Inter(int*F,int*G,int ln)
{Repe(i,ln,1)G[i]=(uint64)F[i-1]*iv[i]%mod;G[0]=0;}
static int LnX[MAXN];
inline void Ln(int*F,int*G,int ln)
{
Deriv(F,LnX,ln),Inv(F,G,ln);
for(Len=2;Len<=ln<<1;Len<<=1);
rep(i,ln+1,Len)LnX[i]=G[i]=0;
calrev();
NTT(LnX,1),NTT(G,1);
rep(i,0,Len)G[i]=(uint64)G[i]*LnX[i]%mod;
NTT(G,-1);
Inter(G,G,ln);
}
inline void Exp(int *F,int *G,int ln)
{
Op[0]=1;
for(register int Lx=2;Lx>>1<=ln;Lx<<=1)
{
rep(i,Lx>>1,Lx)Op[i]=0;
Ln(Op,ExX,Lx);
rep(i,0,Lx>>1)ExX[i]=ad(F[i+(Lx>>1)],mod-ExX[i+(Lx>>1)]);
rep(i,0,Lx>>1)ExY[i]=Op[i];
rep(i,Lx>>1,Lx)ExX[i]=ExY[i]=0;
Len=Lx;
calrev();
NTT(ExY,1),NTT(ExX,1);
rep(i,0,Len)ExX[i]=(ll)ExX[i]*ExY[i]%mod;
NTT(ExX,-1);
rep(i,0,Lx>>1)Op[i+(Len>>1)]=ExX[i];
}
Rep(i,0,ln)G[i]=Op[i];
}
}
using poly::power;
using poly::Len;
using poly::calrev;
using poly::NTT;
using poly::mod;
using poly::predone;
using poly::Inv;
using poly::Inter;
using poly::Deriv;
using poly::Ln;
using poly::Exp;
using poly::Sqrt;
using poly::Div;
using poly::ad;
static int n,k,F[MAXN];
int main()
{
file();
predone();
read(n),read(k);
k%=mod;
Rep(i,0,n-1)read(F[i]);
Sqrt(F,F,n-1);
Inv(F,F,n-1);
Inter(F,F,n-1);
Exp(F,F,n-1);
Inv(F,F,n-1);
++F[0];
Ln(F,F,n-1);
++F[0];
Ln(F,F,n-1);
Rep(i,0,n-1)F[i]=(ll)F[i]*k%mod;
Exp(F,F,n-1);
Deriv(F,F,n-1);
Rep(i,0,n-1)write(F[i],' ');
flush();
return 0;
}
推荐这种东西写成一个 和复板子。