## Part0 [ppt版本](https://pan.wps.cn/l/sjsf3ug) [常数优化有效性测试](https://www.luogu.org/paste/86286z05) 参考文献：[论程序底层优化的一些方法和技巧](http://www.doc88.com/p-1197280421746.html) 注：此文件已经被我下载并上传，如果想要pdf文件但是下载不了道客巴巴文档可以私信找我要下载链接和密码。 ## Part1 常数优化前置概念 ### 如何测量函数的耗时根据前文，我们有必要评估函数的耗时，从而进行有效的优化。使用头文件$ctime$或$time.h$中的clock()函数，此函数返回当前的总运行时间。样例代码： ```cpp #include int tmp=clock(); function(); int _time=clock()-tmp; ``` 这段代码运行后，_time变量就表示函数function()的运行时间。其单位为：ms（毫秒）为了保证测量精确度，因为对于耗时较小的函数_time可能会为0，所以我们应该多次运行该函数取它们的总时间并求平均值。这种方法与测量纸的厚度的方法是一样的。用for循环实现。 ### 一些基本的语句的耗时 - 整数加减：1（个时钟周期，下同） - 整数位运算：1 - 整数乘法：2 - 整数除法：21 - 浮点加减：3 - 浮点除法：35 - 浮点开根：60 - 指针加法：1 各类型比较： int运算是最快的。unsigned无符号数做除法比有符号数快。 float比任何整数运算更慢，double比float慢，long double最慢。注意：实测int比char和short具有更快的速度。 ## Part2 常数优化方法 ### 运算优化正如Part01所说，不同的数据类型以及它们的各运算速度是不一样的。 3.1.1 一般情况的运算优化 1.优化除法/取模运算。例：将a/b==c/d化为a\*d==c\*b，事实上，这对于整数来说也能够保持精度。另外,unsigned无符号数比有符号数能够更快地完成除法运算。而对于取模，可以将其优化为： ```inline int MOD(int x){return x>k 2.乘除常数的优化 x*10=(x<<1)+(x<<3)注：实测x+(x<<2)<<1会更慢 x*13=x+(x+(x<<1)<<2) x*14=(x<<1)+(x+(x<<1)<<2) x*17=(x<<4)+x x*63=(x<<6)-x 3.对2^k取模优化 x%(1<47)x=(x+(x<<2)<<1)+(*p++^48); return x; } inline void write(int x){ if(!x)*q++=48; else { while(x)*t++=x%10+48,x/=10; while(t!=ch)*q++=*--t; } }//注意：如果读入量很大（比如超过了10000000字节），请使用下面的模板。 static char in[10000000],*p,*pp,out[10000000],*q=out,ch[20],*t=ch;//读写大小自行调整。 #define getch p==pp&&(pp=(p=in)+fread(in,1,10000000,stdin),p==pp)?EOF:*p++; inline int read(){ register int x=0;register char ch; while((ch=getch)<48); while(ch>47)x=(x+(x<<2)<<1)+(ch^48),ch=getch(); return x; } inline void write(int x){ if(!x)*q++=48; else { while(x)*t++=x%10+48,x/=10; while(t!=ch)*q++=*--t; } } int main(){pp=(p=in)+fread(in,1,10000000,stdin);......fwrite(out,1,q-out,stdout);} ``` 另外一个功能齐全但是常数较大的版本请参见博客：https://www.luogu.org/blog/Howershine950644/post-mu-ban-zhen-zheng-di-du-xie-you-hua 请读者自行优化其常数。注意因为fread的参数太大也会降低速度。因此在文件读写的情况下可以这样： ```cpp freopen(filename,”r”,stdin); FILE* fp=fopen(filename,”r”);fseek(fp,0L,SEEK_END); fread(in,1,ftell(fp),stdin); ``` 3.6 STL容器优化如果能手写尽量手写，如果不能手写则优化其内存分配。众所周知，STL的默认分配器是allocator，这是会动态分配内存的，我们可以开一个足够大的内存池，自定义myalloc类来优化内存分配的消耗。 myalloc的定义如下。 ```cpp #include using namespace std; #define reg register static char space[10000000],*sp=space; template struct myalloc:allocator{ myalloc(){} template myalloc(const myalloc &a){} template myalloc& operator=(const myalloc &a){return *this;} template struct rebind{typedef myalloc other;}; inline T* allocate(size_t n){ T *result=(T*)sp;sp+=n*sizeof(T); return result; } inline void deallocate(T* p,size_t n){} }; ``` 完成后，需要这样定义STL容器：例： ```cpp list > L;vector > vec; ``` 实测：对于list，在我的电脑上甚至比不加优化的list快10倍以上。 3.7 其他例如：逗号运算符比分号运算符快，for(register int i=1;i<=n;++i)...比while(n--)...慢，因为少了i的变量枚举。另外感谢@ywr8 补充：for(;n;--n)比while(n--)快。 ## 本文完结 ## Thank you for your reading ## 觉得不错请点个赞奥！