先在最开始把 \text{Burnside} 引理写出来:
|X\setminus G|=\dfrac1{|G|}\sum\limits_{g\in G}|X^g|
即,集合 X 在群 G 作用下的不同等价类的数目等于 G 中每个变换的不动点数的平均值。
这是什么意思呢?举个例子。
比如,假设我们想计算本质不同的 2\times2 黑白棋盘数,规定若旋转后两棋盘相同则是本质相同的。
那么可以得到以下 6 种本质不同方案:
在这个例子中,集合 X 是全部 2^4=16 种染色方案,群 G 是四种旋转的方案(不旋转、旋转 90^\circ、旋转 180^\circ,旋转 270^\circ)。
下文若非特殊说明,都有 x 是 X 的元素,g 是 G 的元素。
称两个元素 x_1、x_2 是等价的,当且仅当存在一个变换 g 使得 g(x_1)=x_2,在这个具体的例子中体现为如果一种染色方案通过旋转能变成另一种染色方案,那么它们就是等价的。
不难用群的性质证明这种等价关系具有自反性、对称性与传递性,故其等价类的个数就是其本质不同的元素数目。
而变换的不动点数是什么呢?
对于一个变换 g 来说,如果一个 x 满足 g(x)=x,那么 x 就是 g 的不动点。
比如在上面这个例子中,\raisebox{2px}{\raisebox{-1pt}{\color{#333}🙾}\kern{-9.5pt}\color{black}\boxed{\kern{3.7pt}\raisebox{3pt}{}}} 就是一个【旋转 180^\circ】 的不动点,因为其旋转 180^\circ 后与自身相同。
而当我们把每个变换的不动点个数计算出来:
不旋转:全部 2^4=16 个染色方案
旋转 90^\circ:只有全黑或全白是其不动点,2 个
旋转 180^\circ:全黑、全白、\raisebox{2px}{\raisebox{-1pt}{\color{#333}🙾}\kern{-9.5pt}\color{black}\boxed{\kern{3.7pt}\raisebox{3pt}{}}} 与 \raisebox{2px}{\raisebox{-1pt}{\color{#333}🙿}\kern{-9.5pt}\color{black}\boxed{\kern{3.7pt}\raisebox{3pt}{}}},共 4 个
旋转 270^\circ:只有全黑或全白是其不动点,2 个
计算其平均数,为 \dfrac{16+2+4+2}4=6,刚好就是本质不同的方案数!
这么神奇的事情,是怎么发生的呢?接下来让我们证明一下:
令 X^g=\{x\in X|x=g(x)\},G_x=\{g\in G|x=g(x)\},分别称为 g 的不动点与 x 的稳定子(即在 g 作用下不动的点 x 组成的集合与作用 x 稳定不变的变换 g)。
再约定 O_x 表示 x 的轨道,即 \{y\in X|y=g(x),g\in G\},即 x 在 G 的所有变换作用后形成的 y 构成的集合。
那么有轨道-稳定子定理:|O_x|\times|G_x|=|G|。
为什么呢?
考虑 O_x 中的每个元素 y,则必定存在至少一个 g\in G 使得 y=g(x)。不妨设其中之一为 g_0,即 y=g_0(x)。
考虑 \sum\limits_{g\in G}[g(y)=x]。那么对于任意一个满足 g(y)=x 的 g,都有 g(g_0(x))=x,那么根据稳定子定义,有 g\circ g_0\in G_x。
而由于 g_0 是确定的,所以 \{g\in G|g(y)=x\} 可以和 G_x 建立一一对应关系。故 \sum\limits_{g\in G}[g(y)=x]=|G_x|。
再考虑 \sum\limits_{y\in O_x}\sum\limits_{g\in G}[g(y)=x],一方面它等于 \sum\limits_{y\in O_x}|G_x|=|O_x|\times|G_x|,另一方面它等于 \sum\limits_{g\in G}\sum\limits_{y\in O_x}[g(y)=x]=\sum\limits_{g\in G}\sum\limits_{y\in O_x}[g^{-1}(x)=y]=\sum\limits_{g\in G}\sum\limits_{y\in O_x}[g(x)=y]=\sum\limits_{g\in G}1=|G|。故 |O_x|\times|G_x|=|G|。
然后轨道-稳定子定理就证明完毕了。
再考虑 S=\{(x,g)|g(x)=x\},枚举 x 可得 |S|=\sum\limits_{x\in X}|G_x|,枚举 g 可得 |S|=\sum\limits_{g\in G}|X^g|。所以 \sum\limits_{g\in G}|X^g|=\sum\limits_{x\in X}|G_x|=\sum\limits_{x\in X}\dfrac{|G|}{|O_x|}=|G|\sum\limits_{x\in X}\dfrac1{|O_x|}=|G|\times|X\setminus G|。故 |X\setminus G|=\dfrac1{|G|}\sum\limits_{g\in G}|X^g|。
至于为什么 |X\setminus G|=\sum\limits_{x\in X}\dfrac1{|O_x|},因为 X 被 G 划分成了若干个本质相同的等价类,其中每类的元素 x 的权值为 \dfrac1{|O_x|},那么一个等价类里的元素权值之和 \dfrac{|O_x|}{|O_x|}=1,所以 \sum\limits_{x\in X}\dfrac1{|O_x|} 就是等价类的数量了。
---
现在让它带上权。设 $w(x)$ 为 $x$ 的权值,须满足对于两个等价的 $x$ 和 $y$ 有 $w(x)=w(y)$。那么可以发现一个等价类里面的元素权值都相同。故设一条轨道的权值 $w(O_x)=w(x)$。
我们关心的现在不仅仅是等价类的数目了,进而计算等价类的权值之和。其实,求数目就单纯地令 $w(x)=1$ 即可。
我们改写一下最后几步:$\sum\limits_{x\in X}\dfrac1{|O_x|}$ 求的是数目,那么 $\sum\limits_{x\in X}\dfrac{w(x)}{|O_x|}$ 求的就是权值和了。
故 $|G|\sum\limits_{x\in X}\dfrac{w(x)}{|O_x|}=\sum\limits_{x\in X}\dfrac{w(x)|G|}{|O_x|}=\sum\limits_{x\in X}w(x)\times|G_x|$。
继续往前推:$\sum\limits_{x\in X}w(x)\times|G_x|=\sum\limits_{x\in X}w(x)\times\sum\limits_{g\in G}[g(x)=x]=\sum\limits_{g\in G}\sum\limits_{x\in X}w(x)[g(x)=x]
即原来我们关心的是 |X^g|,即 g 的不动点个数,现在变成了 \sum\limits_{x\in X}w(x)[g(x)=x]=\sum\limits_{x\in X^g}w(x),即 g 的不动点权值之和。那么带权形式的 \text{Burnside} 引理就是:
\sum\limits_{O\in X\setminus G}w(O)=\dfrac1{|G|}\sum\limits_{g\in G}\sum\limits_{x\in X^g}w(x)
即,等价类的权值之和为所有变换的不动点权值和的平均值。