概 率 方 法 博士 E-mail: [email protected] 数学与计算科学学院 中山医学院 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Ramsey数 R(k,l) (1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 用a,b,c,d,e,f六点表示六个人。如果两人互相认识,就在相应顶点 间连一条红边,如果互相不认识,就连上一条蓝边。这样原问题 就相当于对于任意的双色完全图K6中必存在一个单色三角形。 a f e d b c Ramsey数 R(k,l) R(k,k)(1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 不失一般性, 考虑以a端点的5条边。因为只有两种颜色,所以, 至少有3边同色。不妨设ab, ac,ad同为蓝色。 a a f f e e d b c d b c Ramsey数 R(k,l) R(k,k)(1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 在b,c,d三者间,若有任意 一条为蓝色,例如bd为蓝色, 则abd构成蓝色三角形。 在b,c,d三者间,若没有一 条为蓝色,则他们之间均是 红色连线,此时bcd就会构成 红色三角形。 a a f f e d b c e d b c Ramsey数 R(k,l) (2) 给定两个自然数k和l,是否存在n,使得任意一个双 色完全图Kn,要么含有红色的完全子图Kk,要么含有蓝 色的完全子图Kl?而称具有这样性质的最小自然数n为 Ramsey数,记作R(k,l)。 我们关心的是R(k,l)的值或者上下界。在这里,我们 只简单讨论Ramsey数R(k,k)的下界。 (k,l)=(3,3), Ramsey数 R(3,3)=6。 这是因为:K5中可以 不出现单色三角形。 Buffon 投针 假设在平面上画上间距为d 的平行线,现在随‘ 机投掷长 度为L的的针,求针与其中 至少˜一条平行线相交的概率。 当L≤d时,所求的概率是 2L/πd。 素因子的个数 1920年, Hardy 和.
Download ReportTranscript 概 率 方 法 博士 E-mail: [email protected] 数学与计算科学学院 中山医学院 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Ramsey数 R(k,l) (1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 用a,b,c,d,e,f六点表示六个人。如果两人互相认识,就在相应顶点 间连一条红边,如果互相不认识,就连上一条蓝边。这样原问题 就相当于对于任意的双色完全图K6中必存在一个单色三角形。 a f e d b c Ramsey数 R(k,l) R(k,k)(1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 不失一般性, 考虑以a端点的5条边。因为只有两种颜色,所以, 至少有3边同色。不妨设ab, ac,ad同为蓝色。 a a f f e e d b c d b c Ramsey数 R(k,l) R(k,k)(1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 在b,c,d三者间,若有任意 一条为蓝色,例如bd为蓝色, 则abd构成蓝色三角形。 在b,c,d三者间,若没有一 条为蓝色,则他们之间均是 红色连线,此时bcd就会构成 红色三角形。 a a f f e d b c e d b c Ramsey数 R(k,l) (2) 给定两个自然数k和l,是否存在n,使得任意一个双 色完全图Kn,要么含有红色的完全子图Kk,要么含有蓝 色的完全子图Kl?而称具有这样性质的最小自然数n为 Ramsey数,记作R(k,l)。 我们关心的是R(k,l)的值或者上下界。在这里,我们 只简单讨论Ramsey数R(k,k)的下界。 (k,l)=(3,3), Ramsey数 R(3,3)=6。 这是因为:K5中可以 不出现单色三角形。 Buffon 投针 假设在平面上画上间距为d 的平行线,现在随‘ 机投掷长 度为L的的针,求针与其中 至少˜一条平行线相交的概率。 当L≤d时,所求的概率是 2L/πd。 素因子的个数 1920年, Hardy 和.
概 率 方 法 博士 E-mail: [email protected] 数学与计算科学学院 中山医学院 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Ramsey数 R(k,l) (1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 用a,b,c,d,e,f六点表示六个人。如果两人互相认识,就在相应顶点 间连一条红边,如果互相不认识,就连上一条蓝边。这样原问题 就相当于对于任意的双色完全图K6中必存在一个单色三角形。 a f e d b c Ramsey数 R(k,l) R(k,k)(1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 不失一般性, 考虑以a端点的5条边。因为只有两种颜色,所以, 至少有3边同色。不妨设ab, ac,ad同为蓝色。 a a f f e e d b c d b c Ramsey数 R(k,l) R(k,k)(1) R(3,3): 证明,任意六个人中,总有三个人互相认识, 或者互相不认识。 ----- 1947年匈牙利数学竞赛 在b,c,d三者间,若有任意 一条为蓝色,例如bd为蓝色, 则abd构成蓝色三角形。 在b,c,d三者间,若没有一 条为蓝色,则他们之间均是 红色连线,此时bcd就会构成 红色三角形。 a a f f e d b c e d b c Ramsey数 R(k,l) (2) 给定两个自然数k和l,是否存在n,使得任意一个双 色完全图Kn,要么含有红色的完全子图Kk,要么含有蓝 色的完全子图Kl?而称具有这样性质的最小自然数n为 Ramsey数,记作R(k,l)。 我们关心的是R(k,l)的值或者上下界。在这里,我们 只简单讨论Ramsey数R(k,k)的下界。 (k,l)=(3,3), Ramsey数 R(3,3)=6。 这是因为:K5中可以 不出现单色三角形。 Buffon 投针 假设在平面上画上间距为d 的平行线,现在随‘ 机投掷长 度为L的的针,求针与其中 至少˜一条平行线相交的概率。 当L≤d时,所求的概率是 2L/πd。 素因子的个数 1920年, Hardy 和 Ramanujan证明了“几乎 所有”n的素因子的个数“非常靠近”ln ln n 。 素因子的个数 1920年, Hardy 和 Ramanujan证明了“几乎 所有”n的素因子的个数“非常靠近”ln ln n 。 严格的数学表述如下: 令 (n) 为所有n的素因子的个数和让 (n) 任意缓 慢的趋向无穷大。那么 |{x [1, n]:| ( x) ln ln n | (n) ln ln n}| o(n) 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Landan 渐进符号 令n为一个正变量,f(n)与g(n)为n的实函数。 g (n) O( f (n)) • 表示f是非负的,并且对于所有的n,存在常数C,使得|g(n)|≤C·f(n) g (n) o( f (n)) • 表示f是非负的,并且当n趋于无穷时,g(n)/f(n)趋向于0 g (n) w( f (n)) • 表示f(n)=o(g(n)) g ( n) f ( n) • 表示f(n)=(1+o(1))·g(n) 概率符号 假设E为某个概率空间(有限)的一个事件: • P(A)表示事件A发生的概率。 • I(A)表示事件A的示性函数,如果A发生则I(A)=1,若不发生则为0。 假设X是一个离散的随机变量: • E(X)=∑x[x·P(X=x)],定义为其期望。 • Var(X)=E(X-EX)2=EX2-(EX)2,定义为其方差。 而后有E(I(A))=P(A),Var(I(A))=P(A)-P(A)2。 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Ramsey数. R(k,k)的下确界 1Ck2 定理1: 如果 C 2 k n 1 ,那么 R(k , k ) n 。 这样,对所有的 k 3 ,有:R(k , k ) 2k /2 Ramsey数. R(k,k)的下确界 1Ck2 定理1: 如果 C 2 k n 1 ,那么 R(k , k ) n 。 这样,对所有的 k 3 ,有:R(k , k ) 2k /2 证明:在一个双色完全图 K n 中,考虑由两种颜色(红或蓝)等 可能的对边着色。对于任一个具有 k个顶点的集合 R ,令 AR 为 “由 R 诱导的 K n 的子图为单色的事件”。那么, 1Ck2 P( AR ) 2 Ramsey数. R(k,k)的下确界 1Ck2 定理1: 如果 C 2 k n 1 ,那么 R(k , k ) n 。 这样,对所有的 k 3 ,有:R(k , k ) 2k /2 证明:在一个双色完全图 K n 中,考虑由两种颜色(红或蓝)等 可能的对边着色。对于任一个具有 k个顶点的集合 R ,令 AR 为 “由 R 诱导的 K n 的子图为单色的事件”。那么, 1Ck2 P( AR ) 2 又因为在 K n中这样的R有 C nk 个,所以至少有一个事件 AR 发生 1Ck2 k 1 。这样,没有一个事件 AR 会发生的 的概率最多为 Cn 2 概率为正,也就是说,存在一个不含有单色 K k 的双色完全图 K n 。于是有 R(k , k ) n 。 1Ck2 定理1: 如果 C 2 k n 1 ,那么 R(k , k ) n 。 这样,对所有的 k 3 ,有:R(k , k ) 2k /2 1Ck2 定理1: 如果 C 2 k n 1 ,那么 R(k , k ) n 。 这样,对所有的 k 3 ,有:R(k , k ) 2k /2 注意到 k 3 时,取 n 2 1Ck2 C 2 k n k /2 ,满足 21k /2 n k k 2 /2 1 k! 2 因此,R(k , k ) 2k /2 。 证毕 1Ck2 定理1: 如果 C 2 k n 1 ,那么 R(k , k ) n 。 这样,对所有的 k 3 ,有:R(k , k ) 2k /2 注意到 k 3 时,取 n 2 1Ck2 C 2 k n k /2 ,满足 21k /2 n k k 2 /2 1 k! 2 因此,R(k , k ) 2k /2 。 证毕 这个例子体现了概率方法的精髓。我们并没有直接通过构 造性或确定性的方法来证明单色子图的存在,而是以一种 非确定性的方法来处理问题。 注:Erdős(埃尔德什)是第一个理解这种方法并成功的运用以解决了许 多应用问题的人。 Sum-free集合问题 定义:一个可换群G的子集 A 被称为sum-free(和自由)的, 当且仅当其不存在三个元素x,y,z,使得x+y=z。 换言之,( A A) A 。 定理[Erdős 1965]:每一个由n个非零整数所组成的集合 B , 存在一个sum-free的子集 A ,并且子集 A 的大小(阶)比 B 的三分之一要大: | A | | B | 3 。 Sum-free集合问题 定义:一个可换群G的子集 A 被称为sum-free(和自由)的, 当且仅当其不存在三个元素x,y,z,使得x+y=z。 换言之,( A A) A 。 定理[Erdős 1965]:每一个由n个非零整数所组成的集合 B , 存在一个sum-free的子集 A ,并且子集 A 的大小(阶)比 B 的三分之一要大: | A | | B | 3 。 证明:令 p 3k 2 为一个素数,使得 p 2max{| bi |}in1 ,同 时令C {k 1, k 2,..., 2k 1} 则 C 显然是循环群 Z p 的一个sum-free子集,而且, |C | k 1 1 p 1 3k 1 3 根据 [1, p 1] 上的均匀分布选取一个正整数 x ,定义 di xbi (mod p) i 1,...n Sum-free集合问题 对于每个固定的 i ,当 x 遍历所有1至p-1的整数时,d i 也遍历所有 Z p 中的非零元素。这样 P(di C ) | C | ( p 1) 1/ 3 。 因此,使得 d i 属于C 的个数的期望 n / 3 。 Sum-free集合问题 对于每个固定的 i ,当 x 遍历所有1至p-1的整数时,d i 也遍历所有 Z p 中的非零元素。这样 P(di C ) | C | ( p 1) 1/ 3 。 因此,使得 d i 属于C 的个数的期望 n / 3 。 由此可知,存在一个 x 和 B 的一个子集 A( A 的阶 n / 3),使得: 对所有的 a A ,xa(mod p) C 。这样A 显然是sum-free的,这因为如 果有 a1 , a2 , a3 A ,并满足 a1 a2 a3 ,那么,必有 xa1 xa2 xa3 (mod p) 但这与C 是Z p 的sum-free子集这一事实所矛盾。故完成证明。 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Buffon 投针的计算(几何方法) 由于针的长度小于线的间距,所以必有一条平行线与针相邻但不相交。 我们将这个线作为参照线(南端的线)。 南端线= 参照线 y D 现在我们有: d L Measure to the closest line north of the measuring end d L sin 0 0 yD 关系式 独立均匀分布 独立均匀分布 如果 y L sin ,则表示出现了相交。 Buffon 投针的计算(几何方法) D 左图是 y与 的联合分布图,其中 红色区域表示 y L sin ,即能 够相交,而白色区域则表示没有 相交。最后只需要计算出红色区 域所占整体区域的比例即可。 y L sin 0 红色区域 L sin d 0 L( cos cos 0) 2L 总区域 D Buffon 投针的计算(几何方法) D 左图是 y与 的联合分布图,其中 红色区域表示 y L sin ,即能 够相交,而白色区域则表示没有 相交。最后只需要计算出红色区 域所占整体区域的比例即可。 y L sin 0 红色区域 L sin d 0 总区域 D L( cos cos 0) 2L 红区域 2 L Pr(相交) 总区域 D 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 期望的线性性质 令X 1 ,..., X n 为随机变量,X c1 X 1 ... cn X n 。 那么 E ( X ) c1 E ( X 1 ) ... cn E ( X n ) 这个期望的线性性质的威力在于其并没有受到 X i 之间是否独立的限制。 在应用中,经常使用这样的事实:在样本空间中 比存在一个点使得: X E[ X ] 或 X E[ X ] 在下面的例子中可以看到这个方法的使用。 Buffon 投针的计算(概率方法) 现在我们用另一种思维来看待Buffon投针的问题。 平行线的间距 d 已经给定。对于一个长度是 L1 的针, 定义一个随机变量 X1 ,其为此针与平行线相交的点数。 由于 L1 d ,所以 X1以概率 P0 取值0,以概率 P1 取值1。 P1 既是我们需要求的值,这也同时是 X1 的期望: E[ X1 ] 0P0 1P1 P1 Buffon 投针的计算(概率方法) 现在我们用另一种思维来看待Buffon投针的问题。 平行线的间距 d 已经给定。对于一个长度是 L1 的针, 定义一个随机变量 X1 ,其为此针与平行线相交的点数。 由于 L1 d ,所以 X1以概率 P0 取值0,以概率 P1 取值1。 P1 既是我们需要求的值,这也同时是 X1 的期望: E[ X1 ] 0P0 1P1 P1 接下来我们再找一根针,长度为 L2 ,将其与先前的那 根针头尾连接起来,并保持活动不固定死。类似的依 然可以定义一个随机变量 X 2 。 虽然 X1 与X 2 不独立,但是它们的期望依然满足线性性 质: E[ X1 X 2 ] E[ X1 ] E[ X 2 ] Buffon 投针的计算(概率方法) 由于上述期望的线性性质,两根针无论构成什么样子的链接方 式,其与平行线的交点个数的期望是不变的。 而多根针头尾连在一起依然保持了这样的性质。同时多根针可 以组成任意的形状。 另一方面,容易看出 E[ X1 ] 是与 L1 有关系的,而在针长度的合 理范围内,它们成线性关系: E[ X1 ] f ( L1 ) rL1 因此接下来我们所要做的事情就是确定 r 的大小。 Buffon 投针的计算(概率方法) 由于上述期望的线性性质,两根针无论构成什么样子的链接方 式,其与平行线的交点个数的期望是不变的。 而多根针头尾连在一起依然保持了这样的性质。同时多根针可 以组成任意的形状。 另一方面,容易看出 E[ X1 ] 是与 L1 有关系的,而在针长度的合 理范围内,它们成线性关系: E[ X1 ] f ( L1 ) rL1 因此接下来我们所要做的事情就是确定 r 的大小。 之后我们考虑形状固定的铁丝 C ,其长度为 L ,定义 Y 为铁丝 与平行线相交的交点个数。可以将这个铁丝近似想象成很多针 所连接起来的,所以 Y 将会近似等于 X1 ... X n ,而取其极限, 我们得到: E[Y ] rL Buffon 投针的计算(概率方法) 最后,为了求解出 r 的大小,我们只需要选取适当形状的铁丝 来进行求解。 令铁丝 C 为一个圆圈,其直径为 d 。显然我们有: E[Y ] 2, L d 代入到公式 E[Y ] rL 中,2 r d ,解得 r 2 / ( d ) Buffon 投针的计算(概率方法) 最后,为了求解出 r 的大小,我们只需要选取适当形状的铁丝 来进行求解。 令铁丝 C 为一个圆圈,其直径为 d 。显然我们有: E[Y ] 2, L d 代入到公式 E[Y ] rL 中,2 r d ,解得 r 2 / ( d ) 所以,对于一个针而言,我们有 2L p1 E[ X 1 ] rL1 d 证毕 不平衡的灯 我们先来看一个定理。 定理:令 aij 1 ,1 i, j n ,则存在 xi , y j 1 ,1 i, j n 使得 n n ai j xi y j ( i 1 j 1 2 o(1)) n3/2 不平衡的灯 我们先来看一个定理。 定理:令 aij 1 ,1 i, j n ,则存在 xi , y j 1 ,1 i, j n 使得 n n ai j xi y j ( i 1 j 1 2 o(1)) n3/2 现在我们针对此定理给出一个现实生活中的解释:假若按 照 n n 的矩阵形式来摆放灯泡,每一个灯泡要么是亮着 的(aij 1),要么是熄灭的(aij 1)。同时存在着控 制同一排或者同一列的转换开关( xi 1既是控制第 i 排 的,而 y j 1则是控制第 j 列的)。 不平衡的灯 我们先来看一个定理。 定理:令 aij 1 ,1 i, j n ,则存在 xi , y j 1 ,1 i, j n 使得 n n ai j xi y j ( i 1 j 1 2 o(1)) n3/2 现在我们针对此定理给出一个现实生活中的解释:假若按 照 n n 的矩阵形式来摆放灯泡,每一个灯泡要么是亮着 的(aij 1),要么是熄灭的(aij 1)。同时存在着控 制同一排或者同一列的转换开关( xi 1既是控制第 i 排 的,而 y j 1则是控制第 j 列的)。 而上述定理的意思是,对于灯泡任意的初始设置,我们 都有可能通过调整开关而使得(开着的灯个数)—(关 着的灯个数)至少为: ( 2 o(1)) n3/2 证明:首先忽略行开关 x 。独立并均匀的让 y1 ,..., yn 1 ,并设: n Ri aij y j , j 1 n R | Ri |, i 1 对给定的 i ,无论初始值 ai j 如何,ai j y j 将会均匀的等于+1或者-1, 并且在不同的 j 之间他们相互独立。 这里既是说,无论第 i 行灯泡的初始值如何,在随机选择列开关 n 后 y ,他们的开关状态都将服从均匀分布,并一共有 2 的等可能 选择。 证明:首先忽略行开关 x 。独立并均匀的让 y1 ,..., yn 1 ,并设: n n Ri aij y j , R | Ri |, j 1 i 1 对给定的 i ,无论初始值 ai j 如何,ai j y j 将会均匀的等于+1或者-1, 并且在不同的 j 之间他们相互独立。 这里既是说,无论第 i 行灯泡的初始值如何,在随机选择列开关 n 后 y ,他们的开关状态都将服从均匀分布,并一共有 2 的等可能 选择。 故 Ri 服从 S n 分布(n 个独立均匀分布{-1,1}下的随机变量的和分 布)。所以, E[| Ri |] E[| Sn |] 2 / o(1) n 证明:首先忽略行开关 x 。独立并均匀的让 y1 ,..., yn 1 ,并设: n n Ri aij y j , R | Ri |, j 1 i 1 对给定的 i ,无论初始值 ai j 如何,ai j y j 将会均匀的等于+1或者-1, 并且在不同的 j 之间他们相互独立。 这里既是说,无论第 i 行灯泡的初始值如何,在随机选择列开关 n 后 y ,他们的开关状态都将服从均匀分布,并一共有 2 的等可能 选择。 故 Ri 服从 S n 分布(n 个独立均匀分布{-1,1}下的随机变量的和分 布)。所以, E[| Ri |] E[| Sn |] 2 / o(1) n 注:在随机游走中,一个人每次等可能的向前或者向后走一步,在走了 n步后,计算他离远点的距离,上述结果就是此距离的均值。 再利用期望的线性性质, n E[ R] E[ Ri ] i 1 2 / o(1) n3/2 由此可以看出,肯定存在一组 y1 ,..., yn ,使得 R 至少是上述 的取值,然后我们只需要通过选取 xi 与 Ri 的符号相同, 就有: n n x a i 1 i j 1 ij n n i 1 i 1 y j xi Ri | Ri | 2 / o(1) n3/2 证毕 几个例子 Ramsey数;Buffon投针;素因子的个数 一些符号 Landan渐进符号;概率符号 概率在数论中的应用 Ramsey数;Sum-free集合问题 Buffon投针问题的解(几何方法) 期望的线性性质 Buffon投针(概率方法);不平衡的灯 Chebyshev不等式 素因子的个数;不同和问题 Chebyshev不等式 此不等式在概率论中具有非常重要 的地位,而其由于涉及到随机变量的 方差,故常称其为二阶矩方法。 对一个随机变量 X ,一般记 为期望, 而记 2 为方差。方差开根号后的 则被称为标准差。 Chebyshev不等式 此不等式在概率论中具有非常重要 的地位,而其由于涉及到随机变量的 方差,故常称其为二阶矩方法。 对一个随机变量 X ,一般记 为期望, 而记 2 为方差。方差开根号后的 则被称为标准差。 对任意正实数 , Pr[| X | ] 1 2 证明即下面的这条式子: 2 Var[ X ] E[( X )2 ] 2 2 Pr[| X | ] 素因子的个数 定理:令 (n) 为所有n的素因子的个数,让 (n) 任意缓 慢的趋向无穷大。那么 |{x [1, n]:| ( x) ln ln n | (n) ln ln n}| o(n) 证明:从1到 n 之间随机的抽取一个数 x 。对于素数 p ,令 1 Xp 0 如果 p | x 其他 令 M n1/10 ,X X p ,对所有小于 M 的素数 p 求和。 于是我们有 ( x) 10 X ( x) ( x) ,因为无论如何的 x , 都不会拥有10个以上的大于 M 的素因子。(这里的10 可以是其他比较大的常数) 素因子的个数 定理:令 (n) 为所有n的素因子的个数,让 (n) 任意缓 慢的趋向无穷大。那么 |{x [1, n]:| ( x) ln ln n | (n) ln ln n}| o(n) 证明:从1到 n 之间随机的抽取一个数 x 。对于素数 p ,令 1 Xp 0 如果 p | x 其他 令 M n1/10 ,X X p ,对所有小于 M 的素数 p 求和。 于是我们有 ( x) 10 X ( x) ( x) ,因为无论如何的 x , 都不会拥有10个以上的大于 M 的素因子。(这里的10 可以是其他比较大的常数) 因此,在探索 与 X 的渐进性质时,它们将会有渐进相似的边界。 现在,我们知道: n / p E[ X p ] n 又因为 y 1 y y ,所以 E[ X p ] 1/ p O(1/ n) 现在,我们知道: n / p E[ X p ] n 又因为 y 1 y y ,所以 E[ X p ] 1/ p O(1/ n) 再由于期望的线性性质和一个重要事实: p x (1/ p) ln ln x O(1) 我们有下面的结果: 1 1 E[ X ] pM ( O( )) ln ln x O(1) p n 现在,我们知道: n / p E[ X p ] n 又因为 y 1 y y ,所以 E[ X p ] 1/ p O(1/ n) 再由于期望的线性性质和一个重要事实: p x (1/ p) ln ln x O(1) 我们有下面的结果: 1 1 E[ X ] pM ( O( )) ln ln x O(1) p n 接下来我们要探讨随机变量 X 的方差的渐进表达。 随机变量 X 的方差: Var[ X ] Var[ X pM p ] Cov[ X p , X q ] pq 由于 Var[ X p ] (1/ p)(1 1/ p) O(1/ n) , 所以 1 Var[ X p ] O(1) ln ln n O(1) pM p M p 随机变量 X 的方差: Var[ X ] Var[ X pM p ] Cov[ X p , X q ] pq 由于 Var[ X p ] (1/ p)(1 1/ p) O(1/ n) , 所以 1 Var[ X p ] O(1) ln ln n O(1) pM p M p 另一方面,由于 p与 q 是不同的两个素数,所以 X p X q 1 等价 于 p | x 且 q | x ,即等价于 pq | x 。因此, Cov[ X p , X q ] E[ X p X q ] E[ X p ]E[ X q ] n / pq n / p n / q n n n 1/ pq (1/ p 1/ n)(1/ q 1/ n) 1 1 1 ( ) n p q 所以, Cov[ X p , X q ] pq 1 1 1 2M ( ) n p q p q n 1 p 由此可得, Cov[ X pq 9/10 , X ] O ( n ln ln n) o(1) p q 类似的我们也可以得到 Cov[ X pq p , X q ] o(1) ,这也就是说 明,协方差对方差没有影响,所以 Var[ X ] ln ln n O(1) 。 所以, Cov[ X p , X q ] pq 1 1 1 2M ( ) n p q p q n 1 p 由此可得, Cov[ X pq 9/10 , X ] O ( n ln ln n) o(1) p q 类似的我们也可以得到 Cov[ X pq p , X q ] o(1) ,这也就是说 明,协方差对方差没有影响,所以 Var[ X ] ln ln n O(1) 。 最后利用Chebyshev不等式: Pr[| X ln ln n | ln ln n ] 2 o(1) 对任意 0成立。又因为 X 与 之间相差10以内,所以此性质 对 同样适用。这样就完成了证明。 不同和 定义:包含正整数 x1 ,..., xk ,的集合具有不同和的性质,如 果任意元素之间的和均不相同。 即 x , iS i S {1,..., k} 均不相同。 不同和 定义:包含正整数 x1 ,..., xk ,的集合具有不同和的性质,如 果任意元素之间的和均不相同。 即 x , iS i S {1,..., k} 均不相同。 现在定义 f (n) :对于集合 {1,..., n} ,在其具有不同和性质的 所有子集中,元素最多的集合的元素个数就定义为 f (n) 。 不同和 定义:包含正整数 x1 ,..., xk ,的集合具有不同和的性质,如 果任意元素之间的和均不相同。 即 x , iS i S {1,..., k} 均不相同。 现在定义 f (n) :对于集合 {1,..., n} ,在其具有不同和性质的 所有子集中,元素最多的集合的元素个数就定义为 f (n) 。 一个简单的例子:{2i : 0 i log 2 n} 是 {1,..., n} 的子集,并且 它具有不同和的性质。 因此我们可以看出: f (n) 1 log2 n f (n) 的下确界有了,那么上确界又如何呢? 不同和 定理: f (n) log 2 n (1/ 2)log 2 log 2 n O(1) 证明:在这个大小为 f (n) k 的子集中,所有元素共有 2 f ( n ) 种组合,而他们求和后的大小均不相同(不同和的性质), 同时这些和都小于 nk : 2 f ( n) nk nf (n) 由此我们得到: f (n) log 2 n log 2 log 2 n O(1) 现在我们用随机化的思想对此做进一步的改进。 给定具有不同和性质的集合:{x1 ,..., xk } {1,..., n} 。 令 1 ,... k 独立并服从等概率的两点分布: Pr( i 1) Pr( i 0) 1/ 2 现在我们用随机化的思想对此做进一步的改进。 给定具有不同和性质的集合:{x1 ,..., xk } {1,..., n} 。 令 1 ,... k 独立并服从等概率的两点分布: Pr( i 1) Pr( i 0) 1/ 2 接下来我们定义一个“随机和”: X 1 x1 ... k xk 则其均值与方差如下: x ... xk EX 1 , 2 x12 ... xk2 n2 k VarX 4 4 2 现在我们用随机化的思想对此做进一步的改进。 给定具有不同和性质的集合:{x1 ,..., xk } {1,..., n} 。 令 1 ,... k 独立并服从等概率的两点分布: Pr( i 1) Pr( i 0) 1/ 2 接下来我们定义一个“随机和”: X 1 x1 ... k xk 则其均值与方差如下: x ... xk EX 1 , 2 x12 ... xk2 n2 k VarX 4 4 2 使用Chebyshev不等式,对于任意的 1 , Pr[| X | n k / 2] 2 等价的:1 1 2 Pr[| X | n k / 2] 由Chebyshev不等式,我们已经得到概率 Pr[| X | n k / 2] 的 一个下界。 接下来将寻找它的一个上界。 由Chebyshev不等式,我们已经得到概率 Pr[| X | n k / 2] 的 一个下界。 接下来将寻找它的一个上界。 事实1:随机和 X 取任意给定一个正整数的概率要么为0, 要么是 2 k 。 事实2:由于“不同和”的性质,给定一个随机和 X ,将 会唯一对应一组 1 ,... k ,即只有一种组合方式。 由上面两个事实可以得到: Pr[| X | n k / 2] 2k (n k 1) 从而得到: 2k (1 2 ) 1 n k 由Chebyshev不等式,我们已经得到概率 Pr[| X | n k / 2] 的 一个下界。 接下来将寻找它的一个上界。 事实1:随机和 X 取任意给定一个正整数的概率要么为0, 要么是 2 k 。 事实2:由于“不同和”的性质,给定一个随机和 X ,将 会唯一对应一组 1 ,... k ,即只有一种组合方式。 由上面两个事实可以得到: Pr[| X | n k / 2] 2k (n k 1) 从而得到: 2k (1 2 ) 1 n k 选取优化值 3 代入,化简后就可以得到定理的结论: k f (n) log 2 n (1/ 2)log 2 log 2 n O(1) 参考文献