第131章 我需要想想
肖宿和陶哲轩一起走向报告厅外的咖啡角。
路上,他们遇到了舒尔茨。
“terence,肖,”舒尔茨打招呼,“在討论什么?”
“正要聊压缩感知和数论的交叉,”陶哲轩说,“一起来?”
舒尔茨眼睛一亮:“当然!”
三人找了张靠窗的圆桌坐下。
窗外是普林斯顿的草坪和红砖建筑。
陶哲轩点了杯美式咖啡,舒尔茨要了拿铁,肖宿喝不惯,只要了一杯水。
“所以,”陶哲轩先开口,看向肖宿,“你觉得压缩感知的思想可以用到数论中?具体怎么想?”
肖宿组织了一下语言:
“素数分布是稀疏的,孪生素数对更是稀疏中的稀疏。传统筛法工具像是在大海捞针,逐个检查每个位置。但压缩感知告诉我们:如果你知道信號有特殊结构,就不需要检查所有位置,只需要一些精心设计的『测量』就能重建全局。”
舒尔茨若有所思。
“这个类比很有意思。但数学上的『测量』指什么?在压缩感知里,测量是线性投影。在数论里……”
“可以是某种筛法权函数的构造。”
肖宿说,“我之前尝试构造权函数来捕捉素数对之间的相关性。但现在,我觉得也许可以设计两种不同的『测量』。”
“一种捕捉全局稀疏性,类似於传统筛法给出的素数密度估计。”
“另一种捕捉局部相关性,专门设计来检测『间隔为2』这种特殊结构。”
陶哲轩身体微微前倾。
“继续说。”
“假设我们把所有整数n標记为一个长度为n的向量x,其中x[n]=1表示n是素数,否则为0。”
肖宿用手指在桌面上虚画,“那么孪生素数问题就是寻找那些满足x[n]=1且x[n+2]=1的位置n。”
“这可以看作在寻找一个稀疏信號。”
舒尔茨接话。
“但这个信號太稀疏了,稀疏到传统的l1最小化可能都不够强。”
“所以需要额外结构,”陶哲轩说,“在压缩感知的最新进展中,我们开始研究『结构化稀疏』,信號的非零分量不是完全隨机分布,而是以某种模式聚集。比如在图像处理中,边缘对应的非零小波係数往往形成连续的曲线。”
肖宿的眼睛亮了起来:“素数分布可能也有某种隱藏的结构化稀疏模式!不是完全隨机,但也不是简单的周期性。比如素数定理给出渐近密度1/ln n,这是全局统计。但在局部,我们观察到像素数丛、素数等差数列这样的结构。”
“那么问题就变成了:如何数学地刻画这种结构?”
舒尔茨思考著,“群作用?对称性?还是某种更复杂的组合约束?”
陶哲轩喝了口咖啡,缓缓说:“我和本·格林证明素数中包含任意长的等差数列,关键工具是塞迈雷迪定理,一个关於整数子集中包含长等差数列的组合学结果,以及一种將素数『偽装』成稠密集的技巧。”
“偽隨机性,”肖宿说,“你们证明了素数在某种意义上表现得像隨机集,至少在包含等差数列这个性质上是这样。”
“对,”陶哲轩点头,“但孪生素数问题更精细。它不仅要素数集有某种结构,还要这个结构具有特定的间隔模式。”
舒尔茨突然说:“也许可以从『关联函数』的角度思考。在统计物理中,关联函数描述不同位置粒子状態的相互关係。对於素数,我们可以定义某种『素数—素数关联函数』:给定间隔k,两个数都是素数的概率是多少?”
“素数定理给出单个数是素数的概率约1/ln n,”
肖宿快速心算,“如果素数完全独立隨机,那么两个间隔k的数都是素数的概率应该是(1/ln n)2。但实际上,由於整数的乘法结构,这个概率会有偏差。”
“哈代—李特尔伍德第二猜想,”
陶哲轩语气激动地说,“他们推测对於固定的偶数k,存在无穷多个素数对(p, p+k),而且给出了渐近公式:这样的素数对数量约c·n/(ln n)2,其中c是一个与k有关的常数。”
肖宿知道这个猜想。
对於k=2(孪生素数),c≈1.32。
这意味著孪生素数比完全隨机假设预测的要多32%。
“这个常数c反映了素数之间的正相关性,”舒尔茨说,“就像粒子系统中某种『吸引』作用。”
陶哲轩看著肖宿。
“你的方法是试图用群论描述这种相关性,我觉得可以换个角度:把这种相关性看作某种『低维结构』。”
“在压缩感知中,如果一个信號在某个基底下可以表示为少数几个基向量的组合,我们就说它有低维结构。那么,素数分布是否也有类似的低维表示?”
肖宿陷入了沉思。
低维结构……
这让他想到了上午望月新一的理论。
望月试图用远阿贝尔几何这种高度结构化的数学工具来描述数域的算术性质。
虽然他的具体构造有问题,但大方向或许有道理:数域的深层结构可能比我们想像的更“几何”,更“低维”。
“让我做个大胆的猜测,”
陶哲轩继续说,语气像是在討论一个有趣的谜题,“也许存在某个合適的数学空间,不一定是欧几里得空间,可能是某个函数空间,甚至某个抽象的范畴,在这个空间中,素数分布对应於一个低维子流形。而孪生素数条件对应於这个子流形上的一个特殊点集。”
舒尔茨笑了:“terence,你这想法太几何了。不过我喜欢。肖宿之前的辛几何框架不就在做类似的事吗?把代数几何对象编码成『原始码向量』。”
肖宿感觉脑中有什么东西正在连接。
辛几何框架……
原始码向量……
低维结构……
他之前的辛几何工作本质上是给复杂的几何对象一个“指纹编码”。
如果把素数分布也看作某种数学对象,能否给它一个类似的编码?
这个编码可能比原始数据简单得多,却能捕获关键信息?
“我需要想一想,”肖宿说,“这个想法……可能真的可行。”
路上,他们遇到了舒尔茨。
“terence,肖,”舒尔茨打招呼,“在討论什么?”
“正要聊压缩感知和数论的交叉,”陶哲轩说,“一起来?”
舒尔茨眼睛一亮:“当然!”
三人找了张靠窗的圆桌坐下。
窗外是普林斯顿的草坪和红砖建筑。
陶哲轩点了杯美式咖啡,舒尔茨要了拿铁,肖宿喝不惯,只要了一杯水。
“所以,”陶哲轩先开口,看向肖宿,“你觉得压缩感知的思想可以用到数论中?具体怎么想?”
肖宿组织了一下语言:
“素数分布是稀疏的,孪生素数对更是稀疏中的稀疏。传统筛法工具像是在大海捞针,逐个检查每个位置。但压缩感知告诉我们:如果你知道信號有特殊结构,就不需要检查所有位置,只需要一些精心设计的『测量』就能重建全局。”
舒尔茨若有所思。
“这个类比很有意思。但数学上的『测量』指什么?在压缩感知里,测量是线性投影。在数论里……”
“可以是某种筛法权函数的构造。”
肖宿说,“我之前尝试构造权函数来捕捉素数对之间的相关性。但现在,我觉得也许可以设计两种不同的『测量』。”
“一种捕捉全局稀疏性,类似於传统筛法给出的素数密度估计。”
“另一种捕捉局部相关性,专门设计来检测『间隔为2』这种特殊结构。”
陶哲轩身体微微前倾。
“继续说。”
“假设我们把所有整数n標记为一个长度为n的向量x,其中x[n]=1表示n是素数,否则为0。”
肖宿用手指在桌面上虚画,“那么孪生素数问题就是寻找那些满足x[n]=1且x[n+2]=1的位置n。”
“这可以看作在寻找一个稀疏信號。”
舒尔茨接话。
“但这个信號太稀疏了,稀疏到传统的l1最小化可能都不够强。”
“所以需要额外结构,”陶哲轩说,“在压缩感知的最新进展中,我们开始研究『结构化稀疏』,信號的非零分量不是完全隨机分布,而是以某种模式聚集。比如在图像处理中,边缘对应的非零小波係数往往形成连续的曲线。”
肖宿的眼睛亮了起来:“素数分布可能也有某种隱藏的结构化稀疏模式!不是完全隨机,但也不是简单的周期性。比如素数定理给出渐近密度1/ln n,这是全局统计。但在局部,我们观察到像素数丛、素数等差数列这样的结构。”
“那么问题就变成了:如何数学地刻画这种结构?”
舒尔茨思考著,“群作用?对称性?还是某种更复杂的组合约束?”
陶哲轩喝了口咖啡,缓缓说:“我和本·格林证明素数中包含任意长的等差数列,关键工具是塞迈雷迪定理,一个关於整数子集中包含长等差数列的组合学结果,以及一种將素数『偽装』成稠密集的技巧。”
“偽隨机性,”肖宿说,“你们证明了素数在某种意义上表现得像隨机集,至少在包含等差数列这个性质上是这样。”
“对,”陶哲轩点头,“但孪生素数问题更精细。它不仅要素数集有某种结构,还要这个结构具有特定的间隔模式。”
舒尔茨突然说:“也许可以从『关联函数』的角度思考。在统计物理中,关联函数描述不同位置粒子状態的相互关係。对於素数,我们可以定义某种『素数—素数关联函数』:给定间隔k,两个数都是素数的概率是多少?”
“素数定理给出单个数是素数的概率约1/ln n,”
肖宿快速心算,“如果素数完全独立隨机,那么两个间隔k的数都是素数的概率应该是(1/ln n)2。但实际上,由於整数的乘法结构,这个概率会有偏差。”
“哈代—李特尔伍德第二猜想,”
陶哲轩语气激动地说,“他们推测对於固定的偶数k,存在无穷多个素数对(p, p+k),而且给出了渐近公式:这样的素数对数量约c·n/(ln n)2,其中c是一个与k有关的常数。”
肖宿知道这个猜想。
对於k=2(孪生素数),c≈1.32。
这意味著孪生素数比完全隨机假设预测的要多32%。
“这个常数c反映了素数之间的正相关性,”舒尔茨说,“就像粒子系统中某种『吸引』作用。”
陶哲轩看著肖宿。
“你的方法是试图用群论描述这种相关性,我觉得可以换个角度:把这种相关性看作某种『低维结构』。”
“在压缩感知中,如果一个信號在某个基底下可以表示为少数几个基向量的组合,我们就说它有低维结构。那么,素数分布是否也有类似的低维表示?”
肖宿陷入了沉思。
低维结构……
这让他想到了上午望月新一的理论。
望月试图用远阿贝尔几何这种高度结构化的数学工具来描述数域的算术性质。
虽然他的具体构造有问题,但大方向或许有道理:数域的深层结构可能比我们想像的更“几何”,更“低维”。
“让我做个大胆的猜测,”
陶哲轩继续说,语气像是在討论一个有趣的谜题,“也许存在某个合適的数学空间,不一定是欧几里得空间,可能是某个函数空间,甚至某个抽象的范畴,在这个空间中,素数分布对应於一个低维子流形。而孪生素数条件对应於这个子流形上的一个特殊点集。”
舒尔茨笑了:“terence,你这想法太几何了。不过我喜欢。肖宿之前的辛几何框架不就在做类似的事吗?把代数几何对象编码成『原始码向量』。”
肖宿感觉脑中有什么东西正在连接。
辛几何框架……
原始码向量……
低维结构……
他之前的辛几何工作本质上是给复杂的几何对象一个“指纹编码”。
如果把素数分布也看作某种数学对象,能否给它一个类似的编码?
这个编码可能比原始数据简单得多,却能捕获关键信息?
“我需要想一想,”肖宿说,“这个想法……可能真的可行。”