辛几何&李代数

庞蒂科夫-牧-中川-坂田矩阵

庞蒂科夫-牧-中川-坂田矩阵

粒子物理学中的味味量子数:同位旋:I或I3魅数:C奇异数:S顶数:T底数:B'相关量子数:重子数:B轻子数:L弱同位旋:T或T3电荷:QX荷:X组合:超荷:YY=(B+S+C+B'+T)Y=2(Q&I3)弱超荷:YWYW=2(Q&T3)X+2YW=5(B&L)味混合CKM矩阵PMNS矩阵味互补性在粒子物理学中,庞蒂科夫-牧-中川-坂田矩阵(英语:Pontec... 阅读全文

 

粒子物理学中的味

味量子数:

同位旋:I或I3

魅数:C

奇异数:S

顶数:T

底数:B'

相关量子数:

 

重子数:B

轻子数:L

弱同位旋:T或T3

电荷:Q

X荷:X

组合:

 

超荷:Y

Y=(B+S+C+B'+T)

Y=2(Q−I3)

弱超荷:YW

YW=2(Q−T3)

X+2YW=5(B−L)

味混合

CKM矩阵

PMNS矩阵

味互补性

 

在粒子物理学中,庞蒂科夫-牧-中川-坂田矩阵(英语:Pontecorvo-Maki-Nakagawa-Sakata Matrix,简称PMNS矩阵),又称牧-中川-坂田矩阵(MNS矩阵)、轻子混合矩阵或中微子混合矩阵,是一个么正矩阵,内含自由转播中与弱相互作用中的轻子间量子态的相异之处,因此是研究中微子振荡的重要工具。此矩阵最早由牧二郎、中川昌美与坂田昌一于1962年提出,用于解释布鲁诺·庞蒂科夫所预测的中微子振荡现象。

 

矩阵

三代轻子的混合矩阵如下:

 

庞蒂科夫-牧-中川-坂田矩阵

其中左边的是参与弱相互作用的中微子场,而右边的是PMNS矩阵,还有一个由中微子场本征态组成的向量,将中微子质量矩阵对角化后可得这个向量。PMNS矩阵描述某种味 庞蒂科夫-牧-中川-坂田矩阵

进入质量本征态 庞蒂科夫-牧-中川-坂田矩阵

的概率。这些概率与 庞蒂科夫-牧-中川-坂田矩阵

成正比。

 

这个矩阵有好几种不同的参数化,但是由于中微子探测的难度,各参数的测量要比这个矩阵的夸克对应版本(CKM矩阵)要难得多。这个矩阵最常见的参数组为三个混合角(即 庞蒂科夫-牧-中川-坂田矩阵

、庞蒂科夫-牧-中川-坂田矩阵

及 庞蒂科夫-牧-中川-坂田矩阵

)与一个相位庞蒂科夫-牧-中川-坂田矩阵

 

庞蒂科夫-牧-中川-坂田矩阵

从2011年以前的实验结果得知,混合角 庞蒂科夫-牧-中川-坂田矩阵

约为 45 度,庞蒂科夫-牧-中川-坂田矩阵

约为 34 度,而 庞蒂科夫-牧-中川-坂田矩阵

则小于 4 度。

 

作为这项研究的一个起步点,以下是一份近期讲义中引述的矩阵参数约化值 (当中假设 庞蒂科夫-牧-中川-坂田矩阵

,因此矩阵中无虚数项。 这样的假设在2011年以前与实验结果并无冲突,然而T2K、Double Chooz以及大亚湾等实验结果都指出 庞蒂科夫-牧-中川-坂田矩阵

,其值约为 4.4 度。 ):

 

庞蒂科夫-牧-中川-坂田矩阵

另见

中微子振荡

CKM矩阵

CKM矩阵内所有数值的大约大小如下:,
庞蒂科夫-牧-中川-坂田矩阵

其中Vij代表一夸克味i变成夸克味j(反之亦然)的可能性。
轻子(上图β衰变中在W玻色子右边的粒子)也有一个等效的弱相互作用矩阵,叫庞蒂科夫-牧-中川-坂田矩阵(PMNS矩阵)。PMNS矩阵及CKM矩阵合起来能够描述所有味变,但两者间的关系并不明朗。

收起全文

辛几何&李代数

BloomFilter——大规模数据处理利器

BloomFilter——大规模数据处理利器

  BloomFilter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。 一.实例   为了说明BloomFilter存在的重要意义,举一个实例:   假设要你写一个网络蜘蛛(web crawler)。由于网络间的链接错综复杂,蜘蛛在网络... 阅读全文

 

  Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。

 

实例 

  为了说明Bloom Filter存在的重要意义,举一个实例:

  假设要你写一个网络蜘蛛(web crawler)。由于网络间的链接错综复杂,蜘蛛在网络间爬行很可能会形成“环”。为了避免形成“环”,就需要知道蜘蛛已经访问过那些URL。给一个URL,怎样知道蜘蛛是否已经访问过呢?稍微想想,就会有如下几种方案:

  1. 将访问过的URL保存到数据库。

  2. 用HashSet将访问过的URL保存起来。那只需接近O(1)的代价就可以查到一个URL是否被访问过了。

  3. URL经过MD5或SHA-1等单向哈希后再保存到HashSet或数据库。

  4. Bit-Map方法。建立一个BitSet,将每个URL经过一个哈希函数映射到某一位。

  方法1~3都是将访问过的URL完整保存,方法4则只标记URL的一个映射位。

 

  以上方法在数据量较小的情况下都能完美解决问题,但是当数据量变得非常庞大时问题就来了。

  方法1的缺点:数据量变得非常庞大后关系型数据库查询的效率会变得很低。而且每来一个URL就启动一次数据库查询是不是太小题大做了?

  方法2的缺点:太消耗内存。随着URL的增多,占用的内存会越来越多。就算只有1亿个URL,每个URL只算50个字符,就需要5GB内存。

  方法3:由于字符串经过MD5处理后的信息摘要长度只有128Bit,SHA-1处理后也只有160Bit,因此方法3比方法2节省了好几倍的内存。

  方法4消耗内存是相对较少的,但缺点是单一哈希函数发生冲突的概率太高。还记得数据结构课上学过的Hash表冲突的各种解决方法么?若要降低冲突发生的概率到1%,就要将BitSet的长度设置为URL个数的100倍。

 

  实质上上面的算法都忽略了一个重要的隐含条件:允许小概率的出错,不一定要100%准确!也就是说少量url实际上没有没网络蜘蛛访问,而将它们错判为已访问的代价是很小的——大不了少抓几个网页呗。 

 

Bloom Filter的算法 

 

  废话说到这里,下面引入本篇的主角——Bloom Filter。其实上面方法4的思想已经很接近Bloom Filter了。方法四的致命缺点是冲突概率高,为了降低冲突的概念,Bloom Filter使用了多个哈希函数,而不是一个。

    Bloom Filter算法如下:

    创建一个m位BitSet,先将所有位初始化为0,然后选择k个不同的哈希函数。第i个哈希函数对字符串str哈希的结果记为h(i,str),且h(i,str)的范围是0到m-1 。

 

(1) 加入字符串过程 

 

  下面是每个字符串处理的过程,首先是将字符串str“记录”到BitSet中的过程:

  对于字符串str,分别计算h(1,str),h(2,str)…… h(k,str)。然后将BitSet的第h(1,str)、h(2,str)…… h(k,str)位设为1。

 BloomFilter——大规模数据处理利器

  图1.Bloom Filter加入字符串过程

  很简单吧?这样就将字符串str映射到BitSet中的k个二进制位了。

 

(2) 检查字符串是否存在的过程 

 

  下面是检查字符串str是否被BitSet记录过的过程:

  对于字符串str,分别计算h(1,str),h(2,str)…… h(k,str)。然后检查BitSet的第h(1,str)、h(2,str)…… h(k,str)位是否为1,若其中任何一位不为1则可以判定str一定没有被记录过。若全部位都是1,则“认为”字符串str存在。

 

  若一个字符串对应的Bit不全为1,则可以肯定该字符串一定没有被Bloom Filter记录过。(这是显然的,因为字符串被记录过,其对应的二进制位肯定全部被设为1了)

  但是若一个字符串对应的Bit全为1,实际上是不能100%的肯定该字符串被Bloom Filter记录过的。(因为有可能该字符串的所有位都刚好是被其他字符串所对应)这种将该字符串划分错的情况,称为false positive 。

 

(3) 删除字符串过程 

   字符串加入了就被不能删除了,因为删除会影响到其他字符串。实在需要删除字符串的可以使用Counting bloomfilter(CBF),这是一种基本Bloom Filter的变体,CBF将基本Bloom Filter每一个Bit改为一个计数器,这样就可以实现删除字符串的功能了。

 

  Bloom Filter跟单哈希函数Bit-Map不同之处在于:Bloom Filter使用了k个哈希函数,每个字符串跟k个bit对应。从而降低了冲突的概率。

 

Bloom Filter参数选择 

 

   (1)哈希函数选择

     哈希函数的选择对性能的影响应该是很大的,一个好的哈希函数要能近似等概率的将字符串映射到各个Bit。选择k个不同的哈希函数比较麻烦,一种简单的方法是选择一个哈希函数,然后送入k个不同的参数。

   (2)Bit数组大小选择 

     哈希函数个数k、位数组大小m、加入的字符串数量n的关系可以参考参考文献1。该文献证明了对于给定的m、n,当 k = ln(2)* m/n 时出错的概率是最小的。

     同时该文献还给出特定的k,m,n的出错概率。例如:根据参考文献1,哈希函数个数k取10,位数组大小m设为字符串个数n的20倍时,false positive发生的概率是0.0000889 ,这个概率基本能满足网络爬虫的需求了。  

 

Bloom Filter实现代码 

    下面给出一个简单的Bloom Filter的Java实现代码:

 

import java.util.BitSet;

publicclass BloomFilter 
{
/* BitSet初始分配2^24个bit */ 
privatestaticfinalint DEFAULT_SIZE =1<<25
/* 不同哈希函数的种子,一般应取质数 */
privatestaticfinalint[] seeds =newint[] { 571113313761 };
private BitSet bits =new BitSet(DEFAULT_SIZE);
/* 哈希函数对象 */ 
private SimpleHash[] func =new SimpleHash[seeds.length];

public BloomFilter() 
{
for (int i =0; i < seeds.length; i++)
{
func[i] 
=new SimpleHash(DEFAULT_SIZE, seeds[i]);
}
}

// 将字符串标记到bits中
publicvoid add(String value) 
{
for (SimpleHash f : func) 
{
bits.set(f.hash(value), 
true);
}
}

//判断字符串是否已经被bits标记
publicboolean contains(String value) 
{
if (value ==null
{
returnfalse;
}
boolean ret =true;
for (SimpleHash f : func) 
{
ret 
= ret && bits.get(f.hash(value));
}
return ret;
}

/* 哈希函数类 */
publicstaticclass SimpleHash 
{
privateint cap;
privateint seed;

public SimpleHash(int cap, int seed) 
{
this.cap = cap;
this.seed = seed;
}

//hash函数,采用简单的加权和hash
publicint hash(String value) 
{
int result =0;
int len = value.length();
for (int i =0; i < len; i++
{
result 
= seed * result + value.charAt(i);
}
return (cap -1& result;
}
}
}

收起全文

辛几何&李代数

Linux过时了- 塔能鲍姆-托瓦兹辩论(Tanenbaum–Torvalds debate)

Linux过时了- 塔能鲍姆-托瓦兹辩论(Tanenbaum–Torvalds debate)

塔能鲍姆-托瓦兹辩论(英语:Tanenbaum&Torvalds debate),由Minix创作者安德鲁&斯图尔特&塔能鲍姆(Andrew Stuart &Andy& Tanenbaum,昵称&安迪&,网络上的代号为&ast&)与Linux核心的作者林纳斯&托瓦兹(Linus Torvalds)之间,进行的网络论战,讨论的主题在于操作系统架构的选择。199... 阅读全文

塔能鲍姆-托瓦兹辩论(英语:Tanenbaum–Torvalds debate),由Minix创作者安德鲁·斯图尔特·塔能鲍姆(Andrew Stuart “Andy” Tanenbaum,昵称“安迪”,网络上的代号为“ast”)与Linux核心的作者林纳斯·托瓦兹(Linus Torvalds)之间,进行的网络论战,讨论的主题在于操作系统架构的选择。1992年在Usenet讨论组群comp.os.minix上发起。塔能鲍姆认为,以微内核架构设计的操作系统,在理论上,比宏内核架构更加优越,Linux采用的宏内核架构是过时的。但是林纳斯·托瓦兹以开发实务上的观点展开反击,并比较Minix与Linux的性能差异。稍后一些著名的黑客也加入讨论,如彼得·麦唐纳(Peter MacDonald,他创造了第一个linux发行版,Softlanding Linux System。他也协助发展了Wine软件)、大卫·米勒(David Stephen Miller,网络昵称为 DaveM,负责Linux核心网络功能以及SPARC平台的制作。他也参与其他开源软件的开发,是GCC督导委员会的成员之一)、曹子德(西奥多·曹,英语:Theodore Y. Ts’o,中文姓名曹子德,小名泰德·曹Ted Tso,他是Linux内核在北美最早的开发者,负责ext2、ext3与ext4档案系统的开发与维护工作。他也是e2fsprogs的开发者。为自由标准组织的创始者之一,也曾担任Linux基金会技术长)。这场辩论影响了Linux核心的设计走向。这场辩论有时也被视为一场口水战。

这个话题在 2006 年塔能鲍姆在 《Computer》杂志发表题为《我们能让操作系统可靠和安全吗?》的文章后被再次提起。尽管塔能鲍姆本人提到,他并不是想借这篇文章重启内核设计的论战,但是这篇文章本身和 Slashdot 技术网站上附加的 1992 年论战的归档共同使战火重燃。

Linux过时了- 塔能鲍姆-托瓦兹辩论(Tanenbaum–Torvalds debate)

林纳斯·托瓦兹(Linus_Torvalds)

托瓦兹通过一个在线论坛反驳了塔能鲍姆的论点,几个技术新闻网站随即开始对其进行报道。这使 Jonathan Shapiro 回应称,大多数经过实际检验的安全可靠的计算机系统,都使用更近似于微内核的模式设计。

辩论过程

虽然初步的辩论显得相对温和,当事人双方仅仅平淡了讨论了有关内核设计的话题。但随着每一轮的发帖,辩论开始逐步变得详细和复杂,甚至跨足于内核设计之外的其它领域,如”微处理器架构将在未来战胜其它架构”,但其中也包括了一些人身攻击、意气之争的言词辩论。除了塔能鲍姆和托瓦兹,Linux开发社区中一些著名黑客也加入辩论,包括彼得·麦唐纳,早期的 Linux 内核开发者和第一个发行版 Softlanding Linux System 的创建者;大卫·米勒,Linux 内核的核心开发者之一;和曹子德,北美洲第一个 Linux 内核开发者。

Linux 是过时的

第一条有关这场辩论的记录,在1992年1月29日,塔能鲍姆在 comp.os.minux 上发表了他的批评。在题为《Linux 是过时的》(Linux is obsolete)的帖子中,塔能鲍姆指出宏内核在整体设计上是有害的。虽然他最初并没有加入高深的技术细节,来解释他认为微内核更好的原因,但他也表明,这关乎可移植性,Linux内核对Intel 80386架构的耦合度太高,但处理器架构的进化很快。不应该在某个特定架构上开发操作系统,所有的操作系统都应该具备可以被移植到其他处理器平台的能力。他提到,在1991年仍然以宏内核来设计操作系统,是“回到1970年代的巨大退步“(a giant step back into the 1970s),现代的操作系统,应该像GNU Hurd一样采用微核心架构。

托瓦兹在一天之后反击,他首先攻击Minix在设计上有缺陷(缺少多线程是一个主要例子)。托瓦兹说,他用自己私人的时间来开发,完全没有获利,免费将代码贡献出去(当时塔能鲍姆的Minix源代码,仍然要购买才能取得),因此,对于Minix设计不良,塔能鲍姆不能用“这只是兴趣”来为来辩护。托瓦兹说,从哲学及美学的观点出发,微核心的确是一个比较好的架构,但是采用微核心架构的GNU Hurd根本没有如期被成功开发出来,所以他才要开发Linux。托瓦兹强调,操作系统核心主要的功能都倚靠硬件特性,所以内核本身不需要过度具备可移植性,让高级的软件应用程序接口具备可移植性才是更重要的。Linux内核采用集成式核心架构,是因为它能够简化核心设计,这是一个权衡下的结果(An acceptable trade-off)。以Linux来跟Minix比较,移植程序到Linux上是更容易的。托瓦兹进一步说,可移植性是那些写不出新程序的人才需要的(Portability is for people who cannot write new programs)。Linux一开始针对Intel 80386架构来开发,一部份的理由是为了托瓦兹自己买的电脑就是80386,这正好可以让他对80386架构了解更多。Linux一开始就是准备自己使用的,如果想要移植到别的平台,代码都是开放的,想要的人可以自己做。

收起全文

辛几何&李代数

异常数据的剔除与遗失数据的弥补

异常数据的剔除与遗失数据的弥补

在处理实验数据的时候,我们常常会遇到个别数据偏离预期或大量统计数据结果的情况,如果我们把这些数据和正常数据放在一起进行统计,可能会影响实验结果的正确性,如果把这些数据简单地剔除,又可能忽略了重要的实验信息。这里重要的问题是如何判断异常数据,然后将其剔除。判断和剔除异常数据是数据处理中的一项重要任务,目前的一些方法还不是十分完善,有待进一步研究和探索。 ... 阅读全文

在处理实验数据的时候,我们常常会遇到个别数据偏离预期或大量统计数据结果的情况,如果我们把这些数据和正常数据放在一起进行统计,可能会影响实验结果的正确性,如果把这些数据简单地剔除,又可能忽略了重要的实验信息。这里重要的问题是如何判断异常数据,然后将其剔除。判断和剔除异常数据是数据处理中的一项重要任务,目前的一些方法还不是十分完善,有待进一步研究和探索。

目前人们对异常数据的判别与剔除主要采用物理判别法和统计判别法两种方法。

所谓物理判别法就是根据人们对客观事物已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,在实验过程中随时判断,随时剔除。

 

统计判别法是给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常数据剔除。

第一节  拉依达准则

如果实验数据的总体x是服从正态分布的,则

异常数据的剔除与遗失数据的弥补

式中,μ与σ分别表示正态总体的数学期望和标准差。此时,在实验数据中出现大于μ+3σ或小于μ—3σ数据的概率是很小的。因此,根据上式对于大于μ+3σ或小于μ—3σ的实验数据作为异常数据,予以剔除。

具体计算方法如下:

对于实验数据x1, x2, x3,……xn先计算其均值

 异常数据的剔除与遗失数据的弥补

i=1,2,3,n

再计算残差

异常数据的剔除与遗失数据的弥补

则标准差

异常数据的剔除与遗失数据的弥补

如果某个测量值异常数据的剔除与遗失数据的弥补的残差满足

异常数据的剔除与遗失数据的弥补

则认为xd异常数据,予以剔除

 

拉依达准则是最常用的异常数据判定与剔除准则

第二节  肖维勒准则

如果某个测量值 异常数据的剔除与遗失数据的弥补的残差满足

 异常数据的剔除与遗失数据的弥补

 

xd被视为异常数据,予以剔除。上式中,wn可查表得到。其中,残差vd和标准差σ的计算方法同上。

第三节  格拉布斯准则

对于服从正态分布的实验数据:

 x1, x2, x3,……xn

将实验数据按值的大小排成顺序统计量:

 x(1),x(2), x(3),……≤x(n)

格拉布斯导出了

  异常数据的剔除与遗失数据的弥补

    的分布。取置信度α,可得T0(n, α),

  异常数据的剔除与遗失数据的弥补

    如果

  异常数据的剔除与遗失数据的弥补

则认为xd为异常数据,应予剔除

T0(n, α)的值可查表得到

T0(n, α)值表

异常数据的剔除与遗失数据的弥补 

异常数据的剔除与遗失数据的弥补 

采用格拉布斯方法判定异常数据的过程如下:

1. 选定危险率α

α是一个较小的百分数,例如1%2.5%5%,它是采用格拉布斯方法判定异常数据出现误判的几率。

2. 计算T

如果x(1)是可疑数据,则令

异常数据的剔除与遗失数据的弥补

如果x(n)是可疑数据,则令

  异常数据的剔除与遗失数据的弥补

其中

 异常数据的剔除与遗失数据的弥补

异常数据的剔除与遗失数据的弥补

3. 根据nα,查表得到T0(n, α)值

4. 如果T≥T0(n, α),则所怀疑的数据是异常数据,应予剔除。如果T< T0(n, α),则所怀疑的数据不是异常数据,不能剔除。

 

采用此法判异常数据产生误判的几率为α

第四节  狄克逊准则

狄克逊准则是通过极差比判定和剔除异常数据。与一般比较简单极差的方法不同,该准则为了提高判断效率,对不同的实验量测定数应用不同的极差比进行计算。该准则认为异常数据应该是最大数据和最小数据,因此该其基本方法是将数据按大小排队,检验最大数据和最小数据是否异常数据。具体做法如下:

 

将实验数据xi按值的大小排成顺序统计量

x(1),x(2), x(3),……≤x(n)

按表1-3-1计算f0值,然后根据表1-3-1f0f(n,a)进行比较,如果

 f0 > f(n,a)

    则判定该数据为异常数据,予以剔除。

1-3-1   狄克逊系数f(n,a)f0的计算公式

 

异常数据的剔除与遗失数据的弥补

第五节  t检验准则(罗马诺夫斯基准则)

t检验准则与狄克逊准则相似,也是检验最大实验数据和最小实验数据。首先将实验数据按大小排列

 x(1),x(2), x(3),……≤x(n)

对最小数据和最大数据分别进行检验,如果

  异常数据的剔除与遗失数据的弥补

   

     异常数据的剔除与遗失数据的弥补

x(1)x(n)是异常数据,应予剔除。

式中异常数据的剔除与遗失数据的弥补 异常数据的剔除与遗失数据的弥补 分别为不包括x(1)x(n)的均值和标准差。即

 

 异常数据的剔除与遗失数据的弥补

 异常数据的剔除与遗失数据的弥补

 

t检验中的K(n,α)可查表得到。

第六节  遗失数据的弥补

在一些情况下,每个实验点都是经过精心设计选择的,此时每个实验数据都是十分重要的。但是,如果不慎遗失了某些实验数据,或某些实验操作失误缺少了某些实验数据,该如何处理呢?当然最好的办法是补做这些实验。但是,本节要介绍的是一种特殊情况——实验数据遗失,而又无法补做实验时的处理方法,也就是如何用数学的方法来弥补遗失的实验数据。

这里方法主要有两种:

一、当实验数据有重复,并且每一批实验至少有一个数据没有遗失时,可以用未遗失的数据的平均值代替遗失的数据。

1-3-2所示为一组实验数据,其中ab为遗失的数据,现在我们来弥补这两个数据:

1-3-2  有重复实验数据的弥补

   异常数据的剔除与遗失数据的弥补

异常数据的剔除与遗失数据的弥补 =(1.5+2.4+3.5+3.3+2.2+2.1)/6=2.5

异常数据的剔除与遗失数据的弥补 =(1.2+1.4+1.2+1.3+1.6+1.5)/6=1.37

这样我们就得到了遗失数据的估计值。

二、如果没有重复 数据得实验,则用下法弥补:

1-3-3所示为一组实验数据,其中ab为遗失的数据。与表1-3-2不同的是,这组数据没有重复数据。现在我们来弥补这两个数据:

1-3-3  没有重复实验数据的弥补

异常数据的剔除与遗失数据的弥补

  异常数据的剔除与遗失数据的弥补

则总离差平方和

LT=3.522.322.02a2+2.02+1.92+2.02+1.52+1.22+1.42+b2+0.32-c

组间离差平方和

LA=[7.82+(3.9+a)2+4.72+(1.7+b)2]/3 - c

LB=[(6.9+a)2+(5.8+b)2+5.42]/4 – c

剩余离差平方和

Le= LT- LA- LB

合理的ab值应使剩余离差平方和Le最小,因此,我们的任务是求得Le最小时的ab值。为此。对Le求偏导数,并令其等于零:

异常数据的剔除与遗失数据的弥补

可求得

a=2.95

b=0.53





收起全文

辛几何&李代数

dla像素衍射临界光圈

dla像素衍射临界光圈

所谓DLA,指Diffraction Limited Aperture,字面直译应该叫做&衍射极限光圈&,不过撞针觉得要做到严格界定,发扬汉语所长,应该称做&像素衍射临界光圈&。 简单的说,当镜头光圈小于某数码相机的&像素衍射临界光圈&时,该相机成像元件的像素点将受到衍射的影响,逐点的分辨率下降。某网站给出的DLA:EOS 50D&&f/7.6EOS ... 阅读全文

所谓DLA,指Diffraction Limited Aperture,字面直译应该叫做“衍射极限光圈”,不过撞针觉得要做到严格界定,发扬汉语所长,应该称做“像素衍射临界光圈”。

 

简单的说,当镜头光圈小于某数码相机的“像素衍射临界光圈”时,该相机成像元件的像素点将受到衍射的影响,逐点的分辨率下降。

 

某网站给出的DLA:

EOS 50D——f/7.6

EOS 450D——f/8.4

EOS 1000D——f/9.3

EOS 400D——f/9.3

EOS 40D——f/9.3

EOS 30D——f/10.3

EOS 20D——f/10.3

EOS 5D Mark II——f/10.3

EOS 1DS Mark III——f/10.3

EOS 350D——f/10.4

EOS 1D Mark III——f/11.4

EOS 1DS Mark II——f/11.6

EOS 300D——f/11.8

EOS 10D——f/11.8

EOS 1D Mark II N——f/12.7

EOS 1D Mark II——f/12.7

EOS 5D——f/13.2

但该站站长比较吝啬,没解释,给机会撞针就好为人师一下咯。

 

这里涉及三个概念,衍射、衍射极限和Rayleigh判据。

 

dla像素衍射临界光圈  
光的衍射(Diffraction)指光在传播路径中,遇到障碍物或小孔(狭缝)时,偏离直线绕过障碍物继续传播的现象。

 

光经过圆形口径后成像,并不会汇聚成绝对的点,而是形成明暗相间,距离不等的同心圆光斑,其中中央斑最大,集中了84%的能量,可以看作衍射扩散的主要部分,被称为Airy Disc(爱里斑)。

 

衍射极限(Diffraction Limit)是指不考虑光学系统几何像差,一个完美光学系统的分辨率仅受衍射(光波波长)限制的情况。

 

Rayleigh判据:如果两个相邻点形成的Airy Disc的角距离小于一个Airy Disc角距离时,这两个点无法分辨。翻译成人话就是如果两成像点(其实是两个斑点)混到一块的时候,自然就分不清了。因此对于光圈为圆形或类圆形的镜头,其衍射极限分辨率就是Airy Disc的直径。

dla像素衍射临界光圈

如果Airy Disc等于数码相机成像元件单个像素尺寸,成像元件的分辨率等于镜头衍射极限分辨率,相机能够充分利用镜头的衍射极限分辨率。如果Airy Disc大于数码相机成像元件单个像素尺寸,则衍射极限分辨率成为瓶颈,成像元件的分辨率无法发挥——用一个像素点分辨一个成像点和十个像素点分辨一个成像点有啥区别?

dla像素衍射临界光圈

衍射极限公式是sinθ=1.22λ/D。其中θ是角分辨率,λ是波长,D是光圈直径。当θ很小时,sinθ约等于tagθ,约等于d/f,其中d是最小分辨尺寸,f是焦距。

 

推导出d/f=1.22λ/D, 推导出f/D=d/1.22λ。f/D就是焦距:光圈直径,这是啥?光圈f/值啊!

 

A=d/(1.22λ)。A是光圈f/值。当d等于成像元件像素点尺寸p时,A就是像素衍射临界光圈。

 

DLA=p/(1.22λ),也就是:

 

Diffraction Limited Aperture=pixel size/(1.22x light wavelength)

 

像素衍射临界光圈=像素尺寸/(1.22x光波波长)

 

所以,像素衍射临界光圈与像素大小(或者说像素数以及成像元件面积)有关。像素数越高也,像素衍射临界光圈越小;成像面积越大,像素衍射临界光圈越大;总之像素密度越大,越不适合用小光圈。

 

另外光的波长λ越小,像素衍射临界光圈越小(f/值越大)。自然光是混合光,可见光波长为380nm-780nm,咱以顺眼的蓝绿色波长(500nm)计算,结果与某网站基本一致。如果用更精确的sinθ以及像素尺寸数据,结果会略有差异。

 

最后想起了一篇专访,Canon表示,随着数码单反像素的增长,少数镜头已经不能满足新型号单反机身的要求。不妨看看50D,对红色波长来说,其像素衍射临界光圈已经只有f/5左右,而很多变焦镜头长焦端最大光圈只有f/5.6,成为影响50D发挥的因素之一。对于高像素小DC来说,设计小光圈也已经有困难。对1470万像素的小DC,撞针不敢多算。

 

最后,撞针一定要提醒:不是说小于衍射临界值的光圈就不可用!!!

 

像素衍射临界光圈确实影响成像,但也只是影响成像的诸多因素之一,对成像的影响也是随着光圈收缩逐级增加的,大量测试证明了这一点。重要的问题是,还需要兼顾景深的要求、兼顾快门的要求,需要小光圈的时候,就应该用小光圈。撞针的老话:成像只能拍第三!

收起全文

辛几何&李代数

阶级与秩序

阶级与秩序

圣谛尚不为,何阶级之有! &&青原行思禅师 Order without liberty and liberty without order are equally destructive. &&Theodore Roosevelt   1 引子 笔者来自穷乡僻壤,因此家乡话里就保有一些化石级的文化... 阅读全文

 

圣谛尚不为,何阶级之有!

——青原行思禅师

Order without liberty and liberty without order are equally destructive.

——Theodore Roosevelt

  1 引子

笔者来自穷乡僻壤,因此家乡话里就保有一些化石级的文化痕迹。旧时待客,主人会根据客人的阶级层次决定接待规格,俗谓看人下菜碟。对于拥有这种自觉的人,文化点的表述是具有较高的阶级觉悟,俺们老家的土话就说这人“长就一对阶级眼”,属于天赋异禀的一类。阶级繁杂且森严,是中国文化的精髓。历史上不仅是对官员,就连嫔妃、奴才、太监和教授都分成三六九等,都有系统科学的标识和具体而微的待遇安排。比如,汉朝是个有文化的朝代,帝妇初分为皇后、夫人、美人、良人、八子、七子、长使、少使八等,后又引入婕妤、妌娥、容华、充依、五官、顺常和无涓(共和、娱灵、保林、良使和夜者)共十五等。清朝帝妇则分为皇后、皇贵妃、贵妃、妃、嫔、贵人、常在和答应,从命名上就能看到文化的缺乏。不同阶级之间,有递补、提拔、贬谪与自甘堕落,但平时一般各以本分,这正应了原子中电子的隧穿、受激向上跃迁、受激向下跃迁和自发向下跃迁,以及大多时间在稳定状态上的无所事事。

用来区分人或物之不同等级的汉语词包括阶-级、秩-序、品(秩)、次(幂)等词,用这些词加以翻译的英文词有level,order,degree,grade,rank,等等。这些词在数学物理中频繁出现,且意义多有不同甚至混淆, 中西文皆然。中文的阶级,其中的阶(堦)见于台阶,庭阶寂寂,是实体,而级,见于拾(shè) 级而上,由计数(enumeration)而来,有抽象的内容。容易理解,台阶是一种实用的、但也被故意符号化了的存在,许多建筑在面前都筑起多层次的台阶,陡然而出威严(图1)。阶-级、秩-序这种得自自然和日常生活的词必然散布于数学物理的表述,弄不清level,order,degree,grade,rank 这些词的用法,看数学物理和看宫斗剧一样有点稀里糊涂。学物理者,将一双阶级眼用在这里,正得其宜也。

   2 Level

谈到汉译为阶级的词,容易想到的一个便是level, 见于energy level (能级),但这可能是误解。英语的level,来自拉丁语的libra,与平、衡有关。水平的线或者面,即为level,如sea level (海平面),on a level line (水平线上)。牛顿流体在重力场下的静止状态,其表面的法向应该是重力的方向,此即waterseeks its level 之意。利用这个事实,可以制作水平仪(level,见图2),这是工程中必不可少的工具。Level 不是级,而是阶、阶之面。在日常用法中,level 不仅表示层面,还暗含平衡之意, 如high-leveltalk,不仅是说会谈的层次高,而且是对等的。Level 还有equally advanced in development & even or uniform in some characters (等间距的、均匀分布的),因此level暗含“equal in importance, rank, degree, etc.”的意思,这也可能是我们愿意拿级来翻译level 的原因。但是,把energy level 翻译成能级还好,习惯性地把atomic level,sub-levels 中的level也翻译成“ 能级”这就麻烦了,它掩盖了轨道(也许就是个数学的函数)自身的排列问题,这里的level强调的也许只是轨道可分辨这个事实。在象levels of consciousness,levels of difficulty 这样的概念中,谈论的都是抽象概念的分层次,没有定量的成分。许多时候,把level 译成层次、层面也许是更合适的,哪怕是energy level。比如加速器的energylevel,如在例句LHC experiments run at the highest energy level 中,就应该译成“能量水平”, 目前欧洲大型强子对撞机就运行在13 TeV 的能量水平上。此外,象the macroscopic level of quantum mechanics一文,显然讨论的是量子力学的宏观层次。

  3 Degree

Degree, 来自拉丁语动词degradare,就是英文的degrade,是一串台阶(steps or stages)的意思,注意它更多强调了降序的排列,这一点从a cousin in the second degree (二度表亲,拥有同一个太爷爷、太奶奶辈分的前辈)一词中很容易看出来。Degree 和grade (gradus) 意义相同,两者可连用。我们在学校里学习的难易程度也是分级的(同学,你物理是第几grade 的?)。如果是沿着不易觉察的台阶或者刻度一点一点向前(向上)推进,这就是一个gradual(逐渐的)过程。达到一定程度就能graduate (毕业、爬到头了), 就可以receive a degree (获得一个学位,拿到一个刻度标记)了。常用的摄氏温标(temperature scale)的量度名称为degree Celsius (摄氏度),也称degree centrigrade (100 刻度制),后一词透露了其是如何被定义的。将标准大气压(维也纳夏季的气压)下冰—水混合物的温度定为0 ℃,把水的沸点定为100 ℃。利用稀薄空气在等压条件下体积随温度线性变换的假设,可以根据稀薄气体体积相较于0 ℃下的增量给0 ℃到100 ℃间的任意温度赋值。这就是摄氏温标的定义。注意,对于稀薄空气,在0 ℃到100 ℃之间温度每增加1 ℃,体积增加约1/267。明白了这一点,也就明白了作为对摄氏温标之拓展的绝对温标,其唯一的定标点,水的三相点,为什么会定为273.16 K了。一般中文教科书中论及摄氏温标,只含含糊糊地来一句“标准大气压下冰水混合物的温度定为0 ℃,水的沸点定为100 ℃,此为摄氏温标”,显然漏掉了太多的信息。编书者当年囿于条件不能知道细节可以理解,但根本没注意到定义的不完整就让人不能理解了。早期的来自物质体积变化的、直观的一排刻度,那真是degree,如今的电子式的温度计,显示的就是“一个”数值,则需要符号℃,°F 的提醒才会想起degree来(图3)。

有可视标度的是真degree,纯数字的就靠外加符号的提醒了

Degree 可用作对一般程度的或者干脆就是直观存在的度量。一个圆, 其上可以划上刻度, 分为360°,那是对每年天数的取整,不具有绝对的意义。在反射光的degree of polarization(偏振度)概念中,degree 反映的是程度,其取值在0到100%之间。Degree 或者grade 还被用来衡量抽象概念的程度,如马克思的《政治经济学批判》一书中有句云:“Der Tauschwert der Waren,so als allgemeine Äquivalenz und zugleich als Grad dieser Äquivalenz in einer spezifischen Ware,oder in einer einzigen Gleichung der Waren mit einer spezifischen Ware ausgedrückt,ist Preis (商品的交换价值,作为一般等价以及在某特定商品中此等价的程度值,或者表达为该商品同某一特定商品的等值关系,是价格)”。在degrees of degeneracy(简并度),degrees of freedom (自由度)等概念中,degree 是个正整数。简并度,即对应同一能量之不同状态的数目,在德语中简并度的说法为Entartungsgrad,可见degree 就是grade。自由度就是描述体系所需的独立变量数。仔细体会这个定义,“ 描述体系所需的独立变量数”,则自由度的多少取决于如何描述。描述一个粒子在三维空间中的位置需要3个变量,则描述由N(N≥3)个粒子组成的刚体的构型就需要6个独立变量,或者说刚体运动的自由度为6。在热力学—统计力学中有所谓的能量均分定理,谓每一个自由度对比热的贡献都是一个R/2,R是气体普适常数。如果不深入了解这个能量均分定理成立的条件,许多人都难以理解水分子H2O何以有18个自由度,而水(蒸汽)的比热也一直是温度的函数。就比热问题而言,自由度是能量表示涉及的自由度,这包括动能涉及的动量自由度和势能涉及的位置自由度。有趣的是,某些晶体的晶格可看作是两套或多套亚格子(sublattice)套构而成的,这也可以看成是一类自由度。炭单层的六角晶格是由两套三角格子构成的,其中电子的波函数可以比照电子自旋写成两分量的形式。

  Degree 作为函数或者方程的指标, 汉译为次( 次幂) 或者阶。比如 , 函 数

  阶级与秩序

  是? th-degree Legendre polynomial,汉译? - 阶勒让德多项式。The degree of a monomial,汉译单项式的次幂,是变量指数的和,比如项x2y3的degree 是5。单变量的代数方程(univariate polynomial equation),以变量的最高次幂命名,简称为一元二次方程(a second degree monic polynomial equation)、三次(third degree)方程等等。当然了,这类方程有专门的、简单的称谓quadratic,cubic,quartic,quintic,sextic polynomial equations,分别为二次、三次、四次、五次和六次代数方程。五次以上的多项式方程不存在代数解(unsolvable by radicals),对这个问题的理解带来了群论的诞生。群论对物理学的影响,怎样高度评价都不为过。物理学最深刻的学问,所谓的the fearful symmetry(了不起的对称性),来自对一元代数方程的摆弄。对一元多项式解的探索,是一场惊心动魄的天才的游戏。与解方程有关的还有topological degree theory。如果方程有某个容易得到的解,degree theory 可用来证明其它非平凡解的存在。Degree theory看起来和fixed-point theory(固定点理论), knot theory( 纽结理论) 有关,具体内容笔者不懂,此处不论。

  4 Order

Order 简直就是一个充斥数学和物理学领域的一个词汇。Order 的西语本意也是“放成一溜儿(straightrow,regular series)”的意思,可作为名字和动词使用。Order frequently refers to orderliness, a desire for organization。存在总是表现出某种意义上的order,这让认识世界成为可能。Objects should be ordered in order to bring in some order and clarity(为了有序和明晰,应该为对象排序),这几乎成了科学家的共识。排序、分类是研究的前期准备。

Order 是个用得太多的词,可以想见它的汉译会花样繁多。Order 在物理语境中一般被译成序,如orderparameter (序参量),topological order(拓扑序),off-diagonal long-rangeorder (非对角长程有序),等等。过去分词形式ordered 用作形容词,如晶体就是ordered structure (有序结构)。Order 的对立面是disorder,formless,最无序的存在是chaos (混沌),指the disorder of formless matter and infinite space (由无形的物质和无限的空间一起构成的无序)。混沌被当作有序之宇宙出现之前的状态,也就是说当前的有序状态是自完全无序中发生的,order out of chaos,哈,多哲学。

Order 出现的语境,更多的还是和排序有关,比如lexicographical ordering (字典编纂采用的排序),electrons are always added in order of increasing energy(电子按照能量递增的顺序被加进来),the order of differentiation or integration( 微分、积分的次序),等。微分、积分以及乘积的顺序有时候没关系(immaterial),有时候关系重大,结果依赖于顺序的就意味着别样的数学结构和物理,比如非交换代数或者物理里的非对易算符。有时候,有些源自order 的词从我们的角度来看,会以为排序的意思不明显,比如coordinates和ordinate 就给译成了坐标和纵坐标(vertical ordinate),但请记住这里的关键是这些数值具有排序的含义在里边。有些地方把笛卡尔坐标系的x-轴称为horizontal ordinate(水平坐标),但其实有时候x-轴的对象不是可排序的量,如职工工资分布图,工资是可排序的,职工则无所谓序。当我们把y-轴理解为ordinate时x-轴有专有名词abscissa,是个标记(锯痕?)而已。此外,如lineardimensions are of the order of L,汉译为线性尺度在L的量级,字面上可看到的意思是若排列的话,该尺度应该可与L 等量齐观的。Order of magnitude,量之大小在序列中的位置,汉译干脆就是数量级。

数字的用法分为ordinal numbers( 序数) 和cardinal number ( 基数),前者明显与order有关,而后者也不免和order 有关。一个集合的元素数目,是集合的cardinality (集合的势),而群的元素数,当然也是cardinality, 又被称为order of group,汉译“群阶”。与此同时,群元素g 的period (周期),即使得gm=1 成立的最小整数m,也称为该群元素的order。群阶和元素的阶反映了群的内在结构。大致说来,一个群,其群阶的因子分解越复杂,这个群的结构就越复杂。不仅群和群元素有order 的概念,群的特征标(character)也有order的说法。

Order 在许多场合下有排序的意思,与其连用的数词应是序数词,如second-order differential equation(二阶微分方程),third-order recurring sequences (二阶递归序列),first-order approximation (一阶近似),等等。物理学的方程被限制在(第)二阶(偏)微分方程的层面,学会了解二阶(偏)微分方程,一个纯数学家也许比许多物理学家更象物理学家。量子力学以及后继的发展被有些人频繁以革命誉之,属不通之论,其governing equations 模样可以变得复杂可怕,但属于二阶微分方程却是不变的。

  5 Rank

中文的秩,序也,次也,可连用为秩序、秩次(官阶的高下),还有秩叙(次序)、秩然(秩序井然)、秩如等词。秩既然用来表示官阶的高下,相应的标识就有秩服(区别官阶的服饰)、秩俸(分级别的俸禄)等委婉语。秩被用来翻译英文数理概念中的rank,日常表述的rank,如military rank (军阶)还是用阶级加以翻译。中国古代的官员有华丽花哨的秩服,今天各国军队的military rank 则用华丽花哨的徽章(insignia)加以标识。

Rank,与range,arrange 同源,意为to arrange in order,特别是排成行。作为及物和非及物动词用,rank 一般是排序的意思,如to rank third on a list ( 位列第三), qualitative ranking of various ions toward their ability to precipitate a mixture of hen egg white proteins (根据使得鸡蛋白沉淀的能力把离子定性地加以排序), Alfred Nobel 在设立诺贝尔奖时将物理学排在第一位(ranked physics as the first one), 等等。Rank 作为名词表示次序,汉语的翻译比较随意, 比如people from allranks of life (各阶层人民),a poet of the first rank ( 一流诗人), 等等。Rank 作为排序的意思强调是排成行,国际象棋棋盘上空格的行与列,英文用的即是rank 与file;相应地,对于矩阵的行与列,英文用的是row与column。

Rank 作为科学概念我们知道有rank of a matrix 矩阵的秩的说法。Rank 是矩阵的一个基本特征。把矩阵的行(列)看成一组矢量,这组矢量中线性无关的矢量的数量即是所谓的rank,也即行(列)矢量所张空间的维度。对于一个矩阵,行和列具有相同的秩,也就是矩阵的秩。考虑到矩阵同线性方程组和线性变换(算符)相联系,因此矩阵A 的秩是线性方程组A·x=c 非简并性的度量,也是线性变换y=A·x 之像空间的维度。

在物理上,我们知道能量是标量(scalar),动量、位置是矢量(vector),而角动量L= r? ×p?是贋矢量等等,这些可以用张量(tensor)的语言统一处理。张量是描述张量之间线性关系的几何对象(有点循环定义的味道哈),张量的rank (也叫order或者degree)就是用来表示张量的数列的维度,也即所需指标的个数。由此可知,能量,动量(位置)和角动量分别是rank-0,rank-1 和rank-2张量。针对某个标量(质量,电荷)的空间分布定义的四极矩张量, Q=∫Ωρ(3rirj - |r|2δij)d3r , 就是无迹的rank-2 张量。电位移D (矢量)对应力张量σ(rank-2张量)的响应,或者应变张量ε(rank-2 张量)对电场E (矢量)的响应,相应的系数就是rank-3张量。

涉及线性行为的代数、变换和算符等概念都会有rank 这个特征,因此有(李)代数的秩,(不可约)张量算符的秩等说法。Module (模式)概念也有秩的说法,比如rank 2 的自由Z-module 不过是Ok = Z ?ωZ 的一种装酷的说法而已,其中ω ∈Ok ,Ok 为一代数整数集合。对椭圆曲线y2=x3+Ax+B 也有rank 这么一个量,比如椭圆曲线y2=x3-2 和y2=x3-4, 其Mordell—Weil rank 就是1。这种秩有什么意思,怎么计算,笔者不懂。

收起全文

Mathephysician

几个计算题,仅供大家娱乐

几个计算题,仅供大家娱乐

以下几个计算题难度不一,有的可以立刻口算,有的需要一番功夫,不要小看了计算,这里的第一个积分在解析数论中的一个结论的证明中将发挥重要作用(今后的文章会给出)。看看大家谁算得又快又准~... 阅读全文

以下几个计算题难度不一,有的可以立刻口算,有的需要一番功夫,不要小看了计算,这里的第一个积分在解析数论中的一个结论的证明中将发挥重要作用(今后的文章会给出)。看看大家谁算得又快又准~

几个计算题,仅供大家娱乐 几个计算题,仅供大家娱乐

几个计算题,仅供大家娱乐

 

收起全文

辛几何&李代数

辛亥革命 · 1911

革命人士 ... 阅读全文

 

革命人士
同盟会
兴中会

孙中山  陈天华  杨衢云  杨鹤龄  陈少白  尤列  陆皓东

华兴会

黄兴  宋教仁  章士钊  刘揆一

光复会

蔡元培  陶成章  秋瑾  徐锡麟  龚宝铨  章炳麟  熊成基  陈魏

共进会

张振武  焦达峰  孙武  熊秉坤  伍廷芳

文学社

蒋翊武  刘复基  张廷辅  胡瑛

其他成员

邹容  陈其美  徐宗汉  林觉民  廖仲恺  谭人凤  林森  唐绍仪  咸马里  阎锡山  胡汉民 赵声  陈炯明  郑祖荫  蔡锷  汪精卫

革命军

黎元洪  吴兆麟  何贯中  李济深

清政府
执政皇族

光绪帝  慈禧太后  隆裕太后  爱新觉罗·溥仪  爱新觉罗·载沣  爱新觉罗·载洵

立宪派

康有为  梁启超  谭嗣同  严复

出洋大臣

戴鸿慈  端方  李盛铎  尚其亨  爱新觉罗·载泽  绍英

镇压军

萨镇冰  荫昌  博尔济吉特·瑞澄

北洋军阀

袁世凯  段祺瑞  冯国璋  徐世昌  吴佩孚  曹锟  张勋

收起全文

辛几何&李代数

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

在学习系统动力学的时候,尤其遇到类似于物理学的分子热运动体系或者生化反应体系时,不可避免地就会遇到标题所指的&四大方程&:切普曼-科尔莫格洛夫方程(Chapman-Kolmogorov equation, C-K equation),主方程(Master equation),福克-普朗克方程(Fokker-Planck equation, F-P equat... 阅读全文

在学习系统动力学的时候,尤其遇到类似于物理学的分子热运动体系或者生化反应体系时,不可避免地就会遇到标题所指的“四大方程”:切普曼-科尔莫格洛夫方程(Chapman-Kolmogorov equation, C-K equation),主方程(Master equation),福克-普朗克方程(Fokker-Planck equation, F-P equation),朗之万方程(Langevin equation)。今天花了点时间,把这四个方程之间的相互关系推导了一遍;主要参考资料为:N.G. van Kampen, Stochastic Processes in Physics and Chemistry. 3rd edition, 2007. Elsevier Publisher. 由于科学网博客数学公式编辑功能有限,所以我在iWork上编写好后贴图到这里。

分子动力学“四大方程”之间的详细推导过程

 

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

分子动力学“四大方程”之间的详细推导过程

收起全文

辛几何&李代数

数学家破解百年高维“球体填充问题”

数学家破解百年高维“球体填充问题”

有些人的工作是在噪声图像中分离信号,以寻找来自数十亿公里外的外星文明;有些人在研究弦理论,以探索宇宙中基本要素的内在联系;有些人则在食品店堆放水果,以求最节省空间的方法从而码得最多。奇妙的是,这些看似无关的事情都因为数学纽带而联系到一起&&它们都涉及到球体填充问题。只不过有些球体存在于其他维度。让我们看看数学家有什么最新发现。 早在1611年,... 阅读全文

有些人的工作是在噪声图像中分离信号,以寻找来自数十亿公里外的外星文明;有些人在研究弦理论,以探索宇宙中基本要素的内在联系;有些人则在食品店堆放水果,以求最节省空间的方法从而码得最多。奇妙的是,这些看似无关的事情都因为数学纽带而联系到一起——它们都涉及到球体填充问题。只不过有些球体存在于其他维度。让我们看看数学家有什么最新发现。

 

数学家破解百年高维“球体填充问题”

 

早在1611年,开普勒就已经推测出如何码放相同大小的球体能够达到最密集效果。他认为,形如金字塔那样的堆积方式乃是正解,就像在水果店里见到的桔子那样。球与球之间总会存在空隙,通过进一步研究,数学家们发现在满满一袋子网球里面,大约36%的空间都是空气。假如你能够精心排布这些网球,那么这个比例可以降低到26% (亦称26%法),但是人们在一百年前就已经认识到,26%乃是其极限。而对于开普勒的猜想,直到1998年,才被现在匹兹堡大学的Thomas Hales教授所证明。据说当时数学论证文档长达250页,还动用了猛犸象计算机。

 

其实,玩数学的人还会在高维度下鼓弄球体填充游戏——球的定义依然不变,但“距离”这一概念则在我们熟知的三维系统 (比如x,y,z轴) 之外获得了更多属性。其实,高维球体的定义并不复杂:在高维空间下到给定球心距离相等的一组点所构成的即为高维球体。重要的是,在多维环境下将具有更多的码放方法。所以寻找能够空间利用率最高的球体排布可能性一直是主要挑战。

 

不过,我们很难对高维度下的球体填充进行视觉呈现,但它们却是非常实际的存在:高密度的球体填充与我们常见的纠错代码有着密切关系。早在上世纪60年代,John Leech试图纠正信号在传播过程中所积累的错误或噪声。他发现在24维度下处理数据会非常实用,尤其对于从5亿英里以外传送回木星图像这种工作来说。

 

数学家破解百年高维“球体填充问题”
旅行者1号

 

十年后,旅行者1号和2号确实采用了这一方法。1977年,NASA在发射木星和土星探测器前曾面临着重要难题:在极低的电力供应下,如何将旅行者号拍摄的彩色图片传送回地球?当时所采取的方式是将图像转换为一组24位的二进制序列,成为“代码字”。代码字以无线电波的形式发射进宇宙,波峰和波谷分别代表1和0。但数据传输总会伴随着噪声,有时1会失真为0,有时0又会变成1。所以要还原旅行者号的图像,就需要纠错。

 

一方面,代码字需要足够清晰显著以便识别;另一方面,在24位的限制下,相对含混模糊的代码字才能提供更多的可能性,以及更快的数据传输速度。这样的矛盾与需求也随之转化为几何问题,比特位对应在了空间坐标上,每段代码字都成为一个24维空间下球体的球心。如果球体发生重叠,那么相关的代码字也将无法被识别。为了最大化地传输数据并且进行纠错,问题最终演变为:如何在24维空间下最密集地填充球体?

 

数学家破解百年高维“球体填充问题”
E8 lattice points

 

长久以来,数学家们已经积累了大量证据,几乎要默认E8和Leech晶格 (两者分别为8维度和24维度下极为美妙且对称的球体填充模型) 就是两种维度下的最佳填充方法。但他们一直缺少一项关键证据,即一个能够计算可容许球体最大密度的函数。

 

如今,乌克兰数学家Maryna Viazovska似乎已经找到了答案。今年3月,她先后在论文预印网站上贴出了两个重要的成果。她首先从8维空间球体排布开始说起,证明了E8晶格 (E8 lattice) 在8维空间中具有最大密度。E8很像是高维版本的“26%法”问题,只不过在8维空间下,球体之间拥有更多空隙,可以多塞进去一些。

 

数学家破解百年高维“球体填充问题”

Maryna Viazovska

 

当然,弦理论家并不会摆弄球体,他们只是将E8结构当作不同维度下的弦理论彼此关联方式中的重要组成部分。弦理论从26个维度开始,并需要折叠简化至我们所熟知的3维。E8则包含了折叠所需要的所有必要属性。

 

数学家和物理学家认为这绝不是一个巧合。他们觉得这样一个维度是最为简单有效的,因为再添加任何一维空间都会使其更难以解释。可能他们还真说对了,Viazovska已经可以证明E8结构不会留下任何额外空间,对于8维球体填充来说这是最高效的方法。

 

数学家破解百年高维“球体填充问题”

 

不过她并没有止步于此。在发布了8维研究后,一些希望解决24维问题的数学家找到她,于是他们开始研究 “Leech晶格”。Leech晶格对信息的处理方式就好比在24维度下排布球体,数学家们也一直认为这是最有效的解决方法。仅仅在E8文章公布一周之后,Viazovska和同事们又搞定了24维的问题

 

尽管两篇文章尚未接受同行评议,在数学圈内似乎并没有什么质疑。由于E8和Leech晶格与数学和物理的诸多领域关系密切, Viazovska等人的发现对未来的研究有着重要意义。

收起全文
更多热门小站