社会物理学

原文链接:Sociophysics




原作者:Frank Schweitzer,瑞士苏黎世联邦理工学院系统设计系教授。

本文已发表于《世界科学》杂志。

如果社会个体之间的相互作用可以描述,那么社会集体行为可以建模和分析。

二十四年前,2008年诺贝尔经济学奖得主保罗·克鲁格曼(Paul Krugman)写道:“经济学比物理学更难; 幸运的是,不如社会学难。” 十三年前,多因·法默(Doyne Farmer)(注:圣塔菲研究所金融经济学家),马丁·舒彼克(Martin Shubik)(注:耶鲁大学数理制度经济学家)和埃里克•史密斯(Eric Smith)(注:圣塔菲研究所自组织研究专家)提出了这样一个问题:经济学是一门新的物理科学吗?(见《今日物理》2005年9月,第37页)。如果你过去对社会学是一门新的物理科学表示怀疑,那么现在你可能会更加怀疑。

对这两个问题的正常的怀疑可能确实比今天一些物理学论文中的过度乐观要好。但是在物理学和社会科学交叉地带,有取得丰硕成果的迹象,其中大部分与计算社会科学这一新兴领域有关。这种趋势是由新的社会数据驱动的,传感器记录的我们日常生活的数据日益增多,有专门软件收集这些数据。为了阐明社会学、经济学与物理学之间发展中的关系,我们不妨回到历史。

苏格兰哲学家休谟(David Hume,1711-1767)在著作《人性论》(A Treatise of Human Nature)中提出以数学和物理的精神建立人类的新科学。在19世纪,新的物理理论出现。电磁学表明,电和磁两种看似不同的现象其实是一个共同的东西(电磁场)的不同侧面。热力学引入了一个新的且抽象的概念,“系统”。法国哲学家奥古斯特·孔德(Auguste Comte,1798-1857)提出,社会遵循一般规律,就像物理世界一样。为了确定法律的经验基础,比利时统计学家阿道夫·凯特勒(Adolphe Quetelet,1796-1874)将概率论应用于有关人类的数据。在他的著作《论社会物理》(Essays on Social Physics,1835年),他根据正态分布导出了普通人的统计规律。例如,他定义了体重指数来量化肥胖。他还分析了犯罪和公共卫生。凯特勒用“社会物理学”这个术语称呼自己的统计方法,孔德知晓之后,造了“社会学”一词来称呼他的人类和社会新科学。

在20世纪,物理学再次成为设计新的基础理论方面的榜样。相对论修正了空间和时间的概念,量子力学引入了不确定性原理,都为观察者的角色和观察过程带来了新的认识。现代物理学对哲学和社会科学有着广泛的影响,甚至在一定程度上可以令人觉得不可思议。到20世纪后半叶,这种影响不再是通过一般理论,而是通过通用和抽象的建模方法。早在20世纪40年代,格子模型(lattice models,后来被广泛称为元胞自动机(cellular automata,CA))就被用于研究社会分异(social segregation,不同社会特性的居民聚居在不同的空间范围内,居住分化甚至相互隔离,比如有些城市有明显的富人区和贫民窟。——译者注)。这些模型具有可调参数,如迁移距离,街区内可容忍居民与不可容忍居民之比。

元胞自动机的最显而易见的能力在于模拟和可视化社会动态演化(注:物理上称为社会动力学)。但是,元胞自动机也可以进行深刻的分析。恩斯特·伊辛(Ernst Ising)在1924年提出一个抽象的解释铁磁的自旋系统,后来被称为伊辛模型。伊辛模型是这样的,网格(一维或二维或三维,研究得非常透彻的是一维和二维)每个格点上都有一个自旋,自旋的值是+1或是-1。根据相邻自旋对之间耦合常数的强度,从伊辛模型中可得到铁磁相(各格点的自旋值都相同,称为自旋平行)或反铁磁相(相邻自旋值都不同,也称自旋反平行)。这一一般模型后来成为研究意见动力学的完美模型,正负自旋分别代表代表两种不同的意见。但是将伊辛模型应用于社会现象的研究,所得却相当有限。在意见动力学中,我们比较感兴趣的是两个问题,一是会达成何种共识(对应于铁磁相),二是意见稳定共存需要什么条件。伊辛模型用于社会问题研究,有一些简化模型,如投票模型(voter model),将这种分析形式化,并到推广到各种拓扑结构,包括网络。投票模型中,“选民”并不投票,而是随机从邻居中选个自旋值,即与其意见一致。

这些模型令社会物理学家兴致盎然,但并没有给社会学家带来什么影响。志在得到物理洞察——如相变和标度律——的通用建模方法,可能可以揭示出很多关于统计物理学方面的信息,但几乎增加不了多少社会动力学方面的信息。仅仅使用物理隐喻和类比并不是运用物理学。物理学家只有在关注现有社会理论情况下,才能引起社会学家注意。这种情况挺罕见,但还是有的,其中一个例子就是社会影响理论(social impact theory),社会心理学家在20世纪80年代发展了这一理论,来描述个人如何成为社会影响的来源和目标。这个理论的基础是社会力概念,与物理学里力的概念很类似。个人可以说服与自己意见相左的人,支持与自己意见相同的人,但是他们的影响力与社交距离呈幂律关系。将这种相互作用进行计算机模拟时,能观察到志同道合的个体结成团体,但是这种现象比伊辛模型之类的模型要丰富得多。

社会物理结合社会理论取得丰硕成果的另一个例子是文化传播模型。文化传播模型是美国政治学家罗伯特·阿克塞尔罗德(Robert Axelrod)于1997年最早提出的(见图1)。其社会物理学版本可以看作是意见动力学的Potts模型。Potts模型是伊辛模型的推广,其自旋可以具有两个以上的值。文化传播模型旨在结合社会机制,如同化(个体通过互动变得更加相似)、同质(相似的人互动更频繁)。



图1. 文化动力学。二维规则点阵上每种主体(agent) 为文化特性向量,向量中的元素为饮食、宗教等,其各自(如粤语、佛教等)概率称为trait。图上不同的颜色表示不同的文化。一个主体与近邻主体相互作用的概率随 traits 重叠程度的增大而增大。因此相似的主体会变得更加相似。模拟初始时刻,给各主体 随机赋予 traits(见左图),演化的结果,大部分情况是形成几种文化的共存(见右图),也有模拟得到的最终结果是形成单一文化。(见参考文献4。)

1970年代,自组织——现在的复杂系统理论前身——等概念形成,新的一类社会物理模型遍地开花,这些模型认为,重要的不是系统的元素,而是系统的动态相互作用。于是,物理化学系统中诸如B-Z反应等结构形成原理方面的研究被推广至生物和社会系统。自组织理论被应用至社会物理学,主要是被采用为社会动力学的形式方法。5 具体应用包括移民、意见动力学。但是,与当时各种典型的社会物理模型一样,缺乏与社会数据的联系。

1995——2005年的十年间,随着用于小规模模拟的便宜的计算能力可资利用,社会物理学话题在物理学界开始兴起。几乎所有社会问题都被建模和模拟。意见动力学、婚外情、有性生殖、语言演化、等级出现等现象,都引起了社会物理学家的注意(见参考文献6和 7)。这些模型的优点同时也是其缺点:简单。比如,模拟儿童如何学会说话,生成机制————产生某种效应的过程————是未经证实的先验假设。然后就对生成机制的效应和系统动力学的某些反馈机制的作用进行研究,并不将问题所有细节都考虑进去。

计算社会科学

物理学家最近对社会经济问题感兴趣,一定程度上是所谓大数据所驱动的。在1990年代中期,物理学家开始分析金融市场的大数据,表现出的热情不亚于1980年代中期分析高能物理实验大数据的情形,带来了经济物理的大发展。在2000年代中期,物理学家开始对互联网上,尤其是在线社交网络上的大数据感兴趣,最关注是搜索数据中的特征模式和普适的统计规律,与经济物理学的情况很类似。

经济物理探索很好地呼应了凯特勒早期总结统计规律的工作,并得到很多有意思的发现。比如,人际交流中,两紧邻消息之间的时间间隔满足幂律分布,见图2,并且具有普适的指数,该分布适用于各种交流媒介。发现的其他普适分布还有比例代表制中的选举投票、学术论文引用次数等。



图2. 人际交流似乎是无标度现象。同一人发出的两个连续消息之间的时间间隔,也称为交互时间间隔,$\tau$,遵循幂律分布 $P(\tau)\propto \tau^{-\alpha} $,其中 $\alpha\approx 3/2$。此结果很可靠,对信件、email、在线聊天(图中所示)等各种媒介进行分析,都得到此结果。曲线在$10^3$分钟处的轻微鼓包表明的是人进行上线聊天的以一天为周期的节律性。(此图来源:Sci. Rep. 2, 402, 2012

这些发现恰说明了英国经济学家尼古拉斯·卡尔多提出的“典型化事实”(stylized facts)——经济世界中不同观测共同总结出的一些规律。物理学家找出些动力学机制,可以很好地重复出这些典型化事实,但不敢说抓住了社会相互作用的本质要点。另外,物理学家强调普适性,这令经济学家和社会学家很不爽,并对典型化事实的重要性和原因提出诸多质疑。如果社会现象也能归结到各种普适类,这对人类意味着什么?如果不能归结到各种普适类,这对人类又意味着什么?

社会物理学当前的趋势与现在所谓的“计算社会科学”密切相关,计算社会科学以数据驱动的方法研究社会现象。研究所用的数据多来自互联网,是人们在使用手机、社交网络、搜索引擎、网上银行等时产生的。社会学过去不要求宝贵数据,也没准备好处理数据,但数据使以前的经验分析提高了好几个数量级。如此便产生一个问题,哪里搞到数据?这个空白是由工程师和计算机科学家解决的,工程师建造和安装更多传感器,计算机科学家收集和处理巨量的数据。

亚历克斯·彭特兰的著作《社会物理学》(Social Physics)和其他最近发表的社会物理领域研究论著与物理学几乎无关,更多是关于大数据的分析。在大数据分析方面,他们与孔德的哲学要做的事情是共通的。但是大数据分析不去理解现象背后的机制,而是把目光聚焦于诸如以下事情:交通流等之监管、开发Uber之类的大数据利用APP、解决一些实际问题如预测热门网购产品。



亚历克斯·彭特兰的著作《社会物理学》封面

大数据分析尽管不注重对现象的理解,但大数据领域新趋势也为创建完全基于数据处理的新社会科学带来了希望。2008年,《连线》杂志(Wired magazine)主编、曾是物理学家的克里斯·安德森(Chris Anderson)在文章中写道:“面对巨量数据,科学方法——提出假设、建立模型、检验验证——已经过时。”《连线》杂志要报道的是PB(1PB = 1,000,000,000 ($10^9$)MB)时代:“传感器无处不在,存储空间无限量,处理器位于云端。我们捕获、存储、理解巨量数据的能力正在改变科学……随着我们收集的事实和图表的增长,我们找到基本问题的答案的机会也在增大。盖因在大数据时代,多者非仅多也,多者异也(More is different,美国物理学家安德森写的一篇著名文章的标题,大致讲的意思是,大量简单单元组成的系统可以非常复杂,其性质不能由组成单元的性质推导得到。——译者注)。”

安德森声称,新科学是由数据和技术驱动的,这没有什么错。但是科学里最重要的成分是,且一直是,问题。数据科学可能会有助于回答一些基础问题,但是本身却不会提出问题。这一套做法,先收集数据,再从中提取模式,可以辨认出新的——多数情况下是假的——相关性。在社会学里,问题不仅仅是如何,还在于为什么。因此,我们需要新型的模型,能够体现社会系统动力学背后的“推理”。

数据驱动建模

发展这样的模型不仅仅是一个技术上的挑战,也是概念上的挑战,而这需要精通物理学才能克服。物理学家的本事在于,与其他学科研究人员合作,给出复杂系统的一般理解。复杂系统由大量强烈相互作用的元素组成,这些元素一般称为主体(agent,主体是常见翻译,但远不是令人满意的翻译)。复杂系统研究的目标,按照统计物理的传统,是预言主体相互作用中所产生出的集体效应。复杂系统研究主要有两种形式化的方法:由随机方程导出系统宏观动力学和对系统模型进行数值计算,物理学家对这两种方法都有贡献。基于主体的模型不仅存在于社会学和经济学,还存在于计算机科学。事实上,物理学里基于粒子的模拟方法与基于主体的模型计算有颇多共同之处。

如前所述,以前的大多数社会物理模型旨在揭示普适规律,这些模型具有有限的复杂性,不能反映任何特定的社会系统的复杂性。因此,它们不能根据实际数据进行校准和验证。大数据也无法解决验证问题。我们需要的模型是可以根据实际数据进行校准和验证的模型。

以前的大多数社会物理模型所忽视的另一问题在于主体本身的复杂性。表示人的主体几乎不可能仅用向上和向下的自旋表示。人做出决定要受到各种因素的影响,如个人偏好、社会规范、他人影响等。把这些因素都考虑进去不仅仅是增加自由度的问题。社会经济系统里,主体还多是异质(heterogeneous)的,即在类似情形下却有大为不同的相互作用方式。主体还具有自适应性,能从经验中学习而对激励和系统中的变化做出响应。同时,主体还会通过消耗资源、创新等活动改变系统。异质性和自适应性使得对社会经济系统做出预言变得非常困难。

成功的社会物理模型往往与经验数据和社会学理论都有联系。如果不联系社会学理论,人们也依然可以发现有趣的现象,得到新的研究结果。但是,在这样的情况下,社会物理模型如何与现有的学科知识之间如何联系起来将不清楚,且做出的发现可能也产生不了大的影响。社会物理模型通常是通过需要解释甚至创建的新数据与经验数据相联系。与经验数据相联系,有助于定义清楚问题,以设计模型来解决。尽管机器学习方法本身也可以对数据进行分类和做出预言,但不能创建体现背后机制的模型。

成功的社会物理学模型也可以将微观和宏观联系起来,即将局域小尺度上的相互作用的主体与整个体系层面的大尺度上的动力学联系起来,并且所建立的联系是具体的和可检验的。理想情况下,这样的社会物理学模型遵循数据驱动建模的原则:根据相关学科——如语言学、人类学——的标准对主体进行建模,且基于主体的模型允许用经验数据校准相互作用机制。模型还要进行验证,方法是将模拟所得动力学与观测进行定量对比。

下面举几个成功的数据驱动建模的例子。

一个例子是行人动力学。主体模型考虑到了行人之间的社会力、优先行进方向、障碍。模拟得到符合实际的行人集体动力学,并可应用于模拟恐怖袭击或其他恐慌情形下的逃生动力学,优化建筑和街道的设计。类似的模型可描述各种动物的群行现象。

另一个例子是预言传染病的蔓延,比如如何通过国际民航蔓延。根据校准后的模型,提出了控制传染病的策略。再一个例子是模拟集体情绪动力学(见框),主体之间的情绪动力学的假设用数据进行检验。校准后的模型可以正确重复多个在线平台上的大尺度情绪影响。

情绪影响

人们在亚马逊网站上阅读书籍和其他产品的评论时,也可以对评论进行评价,可以评价为有帮助或无帮助。人们也可能会受到启发,撰写并提交自己的评论,评论里除了有对产品0至5星的评价之外,还体现了评论者的情绪,从恶语相加到热情洋溢。亚马逊网购客户在情绪上相互影响的程度如何?

为解决这个问题,我和同事David Garcia分析了亚马逊上16 670 件产品的180万条匿名评论。我们用文本情感检测器自动对评论进行打分,10分制,最低-5分(高度负面),满分5分(高度正面),0分不计。我们利用布朗主体框架(Brownian agent framework)得到了集体情绪分布。




左图为框架示意图,里面包含一个得到公认的情绪影响心理模型——环形模型(环形模型)。主体的情绪状态用效价v(valence)定量,效价表示某情绪的愉悦度,取值范围为从-5(高度负面)到满分5(高度正面)。唤醒度a(Arousal)表示情绪引起的活动,比如购买或评价。当 a 超过某阈值时,主体就会表达某种情绪,情绪水平用s表示。主体通过社交媒体和其他方式传播和接受情绪信息h,信息媒介受制于外部情绪影响I,比如主流媒体对产品的报道。

右图为将模型应用于图书《哈利波特与死亡圣器》所得模拟结果。蓝条是评论的真实情感值,红条是对应的模拟结果。研究表明,个人确实会受到其他人影响。

复杂网络

行人、传染病、情绪动力学等的模型似乎与电磁学、热力学以及物理其他分支相距甚远。但是这些模型,与传统物理一样,使我们对真实世界的现象——这里是社会现象——理解更深刻一些。尽管物理学里的概念可能不可以推广至社会学科,但物理学方法可以对社会科学的系统建模做出大有裨益的贡献,尤其在一般方法方面。方法方面的贡献不限于有相互作用的系统,还可延伸至统计模型,前者主要处理基于主体的模型,后者主要是检验数据生成过程中的假设。

这些模型还属于机器学习领域。机器学习现在非常重要,因为现在有巨量数据可资利用。高效处理TB级数据在技术上还很有挑战,另外,数据集如果太复杂,即数据之间关系信息太大,即便数据量不是特别巨大,处理这样的数据,在科学上也很有挑战。结构复杂的数据,比如有在线社交网络、亲戚关系、学术论文引用、专利数据库和其他知识库访问模式等。物理学家发展的的信息提取方法超越计算机科学或社会科学的信息提取方法。物理学家发展的方法属于社会物理学另一个领域——复杂网络。我们下面详细谈谈。

复杂网络是复杂系统的一种表示方法。主体用节点表示,主体之间的相互作用边表示。体系性质包含于相互作用结构,即网络拓扑。基于主体的模型与网络模型各有优缺点。网络节点,即主体,的内部动力学在模型中不明确指明。另外,所有类型的相互作用都分解为主体之间的两两相互作用。如果主体之间有多体相互作用,复杂网络方法适用性就很受限制。

另一方面,利用网络拓扑来模拟复杂系统为社会科学带来了有广泛适用性的和有影响力的见解。一个例子是小世界网络。一个规则点阵,一节点与近邻节点通过远处的节点连起来,就得到小世界网络(译者注:社会人际网络是一种典型的小世界网络。某些你觉得与你隔得很“遥远”的人,其实与你“很近”。和一个偶遇的陌生人聊天时,你发现你们都认识一个共同的朋友,然后,你们就感叹“这世界好小!”。)。小世界网络的特征是低平均路径长度(网络中两点之间最短路径长度(或称距离)的平均值。)和高集聚系数(表征网络中的节点之间结集成团的程度)。社会科学家已经独立于物理学家讨论过类似性质,因此他们可以把社会学理论基础与明确的生成机制联系起来。

另一个利用网络拓扑的例子是谷歌的PageRank算法。PageRank算法根据链接到某网页的网页的数目和重要性来定量确定该网页的重要性。从数学上讲,PageRank算法就是一个本征值问题的解,这样的问题在物理学里俯拾皆是,页面重要指数与特征向量中心度有关。由于本征值问题具有一般性,PageRank算法以网站之间的相互链接而非其内容评估网站的重要性。

如何得到网络?从数据重构出来。默认情况下,网络是时间聚合而后的结果,不考虑时间序列。比如PageRank算法不考虑网页的访问顺序。但是,如果要把时间关联也包括进去,重要性排序将发生非常大的变化,可以给出与内容相关的信息,如图3所示。数学上,关于时间的问题用高阶马尔可夫模型计算得到,这里的阶表示访问路径里某页面向前能追溯到的页面数目。从马尔可夫模型我们还可以确定在什么条件下,在重构网络时,时间关联可以安全地忽略。含时网络最新研究发现显著改善了现有的表征维基百科和其他社会性知识网站访问行为的方法。



图3. 高阶网络模型可以改善网站信息排名方法,这里通过分析维基百科用户查找关于历史的条目的点击流数据做一说明。两图分别展示的是根据PageRank算法得到的排名前30位的维基百科条目。两图用的数据是完全一样的,但网络模型不一样。一阶模型只考虑维基百科条目的图的拓扑结构,排名结果不明确。二阶模型添加了时间信息,时间信息隐藏于用户访问序列,排名结果与用户心目中的印象符合得更好,同时反映出了更精确的语义环境。

社会学家早已使用社会网络分析来表征静态网络中节点的拓扑位置。物理学家的主要贡献是提供了系综方法。与统计热力学中的系综类似,复杂网络中的系综是拓扑构型的集合,这个集合要兼容于体系具体的约束、各构型出现的概率、网络的期望特性。比如利用系综方法,我们可以确认出节点的哪种特性,是性别、共同朋友还是爱好,影响了网络中连接两节点的边的形成。有了这样的结果,我们就可以形成关于因果机制的假设,供社会学家检验。

超越学科界限

社会物理学和计算社会科学是高度交叉的学科,涉及物理学、社会科学、计算机科学、工程学等学科。推动社会物理学和计算社会科学继续取得进展,使这些学科都受益,面临哪些挑战和障碍?

无疑,制度方面要改革。大学教育应该要开设社会物理所需相关知识的课程,颁发社会物理相关学位。现在的网络科学和复杂系统领域的课程体系可以作为起点。社会物理还需要高质量的学术期刊,并且是以课题和问题为中心而不是以方法和学科为中心。相关科研成果可以集中展示在这样的专门期刊上,这样就不会散落于各学科的犄角旮旯,而得不到广泛关注。大学新教职招聘和终身教职评定委员会也应该认识到多学科背景的科学家跨出单一学科藩篱额外付出的努力的价值。

必须鼓励不同背景的人互相尊重彼此对一个学科的贡献。互相尊重的起点可以是,承认当下没有哪个单一学科具备所有工具、方法、理论、知识,真正理解人类社会这样的领域。数据挖掘、自然语言处理、机器学习,和其他人工智能应用,目前还不是物理学的核心方法,但是,物理学家应该欢迎这样的方法,因为他们通过这些方法可以接触到通常碰不到的数据,见识到通常没用过的分析方法。

对社会现象真正感兴趣的物理学家也应该深入了解社会科学所积累的巨量知识。事实上,对社会学家工作的不了解和不理解,正是社会学家对社会物理论文的主要诟病之一。对于社会学家来说,他们应该认识到,将计算科学应用到社会学领域,他们需要与其他学科的研究者进行前所未有的合作。社会学家厌恶典型化事实和普适分布,要克服这种厌恶,一个途径是,社会学家与其他学科的学者共同发展能够解释社会学科的理论的发现的数学模型。

在合作开始之前,合作方对对多学科协作的期望要现实一些。认为不同学科背景的科学家凑在一起就能填补彼此的知识欠缺,然后就能共同创造出很创新的结果,定义科研合作新标杆,这是天真的想法。没有什么合作能随随便便成功,许多合作最终归于失败,因为不同学科之间交流有太高的壁垒,文化有太大差异,哪里发表结果有太多争议。促进多学科合作,应提高对这些不可避免的障碍的认识。

科学家个人还应该对自己的期望现实一些。从方法驱动转向问题驱动,许多社会物理学家最终发现,他们的真正兴趣在于基于物理的方法,而不是社会现象或数据处理。因此,有志于研究社会的物理学家可能需要抛弃以前的思考问题的方式,学习一些必要的社会科学和计算机科学方面的知识。这么做有相当大的风险,可能不会得到社会科学家,物理学家或大学和科研机构的青睐。

然而,那些愿意付出努力的人可以受到越来越多的社会物理学成功应用的激励和指导。他们可以从迷人的发现、复杂的方法和现实世界的问题中汲取灵感。他们可以为正在发展中的计算社会科学奠定基础。

参考文献

略,见原文Sociophysics

标签: 统计物理, 社会物理

添加新评论

captcha
请输入验证码