页面

2009年6月14日星期日

把学术八卦进行到底

前些天为了应付系里论文轮讲的发表,翻箱倒柜找了不少论文。因为轮讲的限制比较多,最主要的就是要简单易懂,毕竟跟绝大多数听众都有语言障碍,而且虽然都是系里的人,但是我们这个系的情况,不同方向的差别可以很大——当年在T大的时候大家就普遍反映听不懂别人的毕设在搞什么。找了一阵,最后找到了一位伊朗兄弟发在MS上的东西。
要我说的话我也没觉得这文章多好,可是人家就有本事发到MS上。光看题目不知所云,通读以后觉得这题目估计是有点迎合潮流的意味——明明讲的是一般的工作弹性,却拉上了电话中心的概念;明明只是算平均最短路径而已,却又扯到了时髦的小世界网络上去。不过无论如何,这篇玩意算是帮我解决一大难题,台下一众岛国人一副都听懂了的样子。
说起这个“小世界网络”(Small-world networks),其实在原文里我愣是没看懂他玩的是什么概念,于是在参考文献里一看,惊了!——我还是第一次看见我们这个扯淡专业引用science和nature,敢情你是怎么扯到那边去的?
于是翻了翻几篇参考文献,总算是有点概念了。这所谓的小世界网络其实并不高深,显然是因为这个名字不够帅不够炫,所以平时牛人们说到它的时候通常都有一个比较装13的名称——六度空间理论。
其实这个理论早在1967年就提出来了,只不过最近SNS的兴起,使得它又变成了一个研究的热点。小世界网络的特征有两个,一是节点高度集簇,二是任意两个节点之间的距离很短,而这两个特征初看上去应该是互相矛盾的。所谓的高度集簇是说路人甲认识路人乙,路人甲又认识路人丙,那么乙和丙之间就很可能是认识的;而所谓距离很短就是经常拿来说的六度空间,即是你的朋友的朋友的朋友的朋友的朋友的朋友的朋友可以是世界上的任何一个人。并不是任何网络都能拥有这两个特性,而社交网络则是最典型的小世界网络。由于六度空间这个结论很炫很浅显易懂而广为人知,但很少有人提及,社交网络之所以能把这两个矛盾的特征结合在一起,有一个很重要的原因:大约有60%的路径都通过了某四个人——啊世上就是会有这种广识天下豪杰的人啊……
看见有人做个社交网络的调查,统计几个数据就发论文了,我灵机一动,把论文的共同作者视为相识,做个学术八卦网络调查,是不是也可以发论文呢?可是现实总是残酷的,现在的科学就是讨厌到你有什么点子都很容易发现有人在好多年前做过了。
我找到一篇本世纪初的论文,统计了生医,理论物理和计算机等方面的几个论文数据库,做了一篇学术八卦的论文。有几个我觉得比较有趣的数字如下:
五年内平均每人灌水的数量接近每年一篇,例外的是高能物理,达到11.6篇;
每篇文章的作者数目接近3,例外的还是高能物理,达到8.96,这也某程度解释了上面那个数字;
最大的相连社交网络占总人数的比例,大部份学科都在八成以上,甚至九成,宅在这个圈子外的人数只有一两成;这次,例外的是计算机,最大的圈子只占57.2%——果然搞计算机的宅男多啊;
平均距离(当然前提是这两人的确相连)很接近6,高能和计算机再次成为例外,高能特别少而计算机特别多,与上面的数据也算吻合。六度空间果然强大。
结论:学术八卦一途被人抢了,要发paper还是任重道远啊。

没有评论: