统计之都十周年感言

呐,统计之都已经创建十周年。作为所谓的创始人,自然也是时候卷起袖子跟大家一起干一大碗鸡汤,毕竟十年这个时间长度听起来好像还蛮厉害的。不巧最近这些天挺忙,加上我其实并不太喜欢专门写文字给乌泱乌泱的客官们看,年龄越大,就越不愿意去安利别人。这篇十周年感言如何写,每天晚上苦苦思考三分钟之后就睡得特别香。想全面概括这十年的发展是不可能的,只能用我最擅长的意识流方式想到哪儿说到哪儿了,这篇文章基本上是纯个人视角,无意借机强行输出价值观。10th

想当初创建统计之都那会儿,朕是天不怕地不怕,心高气傲,不懂就放狗搜了若无其事地回来装懂,在满论坛的点赞声中深藏功与名。有时候在论坛回帖回到半夜一两点,就是那种“扶朕起来朕还能回”的感觉。时间长了,偶尔会有不知情的热心网友称谢教授,嗨别介,我就一逗比本科生而已,然而心里自然窃喜不已,三条腿的蛤蟆好找,二十二岁的教授不常见啊。现在想想人不轻狂枉少年,虚荣心也不是什么坏事,我的 R 语言技能,大致就是在三天两头帮人看函数文档中学出来的。话说那时候 R 帮助文档还是 CHM 格式的,现在的娃估计都不知道咩是 CHM 了。这话题切换到 R 也忒快了。

十年之后我们回头来看看统计之都的成败。现在我的世界观越来越倾向于世界被偶然性主要操纵,听起来有点消极,但我并非悲观主义者。俗话说七分天注定,三分靠打拼,还剩下九十分都靠脸。我最不喜欢听那种把成功归结于努力、把失败归咎于运气的说法了。成功也是很依赖运气的,忍者阿凯伞塞与卡卡西一百回合大比拼中,有一个回合就是比拼石头剪刀布,我觉得人家说的很有道理,“运气也是实力的一部分”。一定程度上,统计之都算是取得了一些成功。创建这个网站时,放眼望去还没几家以统计学为主题的网站,其它的网站创办人多为已工作的人士,不像我在学校,时间充裕,虚荣心爆棚,充电两分钟,回帖三小时,干劲十足。正好 2006 年前后 R 语言也开始萌芽,统计之都的两个主要业务便是 R 语言相关问题和人大考研,前者不用多说了,从我上一级本科生开始,吴喜之老师开始引进 R 到人民大学统计系,这也是为什么现在大家看到的最骨灰级的人民大学出身的 R 元老是刘思喆、李舰等人(我上一级师兄);后者现在没当年那么火了,那时候我看外校考研同学可怜,随便同情了一下,于是开始用我自身的便利条件传送考研真题、答案、上课笔记之类的资料,那场景,客官们自行脑补发微信红包之后谢谢老板的表情符就好了。其实还有考精算的资料,那时候我骑着我的破自行车帮人复印精算考试资料,还收过人千里迢迢两瓶山西老陈醋的贿赂。

俗话说站在风口猪都能飞,统计之都这只猪最初能飞起来,其风源大致有这么几个:一、R 语言萌芽,统计之都里并不是严格的 R 先锋(此前有更早的几位先锋),但第一批有规模的 R 带头力量肯定是诞生在统计之都的;二、跨校考研开始盛行,这一点对统计学本身没什么直接贡献,但带来了很大的网站流量和影响;三、博客开始进入鼎盛时期(如今几乎已经完全衰败);四、人民大学统计学院的支持,从一开始我们就定位在服务整个国内统计圈,而不是作为类似于一个大学社团的组织存在,这一点自由度决定了我们能走多远。

很多人问统计之都这个名字是怎么来的,其实世上很多事情都是没有特别的原因,就像流川枫为什么选择湘北队一样(离家近啊),统计之都只不过是我看了半天可用的网站域名,觉得 COS 三个字母比较短而已,于是注册了 cos.name,然后生搬硬凑倒推出 Capital of Statistics 以及中文名称,就是这样。COS 更普遍的意思是 cosplay(角色扮演),所以偶尔会见到激动的动漫粉丝跑到论坛来说“啊终于找到组织了”,然而并没有。由于 name 域名不太常见,也有很多人问怎么是 cos.name 而不是 cos.org 或 cos.com 之类的,我只能说你们谁够土豪的话帮我们把这些域名重金买回来吧。name 域名虽然听起来怪怪的,也并没有妨碍这只猪飞了这么些年。由此想到今年年初会鸽的公众号有一篇文章《你若是雄狮,何须咆哮》黑我们统计之都说我们网站能把人丑哭,但每年却是动不动三四千人报名参加 R 会议,跟 Google 和 ChinaJoy 可以平起平坐。会鸽小编你有本事放学后不要走,我们好好谈谈友谊的小船的事情。

统计之都一直也没有一个真正专业的网站技术人员,基本上就是我、邱怡轩(人称小轩哥)、颜林林(人称颜大站长)三个人用业余时间瞎捣鼓。主站和论坛几经改版,仍赶不上时代变化,在外貌协会会员眼中可能有点土得掉渣。外貌掉渣归掉渣,文章质量从未掉过渣,群众的眼睛是雪亮的。当年我随便拍脑袋一想得来的统计之都的口号“专业、人本、正直”,以“专业”为首,就是为了奠定这个社区发展的基础。至于什么是专业,不同的人可能有不同的看法,我个人觉得专业不一定意味着高深或满篇的数学公式,我一方面比较喜欢奇特的小视角(脑洞无须大但要精致)、用非常普通和朴实的专业知识去点石成金,就是那种“道理我都懂但我就从没这么想过”的感觉,比如小轩哥的一些文章《统计词话》系列、《奇异值分解和图像压缩》、《有边界区间上的核密度估计》等;另一方面我喜欢附代码的文章,某种程度上这也是统计之都文章的一大特点,别的网站或社区不太常见这种风格,十年前世人大概皆以为代码为下品,唯有公式高,而我们一直鼓励理论和计算实现并进,没代码没真相,有些问题是很多科研工作者经常碰到的,但就是因为听起来太没学术水平了,毫无发表论文的可能性,所以没人愿意花时间写文章分享这样的问题的解决方案,例如如何画中国地图,感兴趣的客官可以看看统计之都主站中小轩哥和姜晓东分别写的这方面的文章,其回复数量之高大概可以在所有文章中数一数二了,可见多少人被这个看似简单而没水准的问题难倒过。小轩哥常用的一个网名叫解名缰,世上有多少人愿意卸下名缰解开利锁?很多网站和网友鼓吹分享精神,其实分享精神应该有一个基本的判断准则,就是你分享的是你自己的东西还是别人的东西。简单点两下鼠标的复制粘贴不叫分享精神。统计之都的分享,绝大多数都是我们的作者不求名利的原创,少数为我们所欣赏文章的授权转载,我们可以底气十足地说,这十年我们没有随手复制粘贴过一篇文章,所有文章的背后,都对应一些人的努力。这大概也算一种专业精神吧。

“人本”也是我个人看重的一个价值观,这些年来一直在加强。虽然统计之都看上去是一个大集体,但我并不希望它成为一个抽象的集体,而是希望在这个集体里,大家能偶遇几个欣赏的人,思考几个具体的问题,做几件有意义的事,酱足矣。与其将统计之都打造成一股洪流,不如让它散成一股股涓涓细流。记得姜大卫扮演黄药师的超级古董香港 TVB 剧《九阴真经》中有一幕,酒店老板斥责自己的傻儿子多管闲事藏匿冯蘅被打时,黄药师说“他很勇敢,很多所谓名门正派都没他勇敢”。黄药师性格怪异一直不愿多说话,我觉得这句话体现了他的人本主义,也是我认同的“人本”。青史几行名姓,北邙无数荒丘。人本的对立面就是人被抽象为两类:英雄(或偶像)以及无名众生。我认为这种抽象弊大于利,它能带来效率,但也容易导致悲剧(前年看完《静静的顿河》极大加强了我这种看法)。当然这只是我的个人选择,不一定合理,也不代表统计之都任何其他人。比起摇旗呐喊“统计必胜 R 无敌”(早年间喊太多了),现在的我更愿意一声不吭看看统计之都的文章和帖子,有空的时候就琢磨一下问题给个答案,这更符合我理想中的人本理念。突然又想到统计之都前总编辑高涛(人称涛妹,其实是蓝僧啦)很久以前在微信票圈分享的钱穆的《谈诗》一文,里面钱老先生引用了黛玉评陆游(艾玛人物链条老长)的两句诗,“重帘不卷留香久,古砚微凹聚墨多”;老先生接着黛玉的话讲:诗很工整,但诗背后却看不出有个人,确切地说是只有一个抽象意义上(附庸风雅)的人,这样不好。这一点我深切认同,诗词写得漂亮容易,写得具体却是很难。其实在我看来,这同样也是一种人本理念。八过呢,胡江堂有一天在票圈讲不喜欢钱穆的《中国文化与人文修养》,“中国传统文化分分钟教你做人,但并不能启发你做一个现代意义的好丈夫/好妻子”,我同样深切认同,但显然这跟前面谈诗体现的观点产生了一种矛盾,传统文化有很多反人本的东西,从来都是如何成为圣贤,而不会有人教你如何炒好一盘酸辣土豆丝,似乎圣贤不必吃饭;从这个角度来看,统计之都圈里的任万凤(请不要叫凤姐)和张晔(人称少东家)就是我比较欣赏的人,看的出是真心喜欢捣鼓锅碗瓢盆油盐酱醋那些事儿。顺便提起一句,涛妹是我私下认为“我的票圈分享文章最有质量的人”(他分享的一篇文章改变了我近一年的阅读轨迹甚至心迹),江堂是“我的票圈评论文章看似最叛逆却最理性的人”。

专业和人本听起来还不那么肉麻,正直这个词就有点那啥了。我说了这三个词是我少不经事时拍脑袋想出来的,那时候统计假数据还是大家比较关心的话题,加上我个人非常排斥那种只有方法和结论而不提供数据和分析过程的论文,所以我加了正直这个词。我相信这个状况会慢慢变好,可重复性科学研究最终会变成被大家广泛接受的范式,虽然这条路还会很长(对中国统计界可能会更长)。另一方面的正直我前面也已经提过了,就是尊重版权,要么原创,要么认真征求原作者许可,不发一篇不过脑子的复制粘贴文章。我相信很多人复制粘贴并非出于恶意,但不管善意恶意,这总归是不对的。rcon

解释完 COS 口号,相信那些动漫粉丝可以一头雾水外加一脸黑线地离场了。统计之都现今的成就,多半还是要归功于这些年接力的小伙伴们都很给力,只不过世人多看重“第一”(诸如奥运亚军、世界第三高峰等容易被人忽略),所以我的贡献在无意中被放大了。其实我只是做了一个偶然的插柳人而已,自我2009年出国留学之后,魏太云(早年间人称太子,后称云伯伯)开始打理 COS 大小事务,逐渐成为二代目,秉承COS“专业、人本、正直”价值观的同时,广交各路英雄豪杰(诸如大家景仰的郁彬老师、锦袍换酒的史建军老师、萌萌哒熊大王汉生老师、勤奋又爱护学生的张志华老师、业界的靳志辉、林峰、英姿飒爽的师弟师妹们等等),极大拓展了 COS 的亲密战友圈,COS 不再仅仅是一个线上社区,其线下力量也日益变强,各种线下活动如火如荼,如我们的招牌中国 R 语言会议以及每个月的统计之都沙龙(北京)。R 会议我也是有幸做了插柳人(我不太同意挖井人这个说法,挖坑人还差不多),我组织了第一届 R 会议就甩锅出国了,从第二届 R 会议开始,其种子就传到了上海,然后逐渐扩展到南昌、西安、武汉、广州、杭州等各个城市。要不是有云伯伯、小轩哥、李舰等人这些年一直张罗,以及历届 R 会议主席完美接力(如潘岚锋、江麒、高涛、熊熹、冷静、陈昱、朱雪宁、张心雨等),这个会议的火种恐怕早已熄灭。有些人虽然多年不联系,但其实也从未离开,例如常象宇(人称叫兽、政委)当年千里迢迢到北京参加了第一届 R 语言会议,彼时忙着调试会场设备的我对此已经毫无印象,几年后云伯伯跟我提起这事,我完全不记得了,然而回归之后的政委立马坐镇西安,点燃了 R 会议西安会场火炬,也成为了统计之都核心力量之一。再比如焦静,当年在 COS 论坛比较活跃,发过一篇关于出国留学的经历帖子,大家都表示受益匪浅,出国之后沉默了几年,最近又被我挖出来参加统计之都海外线上沙龙。这样的名字我可以列举很多,我知道有些人一旦进了这个轨道,也许公转周期会长一点,但需要他们转回来的时候,他们自然还会回来;当然,也有人会离开去其它异次元,我们也从不会强留。

在云伯伯忙活的几年中,随着规模变大,统计之都经历过几次身份和管理上的挣扎,每隔一段时间,就会有个念头在大家心里浮现,那就是我们仍然是个从学生发展而来的游击队,我们隐约希望能以一个正规的组织形式办事,于是三代目登台。我捡了个云伯伯,云伯伯发掘了冯凌秉(人称秉帅)。秉帅低调上任,大伙儿借熊熹(人称师姐)之气场,于2016年情人节注册成立了北京统计之都数据科技有限公司,从此咱也是有组织的人啦。成立公司并非意味着统计之都从此走上商业化道路,我们依然会延续以往的传统,不忘初心,以一个正式的组织更好为统计人服务。

统计之都的核心力量一直都是学生,而且我们向来敢将大任托付给本科生,比如冷静(人称冷妹)大二时就担任了几千人的 R 会议的主席和主持人,同样,今年这个重任落在大三本科生张心雨(人称好奇宝宝)肩上。这大概也是统计之都十年尚未滋生暮气的重要原因。比起经验和阅历,热情和恒心似乎更重要。尽管我们这些最初的挖坑人与现在的新生力量年龄差距越来越大,但年复一年我们都能看到相似的火的意志。我觉得火影忍者中的核心问题就是宇智波佐助问秽土转生出来的几代火影的“村子是什么,忍者是什么”,火影通过重放了二十多遍宇智波斑在河边打水漂偶遇千手柱间来回答了这个问题,但我觉得答案不免有些狭隘;忍者是为了保护村子而存在,但如果大家能放弃村子的概念,大概也不会引起那么多纷争。同样我们可以问,统计之都是什么?这问题一样不好回答,我也不能代表其他人,我只能给出我自己的诠释。我觉得统计只是统计之都的外表,诗酒年华也只是介质,这个组织能存在这么久,一定有更深层次的潜变量作用。这个潜变量我想了几天,只能生造一个词来描述它:善能。我认为人性的善与恶都有很大的能量,若无外界干涉,恶的能量应该更大一些,但只要适当引导,善也可以被调制为大玉螺旋丸,爆发出惊人的能量。这种能量,在小轩哥考虑师弟师妹前途时悄悄爆发过,在众元老及万凤千金散尽助力统计之都开辟新世代时悄悄爆发过,在郭鹏(人称郭巨侠)一头扎进 COS 新网站设计时悄悄爆发过,在无数的 R 会议志愿者同学们身上都悄悄流过。这些查克拉,是统计之都源源不断的能量。这样的能量,你若看不到也无所谓;下面我的结束语,你若看不懂,同样无所谓。

十载去,一剑初试锋。筚路蓝缕计相统,诗酒年华意自承。夜雨任几更。
三代起,九会再迎朋。梅花南山月忆影,白鸟秋水虫鸣灯。惊雷却无声。

关于谢益辉

RStudio码了个工,Iowa State University统计系博了个士。统计之都网站创办者;研究兴趣为统计图形及数据可视化,对统计模型方法的发展感兴趣但不喜欢纯粹抽象的数学理论,以直观、实用为学习标准;偏好以R语言为工具;Email:[email protected];个人主页:http://yihui.name

统计之都十周年感言》有28个想法

  1. 看这篇到现在还没有回复就知道博客(或者博客的载体形式)真的衰落了….
    感觉yihui这是攒大招啊,写了这么多!读着读着好多画面还如当年那般生动,太赞了。

    1. 都是太君催催催,写了两个星期才写完。像园主和江堂这样现在还偶尔写两篇博客的已经是珍稀动物了。统计之都主站我也几年没写过文章了。

      1. Error in parse_all(input, filename, stop_on_error != 2L) :
        unused arguments (filename, stop_on_error != 2)
        Calls: … call_block -> block_exec -> in_dir -> evaluate -> parse_all
        Execution halted

        最近用rmarkdown写东西一直报错,我很无奈,程序没有问题,但是一直如此

  2. 处处提到的火影代表着虽然我们插着好几岁,但爱好如此相同。哈哈。统计之都的东西我还没多看,但论坛的形式其实一直是我这个90后喜欢的一种方式。

  3. 非常感谢!这十年在这里学会了很多东西,当初完成硕士论文的R语言学习,很多都来自这里,遇到的很多问题,站长都给予了细心的解答。非常感谢!祝越来越好!

  4. 赞个,谢神的文章啊!
    首先,感谢谢神创办了“统计之都”,这是我们统计爱好者的乐园;
    还得感谢谢神分享的关于Copula系列神文,本人十分爱好Copula.不过英文是小学水平,要是谢神再翻译本copula文集就好了。就像寇强大神翻译了《Rcpp》帮助了像我这样英语学渣。

  5. cos.name 和.org都是pivot的,他会不会收购你这个 name。。。。。

  6. 今天看你推着宝宝从身边走过,走过了才认出来,忘记和你说声谢谢。谢谢写的R包,谢谢你的分享。统计之都这次活动超赞,干货不少。

  7. 益辉带着两个宝贝重返人大,一个10岁,一个1岁,期待下一个十年!

  8. 去年被一学长推荐来的,在论坛上问问题也得到认真专业的解答了,很是感动!
    以后也会一直关注COS,祝越办越好!

  9. 亲爱的的统计之都,《ggplot2:图形艺术和数据分析》就是你们大家集体翻译的,你们翻译的其它R书,我也都有大概翻过,我很想说,因为你们的不计愁苦地付出,你们都是我非常尊敬和钦佩的人~
    可惜在北京的读书的时候还未接触过R语言,要不然我肯定也跑去当志愿者了

    祝贺 统计之都 十年磨一剑,一招试锋芒~

  10. 关注统计之都也有三年了,很喜欢这里的学习氛围和发布的文章,真心很赞,希望你们继续下去。爱你们

  11. 看到站长大大的话好感动 各位前辈们开疆扩土和无私奉献使COS走到现在 作为新人更要努力才是

  12. 没关系啊,博客这种形式虽然不热了,但是仍然有存在的价值,你看,2017年了,还有人在统计之都获得极大的收获,这就足够了。

发表评论

电子邮件地址不会被公开。 必填项已用*标注