推荐语:同行评议是学术论文发表过程中很重要的一环,当前科研用软件的发表通常依附于学术论文但却缺少对软件本身的同行评议过程,rOpenSci 目前公开了他们关于统计软件进行同行评议过程的白皮书,详细讨论了这个过程的细节与评判标准且欢迎大家提意见改进。

推荐人:于淼

链接:https://ropenscilabs.github.io/statistical-software-peer-review/


推荐语:OCR软件或API可以帮助从图片中读文字,这个基于 html5 的网站可以辅助从图片中提取原始数据。

推荐人:于淼

链接:https://apps.automeris.io/wpd/


推荐语:Gelman 在自己博客上讨论那些是写的最好的科技论文,从他的推荐与评论推荐中可以发现很多有意思的文章,而且很多是讨论复杂系统的,虽然不都跟统计相关,但大都由浅入深解释了一个问题或现象。

推荐人:于淼

链接:https://statmodeling.stat.columbia.edu/2020/06/09/what-are-the-best-scientific-papers-ever-written/


推荐语:写好一个R包之后要做的第一件事是什么?当然是到统计之都论坛分享自己的作品。

推荐人:肖楠

链接:stackgbm, ecce, flightplot, forestry, faq, flashCard, oneclust


推荐语:这是 Gelman 新书《Regression and Other Stories》的附带案例与代码,这本书侧重实战,所以如果你的日常工作研究需要用到回归分析,可以从这里寻找回归模型检验与可视化的思路。

推荐人:于淼

链接:https://avehtari.github.io/ROS-Examples/


推荐语:type M 错误指的是对检验效应数量级估计的偏差,这篇文章通过赢家诅咒现象详细探索了这类错误的来源并提出了效应矫正公式。

推荐人:于淼

链接:http://www.erikdrysdale.com/winners_curse/


推荐语:rstudio::conf(2020) 上启动了 Shiny Contest 2020,这是所有作品列表,不少是关于新冠的。

推荐人:于淼

链接:https://rpubs.com/minebocek/shiny-contest-2020-submissions


推荐语:这是一篇不涉及编程语言的实时交易机器人构建指南,其实只要传感器的API给力,实时监控网可以构建在任何应用领域,只是当前其他应用不赚钱罢了。

推荐人:于淼

链接:https://medium.com/@yakko.majuri/a-step-by-step-guide-to-building-a-trading-bot-in-any-programming-language-d202ffe91569


推荐语:权重在统计量设计与软件开发中具有特殊的用途与用法,这篇文章详细论述了三种权重类型及其对方差估计的影响。

推荐人:于淼

链接:https://notstatschat.rbind.io/2020/08/04/weights-in-statistics/


推荐语:零样本学习(zero-shot learning)指的是构建一种能做超出训练样本以外任务的模型,打比方你用数据A构建了一个分类模型,但要求其可以对数据A里不存在的分类也能进行识别。工程实践上可理解为拿别人的模型跑自己的数据,例如在自然语言学习上获取训练集数据并不容易,直接调其他训练好的模型就一个选项,不过这需要模型提供对零样本学习的支持。这篇文章就讲解了如何调用 Hugging Face 的模型来进行微博的无监督情感分析。

推荐人:于淼

链接:https://towardsdatascience.com/zero-shot-text-classification-with-hugging-face-7f533ba83cd6


注:统计月报每月月初发表,月底前三天截稿转入编辑阶段,当月投稿不满十篇则合并入下月(或下下月直到够数)发表。

发表/查看评论