标签归档:贝叶斯

第二届中国贝叶斯统计学术论坛(天津,2014)日程安排

bayes-forum

第二届中国贝叶斯统计学术论坛(天津,2014)将于2014年12月21日(周日)在天津财经大学召开,本次会议由天津财经大学中国经济统计研究中心、贝叶斯之道研究室主办,统计之都协办,会议通知如下:

一、论坛时间

2014年12月21日(周日,9:00-16:00)。

二、论坛地点

天津财经大学B座205教室(统计湖畔)

tjcd

三、论坛内容

1763年12月23日,理查德·普莱斯在伦敦皇家学会会议上宣读了托马斯·贝叶斯的遗世之作——《An essay towards solving a problem in the doctrine of chances》(机遇理论中一个问题的解),从此贝叶斯定理诞生于世。“虽然这个产生于18世纪的统计学学派在19世纪上半叶备受争议和冷落,但在20世纪,它却占据了数理统计学这块领地的半壁江山,撑起了统计学的半边天(陈希孺,2002)。

2013年12月21日,“纪念贝叶斯定理250周年”暨首届中国贝叶斯统计学术论坛(天津,2013)在天津财经大学月牙报告厅成功举行(相关特邀报告及培训资料下载)。

继续阅读第二届中国贝叶斯统计学术论坛(天津,2014)日程安排

失联搜救中的统计数据分析

大数据时代如何活用数据可视化、大数据与众包、群体智慧、贝叶斯方法等为失联搜救出谋献策?请看下文。

作者:统计之都创作小组(code99)

引子

“MH370”作为航班代码,是近日震惊世界的马来西亚航空公司客机失去联络事件(后简称“马航事件”)留给公众最深刻的数字印象。时至今日,有关马航事件的调查和搜救工作仍在继续。遗憾的是直到截稿时间,MH370航班的残骸仍未找到。

在历史上的多次飞机船只等交通工具出现失联情况的突发事件中,数据的收集、分析以及信息的及时发布都在搜寻中起到过关键的作用。比如在2009年,法国航空公司曾有一架民航客机失去联络和踪迹。当时,有不少基于数据分析的文献为失事飞机的搜寻提供了援助。前事不忘,后事之师。本文旨在基于统计学领域的相关知识结合大众可以获知的信息来对马航事件进行了解和分析。本文秉持科普视角,试图阐述在应对马航事件过程中数据收集和数据分析所起到的作用,继而为寻找失联飞机提供一些思路。我们将以寻找失事飞机和船只的事件为线索,来梳理其中涉及到的数据分析思路,以试图减少大家的猜疑和困惑。 继续阅读失联搜救中的统计数据分析

纪念贝叶斯定理250周年 暨首届中国贝叶斯统计学术论坛 (天津,2013)会议纪要

纪念贝叶斯定理250周年暨首届中国贝叶斯统计学术论坛(天津)于2013年12月21日在天津财经大学月牙报告厅成功召开。本次会议由天津财经大学中国经济统计研究中心、研究生院、贝叶斯之道研究室和统计系学生会共同主办,统计之都协办。在一天的会议时间里,参会者齐聚一堂,上午就贝叶斯方法在政治学、社会学习模型、金融学、经济计量等诸多方面的应用进行了深入的探讨,下午进行了贝叶斯入门培训,晚上还举行了精彩的文艺晚会,庆祝贝叶斯定理250周年。

会议概况

本次会议报名比较活跃。参会者主要来自各大高校、科研机构、事业和企业单位,全体参会者所在单位汇总如下。

北京大学、北京工业大学、北京工商大学、北京语言大学、广东财经大学、南开大学、南开大学(滨海学院)、山东大学、天津财经大学、天津商业大学、天津工业大学、天津农业大学、天津理工大学、天津师范大学、天津中医药大学、香港科技大学、中国人民大学、中央财经大学、中国矿业大学、安诺优达基因科技有限公司、eBay、人行天津分行、天津渤海商品交易所、首钢总公司、中航集团、北京数博思达信息科技有限公司、江苏先锋信息科技公司。
继续阅读纪念贝叶斯定理250周年 暨首届中国贝叶斯统计学术论坛 (天津,2013)会议纪要

纪念贝叶斯定理250周年 暨首届中国贝叶斯统计学术论坛(天津)

纪念贝叶斯定理250周年暨首届中国贝叶斯统计学术论坛(天津,2013)将于2013年12月21日(周六)在天津财经大学召开,本次会议由天津财经大学中国经济统计研究中心、统计系和贝叶斯之道研究室共同主办,统计之都协办,会议通知如下:

一、论坛时间

2013年12月21日(周六,9:00-21:00)。

二、论坛地点

天津财经大学月牙报告厅(统计湖畔)

tianjinUniv0map

 

三、论坛日程安排

cloud-bayes

继续阅读纪念贝叶斯定理250周年 暨首届中国贝叶斯统计学术论坛(天津)

LDA-math-LDA 文本建模

5. LDA 文本建模

5.1 游戏规则

对于上述的 PLSA 模型,贝叶斯学派显然是有意见的,doc-topic 骰子$\overrightarrow{\theta}_m$和 topic-word 骰子$\overrightarrow{\varphi}_k$都是模型中的参数,参数都是随机变量,怎么能没有先验分布呢?于是,类似于对 Unigram Model 的贝叶斯改造, 我们也可以如下在两个骰子参数前加上先验分布从而把 PLSA 对应的游戏过程改造为一个贝叶斯的游戏过程。由于 $\overrightarrow{\varphi}_k$和$\overrightarrow{\theta}_m$都对应到多项分布,所以先验分布的一个好的选择就是Drichlet 分布,于是我们就得到了 LDA(Latent Dirichlet Allocation)模型。

lda-diceLDA模型

在 LDA 模型中, 上帝是按照如下的规则玩文档生成的游戏的

game-lda-1

继续阅读LDA-math-LDA 文本建模