分类目录归档:cos访谈

基于驾驶行为数据的UBI车险模型

作者:陈星(中央财经大学统计与数学学院,北京)

潘蕊(中央财经大学统计与数学学院,北京)

黄亮(彩虹无线(北京)新技术有限公司,北京)

摘要:本文的研究内容为UBI车险业务。本文通过车辆前装设备采集驾驶行为数据,并与同期车辆出险情况建立Logistic回归模型,通过该模型挖掘对车辆出险情况具有显著影响的驾驶行为变量,并对其影响程度进行分析。根据分析结果,本文对其在行程打分与车险保费定价两部分业务的实施进行了分析,并对其预期效果与可能存在的问题展开了进一步讨论。

关键词:车联网大数据;驾驶行为;Logistic 回归模型;UBI车险

继续阅读基于驾驶行为数据的UBI车险模型

COS访谈第21期~史建军:饱学致用育桃李,锦袍换酒傲江湖

史建军老师是工业工程领域的知名教授和学术带头人,现任佐治亚理工学院(Georgia Institute of Technology,后文简称Georgia Tech)工业工程系(后文简称IE,该系在美国连续28年专业排名第一)冠名教授,同时兼任机械工程系教授。史老师开创了系统信息学和控制(system informatics and control)这一新的博士研究培养方向,是美国工业工程学会(IIE)会士,美国机械工程学会(ASME)会士,运筹学和管理科学学会(INFORMS)会士,国际统计学会(ISI)会士,国际质量研究院(IAQ)院士,也是美国INFORMS的质量统计与可靠性分会的founding Chair,曾获得 the IIE Albert G. Holzman Distinguished Educator Award 等重要奖项。他是多个国际期刊的编委,包括主编管理工程国际顶尖期刊“IIE Transactions”的 Quality and Reliability Engineering 子刊等。史建军教授是使用系统控制和多元统计相结合研究多工位误差建模与分析理论的创始人。他培养的博士生已经有二十几位在国际一流大学任教,其中有7名获得美国自然科学基金委NSF Career奖,1名获得美国总统奖,多名学生在工业公司担任副总或资深管理人员。史老师一直与工业界紧密合作,他的研究小组中开发出的技术已经应用到各种生产系统并带来重大的经济效益,被广泛用在了汽车组装、飞机制造、钢铁冶炼等诸多领域。史老师也是国内多处高校的客座教授,是中科院质量研究中心的创始人之一和海外主任,也是北京大学工业工程系的访问首席教授。jianjun

本访谈既学术又八卦,由黄帅、常象宇、魏太云执行并撰写。出于读者阅读习惯的考虑,我们将一些英文翻译成了中文,并且做了相应的中文写作处理。如果由于我们的失误造成一些误解,还请各位读者多多谅解。

  继续阅读COS访谈第21期~史建军:饱学致用育桃李,锦袍换酒傲江湖

COS访谈第二十期:千秋邈矣独留我,百战归来再读书:谢益辉

【COS编辑部按】 受访者:谢益辉   采访者:冯俊晨   编辑:王小宁

他站在技术与艺术的交界点。
                                                     ——沃尔特·华森《乔布斯传》

“误打误撞”的成功

2002年,谢益辉报考了中国人民大学统计学系。并不是因为他喜欢统计学——那时候他根本不知道统计学是什么——只是因为人大当年在湖北招生统计系有三个名额,比其他系都多,感觉录取概率会大一些。这个日后将跻身华人R开发者名人堂的湖北小伙,就这样从“种地之家”误打误撞地进入统计学的世界。yihui_xie

机缘巧合下,谢益辉在大三时承担了人大统计系网站以及论坛的维护工作。为了管好这个论坛,他学习了网页方面的知识,如JavaScript、HTML、CSS等。这些和数据分析风马牛不相及的技能却成为他未来成功的奠基石。他自己笑称“没想到当年玩玩的东西(R和JavaScript)最后竟成为了吃饭的工具”。然而谢益辉的“玩玩”却不是一般人能做到的。“我理想中的网站外观应该有这样的效果:当读者打开网页之后,十秒之内必须在口头或心里说‘真他爷爷的震撼’,甚至心生买椟还珠之意”[1]。益辉是这么想的,他也是这么做的。他在博客中这样描述2009年感恩节期间第三次重构统计之都的经历:“这活儿就跟拱土的猪一样,要拱就拱到底,早上爬起来就开始拱,一直拱到半夜睡觉”。[2]今天,统计之都除了在R语言界独领风骚之外,在整个统计学界也享有盛名。 继续阅读COS访谈第二十期:千秋邈矣独留我,百战归来再读书:谢益辉

COS访谈第十九期:张志华教授

【COS编辑部按】 受访者:张志华   采访者:常象宇   文字整理:王莉晶 朱雪宁

张志华,博士,上海交通大学计算机科学与工程系教授,上海交通大学数据科学研究中心兼职教授,计算机科学与技术和统计学双学科的博士生指导导师。在加入上海交通大学之前,是浙江大学计算机学院教授和浙江大学统计科学中心兼职教授。主要从事人工智能、机器学习与应用统计学领域的教学与研究。迄今在国际重要学术期刊和重要的计算机学科会议上发表70余篇论文。是美国“数学评论”的特邀评论员,国际机器学习旗舰刊物Journal of Machine Learning Research 的执行编委。其公开课《机器学习导论》和《统计机器学习》受到广泛关注。

张志华教授和他的学生们

张志华教授和他的学生们

2015年9月19日晚,在美丽的古都西安,张志华接受了常象宇博士(西安交通大学管理学院助理教授)的采访,王莉晶、朱雪宁对采访稿进行了一些文字上的整理和修改,全文最终由采访人常象宇和被采访人张志华审核定稿。

下面是访谈的全部内容。

常象宇:请您简单介绍一下您博士期间的研究和促使您出国求学的原因。

张志华:当时在国内读博士的时候,我的研究主要是集中在利用模糊数学,神经网络与遗传算法、并利用它们解决图像处理、计算机视觉等中的问题。当时做这些方法还是发表一些论文,毕业条件也很容易达到的,但是自己隐隐约约总觉得这个领域不太对自己胃口。而且博士读了4年,之前博士论文基本完成。最后一年的空档期,我读到了Biometrika和JRSSB上面Peter Green和S. Richardson的关于RJMCMC(Reversible Jump Markov Chain Monte Carlo)的文章。RJMCMC的思想是把参数估计和模型选择放在一个统一的框架下进行。特别是,他们在JRSSB上的文章给出了求解单变量高斯混合模型的RJMCMC方法。当时用高斯混合模型去做图像分割是比较重要的方法,但通常是用BIC等准则进行模型选择,参数估计和模型选择是两个分离的过程。所以当时计算机视觉界关注到RJMCMC。但是我们遇到的问题不是单变量问题,而是高维问题。Green他们文章特别提到,他们方法推广到高维是Open Problem,并说这是个比较难的问题。当时我的第一感觉,我可以解决这个问题。我们利用SVD分解设计了相应的算法,效果也不错。但是里面的证明我还是没法解决,主要是缺少统计背景。但发现这些东西,我突然觉得特别喜欢,所以当时就决定改行。而在国内无法学到这些东西,也找不到相关书籍,当时上国际网是要付费的,不像现在获取资料如此方便。那段时间,在Mike Jordan教授个人主页上发现了他的统计学习的讲义“概率图模型导论”。那个时候下载1M需要大约5元钱。所以颇花了一番周折才弄到Mike 的讲义。读完之后收益非常大, 也喜欢上了统计学习这个方向。意识到相关背景自己缺得太多,而国内很难找到相关书籍啊。

常象宇:您后来又是如何师从了国际著名的统计机器学习专家Michael Jordan教授的呢? 继续阅读COS访谈第十九期:张志华教授