标签归档:统计之都

[译]量化投资教程:投资组合优化与R实践(上)

译者简介:   Harry Zhu, R语言爱好者, FinanceR 专栏作者

概述

最近,在研究投资组合优化的问题,主要针对的是股票持仓的组合优化,会在这个分析过程中发现一些有意思的现象,并一步一步优化、检验相应的风控模型。本文将有四个部分分别阐述具体步骤。

请注意,本文并非投资建议。本文数据是基于之前观察到的收益来模拟得来,和历史上的数据并非完全一致。本文提到的技术对了解如何更好地配置投资组合有帮助,但其不应该用作唯一的投资决策,如果需要寻找投资建议,应该转向合格的专业机构进行咨询。

继续阅读[译]量化投资教程:投资组合优化与R实践(上)

第九届中国R语言会议(杭州)

中国R语言会议是由统计之都发起,并同国内高校共同举办的R语言与数据科学会议。本次中国R语言会议(杭州)将由统计之都与浙江财经大学联合主办,浙江财经大学数据科学学院承办。中国R语言会议再次走进中国电子商务之都、长江三角洲中心城市、享有“人间天堂”美誉的魅力之都——杭州,愿与更多的数据爱好者与研究者探讨数据科学,共同进步提高!中国R语言会议,欢迎各位的到来!

自2008年在中国人民大学举办第一届中国R语言会议起,到2016年中国R语言会议已经成功地走过了第九年,先后在全国七个城市举办,影响日渐扩大,前后报名参与人数已过万人。会议内容覆盖数据科学及R语言在各行各业的应用,包括天文、地理、医疗、生物、金融、能源、互联网等领域。十年磨一剑,破鞘天下惊。在R语言会议发展壮大的同时,统计之都也已走过十年风雨。十年间,统计之都服务着广大统计学爱好者,推动着R语言在中国的传播和发展,见证着数据科学时代的逐渐崛起。迄今为止,统计之都已先后出版八本R语言相关图书,举行五十余期海内外沙龙;未来,我们将再接再厉,继续为国内统计学和数据科学的发展贡献自己的力量。2

继续阅读第九届中国R语言会议(杭州)

互联网金融中的数据科学

作者:张云松

毕业于中科院,多年咨询公司和互联网公司从事数据算法、决策分析、风险管理和产品设计的工作,目前是融360风控总监,负责纯线上小额微贷信用贷款产品。

屏幕快照 2016-07-30 上午9.40.22

最近几年,这波在资本撬动的互联网金融的浪潮极大地提升了数据科学的行业应用价值,数据分析师不再是苦逼的跑数的,摇身一变成了风控模型专家、数据科学家。尤其是大数据风控、大数据征信领域一片火热的场景,数据挖掘、机器学习相关专业同学的数量也翻番上涨,越来越多的计算机和统计领域的同学加入互联网金融行业。

屏幕快照 2016-07-30 下午5.54.50

面试中发现很多同学的梦想工作都是我要做机器学习相关工作、我要做算法、我要做模型……但其实以一个互联网金融从业者角度看,我们大量的时间还是在做数据理解、数据处理、重复验证特征、不停的在做实验,我对模型师的定义基本就是半个蓝领,只不过很多学术和一些五花八门的算法和方法可以真正有机会应用到商业领域并且产生价值。

本文分享一些互联网金融从业者日常工作中实际用到的与数据科学相关的内容,由于日常工作中涉及到的数据和策略非常敏感,本文中不会透露具体产品策略,只会对一些思考和方法进行介绍;同时,由于如今互联网金融产品的形态非常多,下文主要介绍目前很热的在线授信贷款产品中数据科学的应用。 继续阅读互联网金融中的数据科学

第九届中国R语言会议(北京)纪要

第九届中国R语言会议(北京会场)、第七届中国人民大学国际统计论坛与2016百分点数据与价值国际论坛共同组成的大统计与数据科学联合会议于2016年5月27日至29日在中国人民大学成果举办。5月27日主会场位于世纪馆,5月28、29日各个分会场分别位于逸夫报告厅、国学馆报告厅及第一教学楼。

DSC04026

一、会议概况

今年是中国R语言会议举办的第九年。本次会议由统计之都与中国人民大学、北京大学、伦敦政治经济学院、百分点集团联合主办,并得到了考拉征信和量邦科技等战略合作伙伴的鼎力支持协办,以及微软、Tableau、懒投资、RStudio、记健康和纽约数据科学学院等友情合作伙伴的大力支持。在三天的会议时间里,数据科学各行各业的同仁们欢聚一堂,共襄盛举,畅所欲言。在大会会务组的不懈努力下,本次会议比往届有了更大的突破。会议共设有22个分会场,126场主题报告,覆盖大数据技术、互联网金融、量化投资、人网物联、生物信息等诸多当下热门话题。报名非常火爆,人数突破5000人,报名单位超过1500个。不仅创下历届之最,也使本次会议成为亚洲地区规模最大的数据科学盛会之一。

二、会议内容

本次会议分为第一天的主会场和其后两天的22个分会场。主会场演讲嘉宾包括学界杰出代表、业界大咖等。分会场包括互联网征信专场(考拉征信专场)、可视分析专场(Tableau冠名)、量化金融专场(量邦科技冠名)、软件工具专场(微软冠名)、经济金融专场(懒投资冠名)、汽车联网专场、自然语言专场、概率统计专场、医疗健康专场、智能制造专场、计算平台专场、生物医疗专场、商务分析专场、生物统计专场、生物信息专场、机器学习专场、智慧城市专场、计算广告专场、社交网络专场、时空数据专场,涵盖了数据科学的各个领域,讨论了数据科学在诸多领域的最新进展。 继续阅读第九届中国R语言会议(北京)纪要

统计之都十周年感言

呐,统计之都已经创建十周年。作为所谓的创始人,自然也是时候卷起袖子跟大家一起干一大碗鸡汤,毕竟十年这个时间长度听起来好像还蛮厉害的。不巧最近这些天挺忙,加上我其实并不太喜欢专门写文字给乌泱乌泱的客官们看,年龄越大,就越不愿意去安利别人。这篇十周年感言如何写,每天晚上苦苦思考三分钟之后就睡得特别香。想全面概括这十年的发展是不可能的,只能用我最擅长的意识流方式想到哪儿说到哪儿了,这篇文章基本上是纯个人视角,无意借机强行输出价值观。10th

想当初创建统计之都那会儿,朕是天不怕地不怕,心高气傲,不懂就放狗搜了若无其事地回来装懂,在满论坛的点赞声中深藏功与名。有时候在论坛回帖回到半夜一两点,就是那种“扶朕起来朕还能回”的感觉。时间长了,偶尔会有不知情的热心网友称谢教授,嗨别介,我就一逗比本科生而已,然而心里自然窃喜不已,三条腿的蛤蟆好找,二十二岁的教授不常见啊。现在想想人不轻狂枉少年,虚荣心也不是什么坏事,我的 R 语言技能,大致就是在三天两头帮人看函数文档中学出来的。话说那时候 R 帮助文档还是 CHM 格式的,现在的娃估计都不知道咩是 CHM 了。这话题切换到 R 也忒快了。 继续阅读统计之都十周年感言