10月30日下午,中国人民大学调查与数据中心主任,原常务副校长,博士生导师袁卫教授应邀在阜成路校区做了题为“统计学简史与数据科学”的学术讲座。讲座由4556银河国际在线院长刘艳楠教授主持,4556银河国际在线教师,研究生和高年级本科生参加。
袁卫教授1988年在中国人民大学获得经济学博士学位,是我国首批经济统计学博士,先后获得全国优秀教师、首都五一劳动奖章。袁卫教授的主要研究领域为应用数理统计、风险管理、精算学与保险学,长期致力于中国新的统计学科体系和学科建设。他提倡“大统计”的学术思想,把社会经济统计、数理统计以及包括医疗卫生统计在内的多种统计结合在一起,相互促进,来建设整个统计学科和科研工作。主持完成了25项国家级和省部级科研项目,在国内外学术刊物上发表论文60余篇,出版著作、教材、译著20余部。
袁卫教授报告分为统计学简史和数据科学两部分,第一部分根据统计事件时间轴介绍统计学的发展,涵盖72项大事,分为三个阶段,分别是:早期源头阶段(公元前450年至15世纪);数学基础阶段(16世纪至19世纪末);现代发展阶段(20世纪处至今)。首先,袁卫教授介绍了早期源头时期发生的12项事件,围绕简单描述统计(4项),其中包括均值的使用,众数的使用等,普查(3项)、官方统计(2项)、抽样调查(2项)的数据搜集、数据描述,袁卫教授认为该阶段虽然已经有抽样思想,但只是简单的点估计,数据的特征以离散型数据为主。其次是数据基础阶段,伴随着文艺复兴和科学革命,概率论、数学等领域都有了长足的进展。袁卫教授介绍了30项大事记,涉及统计的概率与数学基础(10项),包含计算骰子点数出现的概率形成的初步概率等内容,描述统计分析(6项)、国家与社会管理(5项),包含8世纪中期国家彩票业的出现等内容,人口与卫生统计(4项)、统计词汇与组织(5项),表现着统计学在多领域的实践。在30项大事中英国占据15项,其次是法国、德国等国家,表明英国在此阶段作出重要贡献,数据类型扩展到连续性数据,事物精确性被人们所追求,因果关系研究受到重视。最后在现代发展阶段:在30项大事中,涉及统计应用(11项)、数据计算与大数据(10项)、统计理论与推断(8项)、统计杂志(1项)。袁卫教授将该阶段的特点总结为,此阶段统计应用越发广泛,统计数据更加立体,表现为更为具体的统计;统计理论与推断基本发生在20世纪前半叶,伴随着计算机技术、互联网等现代科学技术的飞速发展(摩尔定律),数据类型发生根本变化,机器学习等成为代表的数据科学。
在数据科学部分,袁卫教授认为科学是由数据推动的,数据推动金融科学的发展,有了公司数据,推动公司金融的发展;有了互联网数据,推动互联网金融的发展,数据形式和获得与分析数据的工具和方法是统计学科发展的一条主线;在互联网与大数据时代,传统的数据获得与分析都面临改变,所以适应这一时代的数据科学是所必然。传统统计学是搜集、整理、分析数据,并且探索数据规律性的科学而数据科学是利用计算机的运用能力自动地对数据进行处理,从数据中提取信息,进而形成知识,与传统统计相比不追求模型形式,用通俗方法解决问题。袁卫教授认为统计学是一门相对年轻、充满活力的学科,现在的统计学对计算机更加依赖,未来的统计学在学科领域扩展方面更注重学习多方面的学科,与各个学科的融合。
在互动环节,曹显兵教授等师生与袁卫教授就大数据时代与统计的关系、当下对统计热点问题的学习两方面的问题进行了探讨,袁卫教授建议同学们在日常学习中不要过多追求前沿问题,而对有趣、有需要的问题进行研究。近两个小时的讲座,袁卫教授思路清晰,既通过具体事例阐述了统计学的历史发展,又结合当前的大数据环境说明了统计学科新的拓展方向,极大拓展了同学们的视野,令人耳目一新。