陈松蹊:万物皆可统计

来源:人民政协报 王亦凡

1720422882_91506.jpg

陈松蹊与学生们交流统计学所携带的交叉学科研究经历。(图片由受访者提供)

 

  陈松蹊:全国政协委员,中国科学院院士。

  人人都用统计学。

  从出门前查看的天气预报、根据做过的试卷归纳整理的错题本、网络购物时对比商品的销量和评价,到科学研究、政策制定、经济发展,每个人都主动或者被动地将统计学的知识和思维应用于生活、学习、工作当中,也就是根据历史数据学习归纳出事物的规律。

  但却并非人人都了解统计学。

  “统计学是指导数据收集、数据分析和基于数据做科学推断的学科。”这是作为统计学家的陈松蹊,用最浅显的语言阐释的统计学概念。

  看,即便摒弃了晦涩拗口的专业术语,如果不与生活、不与应用相连接,我们依然很难从概念中真正了解这个学科的内涵和外延。也正因如此,已经成为中国科学院院士的陈松蹊,依然会挤出时间投身于最基础的科普工作中,他想要让更多的人知道统计学是什么、统计学能够做什么。而在做科普时,最醒目的永远是幻灯片上一个个图文并茂的故事,无论是坐在飞机上观测海洋里的蓝鳍金枪鱼,还是新冠疫情初期做出的一份份疫情分析日报,都能轻而易举地引发台下观众的阵阵掌声。

  “统计学应该是鲜活的。”陈松蹊说。

  坐标

  10年,11份《空气质量评估报告》。

  这是陈松蹊和他的团队研究时间最长的课题。

  2013年,正是我国大气污染形势严峻之时,多座城市空气质量指数“爆表”的新闻一经报道就引发了国内外的强烈关注。这导致陈松蹊在邀请一位国际统计学者来华访问时,被对方以“空气不太好”的理由婉拒。

  “原来,北京的污染已经严重到这种程度了。”意识到这一问题的陈松蹊,第一反应就是:“是不是可以分析一下污染数据,从数据中获得污染排放信息?”

  2014年3月,从未涉足过大气污染领域的陈松蹊,带着团队里的7位师生一起从零开始。经过一年的数据收集、分析、研究,次年3月,《空气质量评估报告:北京城区2010-2014年PM2.5污染状况研究》正式发布。他们使用大数据统计方法,去除大气监测数据中的气象因素干扰,评估污染的严重程度,为防治空气污染、维护生态环境、制定减排政策提供建议。

  为了更多人能够理解这份报告,复杂专业的统计学方法,也被团队简化成通俗易懂的“人努力-天帮忙”指数。

  而在发布的每一份《空气质量评估报告》封面上,都会写一句话:“为了蓝天,让我们用数据解读污染。”

  这句话的背后,是陈松蹊和团队为了能够让数据“说话”的努力和坚持。在陈松蹊看来,统计学是指导数据收集和分析的学科,更是一个方法论的学科,承载起多学科的交叉研究。手持统计学这把“万能钥匙”,就能够打开通向各个学科的大门。“哪里有数据,哪里就有统计学。”陈松蹊笑称。

  然而,仅仅打开大门还远远不够。进行交叉学科的研究,既需要扎实的统计学基础,也需要不断涉足新领域、新专业的激情,花费大量的时间学习、了解新领域的新知识。陈松蹊身上,恰恰二者皆有。在他的学生眼中,陈老师有着强烈的好奇心与求知欲,他从不停留在舒适区,而是不断地向前探索。这么多年来,他总是在办公室、图书馆、食堂、宿舍之间几点一线,晚上10点多才下班是他的工作常态。

  “做研究总是需要解决各种各样的困难,有理论层面的,有思想层面的。我的方法就是在运动中、在前进中克服瓶颈,在不断寻求新的解决方法中,瓶颈可能就消失了。”陈松蹊说。

  而推动他不断尝试、探索新理论与新领域的,是作为学者的责任感,更是对家国大事的深深关切。这也成为他游走于各个学科时,最重要的坐标。

  就像如今,距离陈松蹊开展大气污染研究已有10年,蓝天白云已经成为北京的常态,但他们的研究依然在进行中。因为他觉得,“空气质量比以前好了很多,但还没有足够好,距离人民健康所需要的空气质量还有一定差距。”

  是的,人民需要的,就是陈松蹊研究的方向。同样的使命感,也是陈松蹊履职的动力。

  连续两年,陈松蹊都为大气污染发声。他提出,提高空气质量标准,实施更严格的空气质量标准,降低重污染预警的门槛,促使人民群众实行更有效的保护措施。他还提出,用更科学的方法评估空气质量,调动地方环保人员的积极性,持续提高生态环境质量。

  以科学家的视角,以国家需要、社会需要、人民需要的使命感,观察我们所生活的这个世界,并在第一时间将研究成果转化为高质量建言,这是陈松蹊履职的不变坐标。

  变量

  变量,是数学、统计学中一个基本概念,指不确定的或变化的量。

  对陈松蹊而言,走上统计学这条道路,也由诸多变量交织而成。

  学生时代,陈松蹊的数学成绩很好,但在高考后选择专业时,他却听从了家里的安排,填报了医学和生物学专业。阴差阳错的是,他的档案到了北京师范大学后,因为数学成绩好,他被数学系老师看中,成为一名数学系学生。

  “如果我到医学院,可能也会成为好的医生,也说不准。”陈松蹊回忆起自己与数学结缘的伊始。

  1983年,中国改革开放初期,经济建设成为社会热点。此时,大学毕业后已经在北京一所高校任教的陈松蹊,也有了继续深造的念头,他想要攻读计量经济的研究生。然而,由于他所在学校的要求,他只能读数学相关的专业。就这样,陈松蹊又成为北京师范大学数理统计专业的研究生,从此走上了统计学的道路。

  因为生活中存在许多不可预测和变化的因素,人生才有了更多的不确定性和机会。而回到统计学本身,陈松蹊也觉得,不确定才是统计学的魅力所在,“统计学给出的不是一个确定的值,而是一个数值分布。通过对历史数据的分析,对未来进行预测,透过纷杂的数字发现规律,这是一个很有意思的过程。”

  沉浸在统计学的魅力中,让陈松蹊觉得,研究的过程虽然辛苦,却也快乐。他的研究领域很宽泛,他在超高维假设检验方法和非参数经验似然方法方面取得了丰硕成果,推动了统计学的关键性发展。

  在前进中,陈松蹊也如同一个关键的“变量”,深深地影响着许多人的人生轨迹。很长一段时间,他的团队向所有对统计学感兴趣的学生开放,发给他的每一封邮件,他也会认真回复。

  博士生孙浩轩就是这样来到团队的。大一时,拿着当年的空气质量报告来做讲座的陈松蹊就让他印象深刻,所以后来,孙浩轩也毫不犹豫。“进入团队后,陈老师会因材施教,看你有哪些合适的课题和科研项目。”孙浩轩说。

  “陈老师严谨的治学风格是我们的动力和榜样。在他身上,我感受到了‘言传身教’这个词的真正含义。”另一位博士生陈涵玥对此也深有感触。

  不久前,陈松蹊到南京、武汉、南昌等地的学校,以“统计学所携带的交叉学科研究经历”为题开展科普讲座,从自身求学、研究的经历谈起,向同学们展示了统计学在不同交叉学科研究中的妙用。在一所高中,陈松蹊给高一的学生们讲完后,当地的老师说,这一届估计有好多学生要学统计学了。

  除了奔赴各地开展讲座,陈松蹊还在全国两会上接连呼吁。去年,他联名51位委员提交了一件《关于加强“统计学”基础研究人才培养工作的提案》,希望有关部门重视我国统计学基础人才培养工作,尽快解决统计学基础人才培养的各种障碍,给予政策支持。今年,他又将思考延伸到加强数据分析人才培养上,建议加大数据分析人才培养力度。

  陈松蹊希望,能有越来越多的人了解统计学。他更希望,更多的人能够走进统计学、学习统计学。因为他深知,对于一个学科的发展来说,“人”才是其中最积极、最重要的变量。

  “统计学的未来,是属于年轻人的。”陈松蹊说。

  曲线

  如果把中国统计学的发展做成曲线图,那么1978年后,特别是1979年中国统计学会成立后,这条曲线才进入相对陡峭的上扬阶段。

  陈松蹊记得,上世纪80年代,他到内蒙古赤峰市阿鲁科尔沁旗进行教育经济考察,做一个关于人口数据的统计。因为没有计算机,他们就用一张大大的纸,一个人负责一行,递推地算下去。整整两周时间,他们哪里都没去,一直在计算。

  2008年,陈松蹊加入北京大学,担任光华管理学院商务统计系主任,他想要为中国统计学的发展尽一份力。2010年,他着手建立北京大学统计科学中心,加强了北大的统计学力量建设。从去年开始,在陈松蹊的推动下,全国统计与数据科学联合会议召开,为促进统计与数据科学领域国内外学术交流发挥重要作用。最近,陈松蹊又围绕中国统计学科开展调查研究,希望对统计学科做一个全方位的普查。

  陈松蹊还致力于推动统计学列入基础学科当中。“统计学是数据分析的基础,但我们对统计学科的重视程度仍然不够,这显然不利于我国统计学基础研究人才的培养,也不利于依赖统计学支持的其他学科的长远发展。”

  “我知道这件事推动起来很不容易,但这事关大数据和人工智能的数理基础,所以我们要付诸更多努力。”陈松蹊说,政协委员的身份为他提供了更广阔的平台,为统计学科发展建言。

  如今,陈松蹊更是清楚地看到,信息技术的飞速发展也为统计提供了更广阔的舞台,统计学学科发展的这条曲线,随着与时代发展的连接,有了更为明显的上扬趋势。

  “现在我们生活在一个数据的时代,数据越来越多,对数据的解读、分析也就越来越重要。”陈松蹊说,世界进入了数字化的新时代,无疑是统计与数据科学发展的重要机遇。“人工智能的基础,一个是计算机,一个就是统计学。人工智能大模型,就是基于大量的、无序的、有偏差的数据,应用统计思想、统计分析方法,构建的分析决策模型。”

  陈松蹊认为,加强统计分析来挖掘数据生产力。除了硬件条件的投入,还需要补齐数据分析能力,基于行业特点判断数据的质量和价值,摸索出数据赋能的路径,才能释放数据的生产力。他深知,中国需要走出自己的路,不然总是跟在别人后面。

  深耕行业数十年,陈松蹊也关注到大数据发展给统计学提出新的研究问题。为此,他将研究专业与履职思考相结合,尽专业所长和委员所能,接连提出推动数据文化传播、加强公共数据共享、构建高质量科学数据集等建议,回应着时代设下的命题。

  他是提案者、倡议者,更是践行者、推动者。

  未来已至,统计学的发展正逢其时,也必将大有可为。而已然站在山巅的陈松蹊,有着更广阔、更清晰的视角,也给自己定下了更宏大、更高远的目标。