统计与数据科学前沿理论及应用教育部重点实验室于2017年11月获教育部批准筹建,2019年11月通过建设验收。实验室依托华东师范大学建设,充分利用其学科优势,整合统计学、数据科学和生物信息学资源,促进统计学和数据科学的理论和方法创新,推进大数据统计和机器学习方法在工业物流、生物医药、金融保险、安全运维等领域的应用与实践,为国民经济和科学发展提供技术支撑。
实验室始终以“聚焦原创和国家战略需求,产出世界一流的重大创新成果”为目标,以统计学与数据科学的深度融合为核心特色,推动前沿理论与实体经济的深度转化,加快建设成为具有国际影响力的交叉科学研究高地。
在实验室主任周勇教授的组织和统筹安排下,经过五年努力,实验室取得了一系列研究成果,使华东师大统计学科由2017年的全国并列第三,到2022年提升至全国并列第一,进入国内顶尖行列。实验室以统计学和数据科学交叉渗透、数据科学和数据工程相结合为特色,实现研究成果在实体经济领域的深度融合转化。
近五年,实验室共承担各类科研项目251项,合同经费2.13亿元。其中国家级项目106项,省部级项目74项;发表高水平论文500余篇,其中14%发表在统计学、机器学习、计量经济学顶级期刊及计算机顶级会议上;出版专著16部;斩获教育部高等学校科学研究优秀成果奖、上海市科技进步奖、上海市自然科学奖等省部级奖项十余项。
近五年主持的重点科研项目
近五年获得主要科研奖项
依托丰富的学科资源,实验室坚持目标导向、项目驱动,开展有组织科研,在基础理论突破、关键技术攻关、战略应用落地、人才培养及社会服务等方面取得了一系列突破性成果,为国家科技发展和地方经济建设提供了重要支撑。
一、聚焦原创成果:引领全球科技创新的中国力量
实验室围绕大数据分析与人工智能核心问题在统计机器学习、分布式计算等基础理论领域,以“原创突破”为引擎,深耕基础理论创新与关键技术攻关,面向关键科学领域的前沿统计方法与交叉应用研究取得了一系列国内领先、国际先进的重要原创性成果,以中国智慧破解全球性科学难题,在国际科技舞台持续发出“中国强音”。
❖ 统计机器学习的若干理论方法创新
突破了计算与理论分析的瓶颈,构建了高维数据表示降维的统计推断理论、非欧数据的表示学习理论、集成学习的最优预测理论,以及多智能体强化学习的创新理论方法,建立了一般M估计的半监督学习预测方法。系统建立和发展了不完整数据、多源异构数据、异质性数据、高维数据等复杂数据下大规模分布式算法与理论,实现了复杂大数据高效计算与有效通讯,大大提升了大规模数据分析和决策支持的能力。这一系列工作共发表统计机器学习领域论文39篇,包括统计 (JASA、Biometrika) 、机器学习 (JMLR)、计量经济学 (JOE)、计算机 (TPAMI) 等顶级期刊。成果获国内外同行的高度评价和广泛引用,其中引用者包括美国科学院院士、美国艺术与科学院院士、统计学最高奖 COPSS 奖获得者等。依托以上成果,获得国家科技进步二等奖,上海市科技进步一等奖、上海市自然科学二等奖,成功申报国家重点研发计划与国家重点项目、上海市基础科学研究特区计划,对接大数据与人工智能等国家重点战略需求。
❖ 空间/单细胞转录组学数据的统计分析和整合方法
针对复杂疾病发病机制和流行病传播规律,研发新的表型关联分析和统计推断方法,通过对抗域迁移构建了学习数据集低维表征的统一框架Portal,实现了低内存消耗的数百万个细胞数据整合;开发了高效的空间标注方法SpatialAnno和MRI医学成像数据重建算法FMTNet和FIRM,实现全局信息和不同尺度特征间的数据集成;建立了第一个系统性的全球城市微生物生态系统目录,构成高分辨率的全球宏碁因组图谱。这一系列工作发表生物医学领域论文18篇,其中包括高影响力期刊Cell、Nature 子刊、 Nucleic Acids Research等。成果被广泛应用于生物医学领域问题,开发的一系列R软件包被累计下载逾2万次,获国际同行的高度评价和引用,其中包括Nature Biotechnology、Nature Methods、Nature Microbiology、Lancet Microbe等高影响力期刊。基于以上成果,成功申报主持上海市“科技创新行动计划”计算生物学重点专项和国家自科重点项目。
❖ 大数据赋能工业物流:智能监控与标准引领
以现代物流“实时化、可视化、可追踪、大数据融合”等需求为导向开展技术创新,针对全球占比达88%的无基站区域,提出了基于通信链路可靠性的评估算法、主动跟踪模型及基于规则的事件决策方法、以及对试验设计的深度优化,研发了基于北斗导航的天空地一体化集装箱监控终端和电子锁,牵头制定国家和国际标准各1项(GB/T 40710-2021,ISO/TS 7352:2023),推动了基于集装箱的物联网发展。这一系列成果一共发表论文19篇,其中12篇论文发表在统计学顶级期刊JRSSB、JASA、Biometrika、Technometrics上,被工业统计顶刊 JQT 三任主编综述论文引用,认为是 1920 年至今统计过程控制方面最重要的工作之一。依托以上成果,获上海市科技进步一等奖、高校人文社科咨询报告一等奖、中国航海学会科技进步一等奖各1项,牵头制定国家标准1项、国际标准1项、项目实施中呈送专报26份,获省部级以上领导批示29次(含正国级1次)。国际标准正在发挥越来越重要的作用,在国际物流领域发出中国声音。标准规定的电子封条已在中外运国际航线全面推广:在我国,应用于中石油、中石化等能源运输、以及检疫和港口;国际上,2019 年起,中外运率先使用并在其国际航线上广泛运行,后推广至德国等更多国际港口。
❖ 大数据护航能源运输与飞行安全
聚焦能源运输和民航飞行等安全领域大数据,系统发展了处理多源碎片化数据的模型平均方法、FragmGAN方法和半监督学习方法,实现了复杂数据有效融合。构建EWMA-PM控制图、定向故障分类和变点检测方法,实现了高维数据流有效在线监控。发展了缺失数据的检验和估计理论。开发了高效数据匹配方法(发明专利)以及航班运行风险量化和评价设备(发明专利),建立民航安全管理平台1个(软件著作权)。这一系列研究工作,共发表论文15篇,包括统计和机器学习顶刊 JASA、JRSSB、JMLR 和权威期刊 Technometrics、JQT 等,获发展中国家科学院院士等引用和正面评价。依托以上成果,获批主持国家重点研发计划项目1项、课题2项,上海市科委重点项目1项,授权软件著作权 1 项、发明专利3项。
❖ 金融保险风险管理及优化决策
面向金融与保险大数据前沿问题,揭示投资人概率扭曲的风险认知会显著影响风险与收益的定价关系、现实偏差对于项目延期交付具有重要影响,并提出新的激励方案,有效解决项目延期交付问题;针对非马尔科夫机制转换模型下的均值—方差投资组合问题,构建开环均衡策略以及线性闭环均衡策略的表达式,揭示了模糊厌恶和投资对等动态帕累托最优风险分担策略的影响,探究适合我国国情的养老方案。这一系列工作共发表金融与保险领域论文16篇,包括顶级期刊Operation Research、Mathematical Finance等,获同领域专家IEEE fellow、SIAM fellow高度评价并引用 。12份专报成果获领导批示,其中2篇成果获中央有关部门单篇采纳,为国家发展建言献策。
二、服务国家战略:破解“卡脖子”难题
实验室深度对接国家重大需求,在工业物流、能源安全、生物医药等领域取得标志性成果。
赋能工业与物流现代化:针对全球无基站区域物流信息失联的难题,实验室包起帆团队首创基于北斗/低轨卫星的天空地一体化集装箱监控终端与智能电子封/锁,牵头制定国家标准《GB/T 40710-2021 基于NFC的集装箱电子箱封及系统》和国际标准《ISO/TS 7352:2023 集装箱NFC/二维码箱封》,实现中国技术在全球物流领域的话语权突破。相关成果获上海市科技进步一等奖、中国航海学会科技进步一等奖,助力我国集装箱物联网技术领跑国际。
牵头制定集装箱箱封国际标准和国家标准各1项
护航能源与民航安全:研发油气管网智能监控系统与民航飞行品质分析平台,攻克多源碎片化数据融合技术,构建高维数据流在线监控方法,开发高效故障检测算法与航班运行风险评估设备,不仅实现了对海量、多样化数据的高效整合与分析,确保了数据处理的精确性和实时性,也为国家能源运输与航空安全提供关键技术保障。
油气管网预警平台
民航飞行品质与风险分析平台
助力生物医药与健康中国:对接国家生物医药创新和产业发展战略,与京沪多家医院合作。在精准医疗领域,开发对抗域迁移统一框架Portal,实现百万级细胞数据高效整合;创新医学影像重建算法,提升诊断精度;构建全球首个城市微生物生态系统目录,成果发表于Nature Computational Science,Cell等顶级期刊,推动生物医药大数据研究迈向新高度。
创新金融与保险智慧化:建立可解释金融量化模型与风险管理策略,揭示投资者行为对金融定价的影响机制,提出新型养老保险制度方案,研究成果被中央办公厅及上海市委采纳,为国家金融数字化与养老体系优化提供科学依据。
三、顶尖团队建设:汇聚国际化创新力量
实验室构建了以领军人才为引领、中青年学者为主体的高水平研究队伍,拥有国家级高层次人才10人次,省部级人才25人次。团队注重交叉学科引才,近五年从哈佛大学、伦敦政治经济学院等国际顶尖高校引进青年学者十余人,形成年龄结构合理、学科方向多元的创新梯队。实验室下设5个交叉研究团队,聚焦统计机器学习、生物医学大数据、工业物流大数据、安全运维大数据、金融保险大数据等方向,推动学科深度融合发展。实验室始终以战略眼光统筹全局,通过优化资源配置、强化跨学科协同、建立动态激励机制,为团队注入持续创新动能。在实验室主任周勇教授的带领下,实验室坚持“目标导向、问题驱动”的研究范式,精准对接国家重大需求,高效推进科研攻关与成果转化。经过五年努力,实验室不仅在学科建设上实现跨越式发展,更在工业物流、生物医药等领域突破多项“卡脖子”技术,彰显了统筹规划与执行落地的双重效能。
四、人才培养高地:育复合型数据科学英才
实验室坚持“学科交叉+实践创新”的培养模式,始终高度重视一流课程建设,建设国家级一流本科课程《试验设计》《概率论》;《概率论与数理统计教程(第三版)》获得2021年首届全国教材建设奖的全国优秀教材(高等教育类)一等奖。深耕创新型人才培养改革,通过“学术午餐会”“博士生论坛”等品牌活动,激发学生科研潜力,研究生在AOS、JMLR等顶刊发表论文150篇,一批博士毕业生赴耶鲁大学、澳大利亚国立大学、西安交通大学等国内外知名高校任教或从事科研工作。本科生团队获“挑战杯”全国特等奖,年均获国家级学科竞赛奖项超百项,就业率稳居98%以上。
《概率论与数理统计教程(第三版)》获首届全国教材建设(高等教育类)一等奖全国优秀教材
在第十八届“挑战杯”全国大学生课外学术科技作品竟赛中荣获特等奖
五、开放共享:推动科学与社会共进
实验室联合创办中国大陆首本英文统计期刊《Statistical Theory and Related Fields》,被ESCI、CSCD等国际数据库收录,影响因子实现突破。连续五年举办统计学与数据科学暑期学校,惠及全球8000余名师生;出版科普图书《统计王国奇遇记》,开展公益讲座超2000人次,助力全民数据素养提升。通过设立开放课题,与北京大学、浙江大学、华东师大计算机学院、通信学院等机构合作,在深度学习泛化理论等领域产出一批顶刊成果。
实验室主任周勇教授强调,实验室将聚焦人工智能与数据科学深度融合的前沿领域,重点突破可解释机器学习、多模态数据融合、分布式智能计算等基础理论,深化与国际顶尖机构的合作,推动技术标准全球化布局。同时,实验室将进一步加强青年人才培养体系建设,为国家科技自立自强提供智力支撑。
周勇教授指出,未来,实验室将继续以“扎根基础、面向应用、交叉创新”为路径,勇担使命,勇攀统计与数据科学高峰,为提升我国科技自主创新能力、服务经济社会发展贡献智慧与力量。