一、活动主题
学术报告——Optimal Distributed Subsampling for Big Data Analysis
二、活动时间
2024年9月20日16:00
三、活动地点
临潼校区 理学院楼四层430会议室
四、主讲嘉宾
艾明要教授
五、主讲内容
子采样方法是在大数据分析中降低计算负担并保持统计推断效率的有效技术。如果数据量太大,无法一次性计算出非均匀的子采样概率,那么使用替换的子采样就不可行。这个问题可以通过使用一种新的无替换子采样来解决,称为泊松子采样。为了处理完整数据存储在不同块或多个位置的情况,开发了一个分布式子采样框架,在这个框架中,可同时在完整数据的较小分区内计算统计量。
六、参加人员
理学院师生及其他学院从事相关研究的师生
人事处 理学院
2024年9月14日
主讲嘉宾简介:
艾明要,北京大学数学科学学院统计学二级教授、博士生导师。兼任全国应用统计专业学位研究生教育指导委员会委员、培养组组长,中国现场统计研究会副理事长,中国数学会概率统计学会第十一届理事会秘书长,中国统计学会常务理事。担任四个国际重要SCI期刊Stat Sinica、JSPI、SPL和Stat编委,国内核心期刊 《系统科学与数学》、《数理统计与管理》、《数学进展》编委,科学出版社《统计与数据科学丛书》编委。主要从事大数据采样理论与算法、试验设计与分析、计算机仿真试验与建模、应用统计的教学和研究工作,在AOS、JASA、Biometrika、《中国科学》等国内外重要期刊发表学术论文八十余篇。主持国家自然科学基金重点项目1项、重点项目子课题1项、面上项目5项,参与完成科技部重点研发计划项目2项。北京大学通识教育核心课程主讲教师,两次获得北京大学优秀博士学位论文指导教师,获北京市高等学校优秀教学成果二等奖。
下一条:第三十七期经纬学术沙龙
【关闭】