因果和统计学习

数据技术的蓬勃兴起是二十一世纪最重要的技术进步。为什么数据驱动的方法能够很好的预测、甚至推断因果关系呢?这是数据科学领域最核心也最受人关注的研究问题。本课程将教授学生用于分析这一核心问题的整体性框架。该框架完成于2000年代,涉及统计推断、统计学习、计量经济学、贝叶斯因果网络结构理论等多学科的理论、技术和观点。阐述数据驱动的模型能够完成预测和因果推断的理论、机制和方法。本课程将通过着重阐述不同学科的骨干理论网络和学科间衔接枢纽式理论和技术(包括CEF 定理、统计学习的几何功能等),培养学生跨学科视野的形成和学科交叉融合能力。同时,本课程将精选和课程内容紧扣的前沿文献,引导学生阅读和联想,从而培养学生将所学和前沿研究相关联的能力,启发其创新力和批判力。本课程可作为一系列课程的前导课程,包括了概率论、统计学、机器学习、人工智能理论等。