机器学习与翻译


    该课程主要面向研究生及高年级本科生开课,要求选课学生有基本的统计学背景知识。

    机器学习是人工智能领域中一个关键课题,该课程教授学生机器学习中的基础理论和计算,旨在加深学生对机器学习的了解,熟练学生在该领域的技能,以便他们能够解决存在于更广阔领域中不同的实际问题。机器学习应用广泛,其应用领域包括网络搜索,社交网络,语音识别,图像处理,机器人技术,金融等。该课程选择统计机器翻译的应用,推动学生对课程的学习及体现机器学习的应用。如今,机器翻译成为最热的领域之一,政府,微软、百度、谷歌等大型企业对机器翻译项目投资巨大。

    课程内容包括理论和实践两部分:首先,该课程介绍了训练标准(贝叶斯决策论、最大似然),统计模型(CRF,SVM,HMM,神经网络),训练计算(EM,Gibbs采样);接下来,基于统计方法(词语对齐、词组训练,解码,优化),介绍先进的机器翻译方法。

    教学方式以讲座和讨论为主,鼓励学生参与研究项目,从而激发学生的奇思妙想。