多媒体计算

随着互联网的发展,多媒体数据已经变得唾手可得,如图像,音频,视频,文本等;近十年的人工神经网络的进 展也让这些数据的处理变得越来越容易。本课程涉及的应用领域包括图像和视频处理、声音和语音处理、自然语 言处理等。课程旨在介绍人工智能领域中常见的媒体的信号处理和机器学习方法,如数据表征,数据压缩,频域 变换,卷积神经网络,序列模型,数据合成,多模态融合等。课程通过理论教学与项目实践,让学生了解不同数 据与信号的特性,处理方式,以及共通与交叉融合之处。该课程可作为计算机视觉,自然语言处理等课程的前置课程。