speaker

朱松纯

北京通用人工智能研究院院长,北京大学智能学院院长、人工智能研究院院长

朱松纯,全球著名计算机视觉专家,统计与应用数学家、人工智能专家。1996年获美国哈佛大学计算机博士学位,后在布朗大学、斯坦福大学、加州大学洛杉矶分校UCLA等机构工作。 留美28年后,于2020年9月作为人工智能战略科学家回国组建北京通用人工智能研究院,任院长,并兼任清华大学基础科学讲席教授,北大讲席教授,北大人工智能研究院院长、智能学院院长等职务。在国际顶级期刊和会议上发表论文400余篇,获得计算机视觉、模式识别、认知科学领域多个国际奖项。自2010年以来,朱松纯两次担任美国(联合英国)视觉、认知科学、人工智能跨学科合作项目负责人,两次担任国际计算机视觉与模式识别大会主席。朱松纯教授长期致力于构建计算机视觉、认知科学、乃至人工智能科学的统一数理框架。

《音乐的人工智能UV理论: 显式表达音乐的结构U与美学价值V》



报告摘要:

  近年来,人工智能模型与算法在音乐创作与视频配乐等应用中引起了较大的兴趣和进展。当前大量的工作集中在基于Transformer、扩散模型等深度学习方法,通过从人类音乐作品中学习统计模型, 再从模型中生成音乐。 这类方法在模型的可解释性、可控性、交互性等方面还存在较大不足,也受限于专业的音乐标注数据的不足,尚不能与人类创作者在音乐的层次结构、认知、情感、美学价值观等概念表达上实现对齐。针对这个问题,本次报告介绍一种新的音乐建模理论, 将通用人工智能的UV理论应用于音乐创作, 这里U是一组势能函数, 用于表达音乐的组成式(Compositional)的概率与或图模型(Music AOG),表示音乐创作的结构化概念;V是一组价值函数, 表示人类的音乐审美与认知模型。Music AOG模型可以用于实现逐节点与逐过程的可解释,可操控、可交互的音乐生成与视频配乐。本次报告还将介绍专业音乐标注系统Music Parser、音乐学习生成算法、计算音乐美学、视频配乐应用等方面的探索。

SOMI 2023