一、符号主义和连接主义的结合

  1. 符号主义:

符号主义在 AI 音乐生成中通常使用 MIDI(Musical Instrument Digital Interface) 作为中间产物,它不包含音频文件,而是以符号化的形式表示音乐,例如音符、和弦、旋律等。
符号主义方法可以提供更多的控制和精确性,允许用户对生成的音乐进行细致的编辑和调整。
它适用于需要对音乐结构有明确控制的场景,例如专业的音乐制作或者教育领域。

  1. 连接主义:

连接主义,特别是深度学习技术,通过训练大量的音频数据来生成音乐。这种方法可以生成听起来非常自然和真实的音乐作品。
它通常采用端到端的模型,从输入到输出直接生成音频,这使得生成的音乐听起来更加完整和流畅。
连接主义方法适合于需要快速生成大量音乐素材或者对音乐的自然度有较高要求的应用场景。

在实际应用中,两种方法可能会结合使用,以发挥各自的优势。例如,符号主义可以用来生成音乐的基本结构和旋律,而连接主义可以用来生成更加自然和真实的伴奏和音效。

二、生成音乐基本的 workflow

about-AI-generates-music.png

  1. 歌词提供了符号化的歌曲结构,如主歌、副歌、间奏,甚至是情感偏好
  2. 参考歌曲提供了曲风曲调的结构
  3. 人声歌唱被处理为音调变化后的念白
  4. 符号化的 MIDI,提供了生成配器的基础,可用于增加不同乐器音色,尤其是对背景鼓点的增加,提供了丰富的听觉感受

三、典型玩家

国外:Suno、Google MusicFX
国内:昆仑万维的“天工SkyMusic”、DeepMusic 的“和弦派”

  • Suno 于 2024年5月 在 X 上宣布成功完成了1.25 亿美元的B 轮融资,本轮融资后 Suno 估值达到5 亿美元
  • Deep Music 已完成三轮融资。最近的一次是,2024年4月,获得知名创投机构 GGV纪源资本和丰元资本的近千万美元 A+ 轮投资

四、商业上的不成熟

  • 音乐作为一种内容消费,市场规模是偏小的,尤其是“艺人”这个消费要素目前占据相当大份额
  • AI 生成的音乐内容被消费,市场不成熟,短时间也无法支撑起 AI 大模型的巨大投入

五、观点:AI 音乐模型是世界引擎的阶段性成果

AI 生成音乐,不应该局限理解成一种内容提供:

  • 是符号主义和连接主义的合作,是 AI 理解和生成内容的一种技术展示

    • 符号主义依据某种范式,通过一种可被理解的中间符号,解构和生成内容
    • 连接主义端到端生成内容

六、娱乐

一首由昆仑天工 AI 生成的歌曲

标签:产品, AI

评论已关闭