一、核心观点

  • 音乐类 AI 应用,本质上是内容消费,不只是大模型的应用
  • 内容消费是一种“策展”,组合和顺序也是内容
  • 音乐是耐用品,但在单次消费场景里,表现出很强的快销品属性,受到潮流节目或意外事件的传播,音乐被赋予新意义,变成新内容
  • “生成”可以理解成“搜索的召回”,音乐类 AI 应用召回 playlist,作为个性化推荐,也可用于真正的“音乐生成”

二、将 GraphRAG 应用于音乐类服务

2.1. 大模型增强了对音乐的理解

  • 对音乐相关的非结构化内容的理解
  • 对使用场景下,用户隐藏的意图识别

2.2. 歌曲之间/音乐之间的关联是复杂的

  • 关联受到文化因素的影响
  • 受到流行文化的影响
  • 受到场景(也就是输入)的影响

2.3. 不同的音乐应用形态

场景下的输入+ MusicRAG 输出-> 内容可以包装成
QueryPlaylist + 文案音乐剧,演奏会
运动:心跳 + 配速节奏Playlist适合跑步的播放列表
睡眠:心跳 + 睡眠习惯Playlist适合睡前的播放列表
情感识别Playlist + 文案抚慰心灵的音乐

三、如何实现 MusicRAG

musicRAG-flow.png

3.1. 收集分解音乐

  • 恒定的内容:指较少受到时间和潮流影响的内容
  • 更新的内容:指易受潮流影响,可以叠加在音乐上的新内容,如一首歌曲被某电影应用为插曲,赋予了新意义

3.2. 理解音乐

  • 结构化内容
  • 非结构化内容:音色、配器、文化意义、情感倾向、……

3.3. 生成应用音乐

  • 类似专辑:输出 Playlist + 专辑文案
  • 类似演唱会:输出 Playlist + 歌曲之间的专场文案
  • 配合其他知识库生成内容
  • 为用户直接生成音乐

四、谁来实现 MusicRAG 服务

  • 音乐版权方
  • 音乐生成模型

标签:产品, AI

评论已关闭