一、核心观点
- 音乐类 AI 应用,本质上是内容消费,不只是大模型的应用
- 内容消费是一种“策展”,组合和顺序也是内容
- 音乐是耐用品,但在单次消费场景里,表现出很强的快销品属性,受到潮流节目或意外事件的传播,音乐被赋予新意义,变成新内容
- “生成”可以理解成“搜索的召回”,音乐类 AI 应用召回 playlist,作为个性化推荐,也可用于真正的“音乐生成”
二、将 GraphRAG 应用于音乐类服务
2.1. 大模型增强了对音乐的理解
- 对音乐相关的非结构化内容的理解
- 对使用场景下,用户隐藏的意图识别
2.2. 歌曲之间/音乐之间的关联是复杂的
- 关联受到文化因素的影响
- 受到流行文化的影响
- 受到场景(也就是输入)的影响
2.3. 不同的音乐应用形态
场景下的输入 | + MusicRAG 输出 | -> 内容可以包装成 |
---|
Query | Playlist + 文案 | 音乐剧,演奏会 |
运动:心跳 + 配速节奏 | Playlist | 适合跑步的播放列表 |
睡眠:心跳 + 睡眠习惯 | Playlist | 适合睡前的播放列表 |
情感识别 | Playlist + 文案 | 抚慰心灵的音乐 |
三、如何实现 MusicRAG
3.1. 收集分解音乐
- 恒定的内容:指较少受到时间和潮流影响的内容
- 更新的内容:指易受潮流影响,可以叠加在音乐上的新内容,如一首歌曲被某电影应用为插曲,赋予了新意义
3.2. 理解音乐
- 结构化内容
- 非结构化内容:音色、配器、文化意义、情感倾向、……
3.3. 生成应用音乐
- 类似专辑:输出 Playlist + 专辑文案
- 类似演唱会:输出 Playlist + 歌曲之间的专场文案
- 配合其他知识库生成内容
- 为用户直接生成音乐
四、谁来实现 MusicRAG 服务
标签:产品, AI