AI Infra:FalkorDB,给AI用的图数据库
https://github.com/FalkorDB/FalkorDB
你用它做什么?
FalkorDB 是一个专门给 AI 项目用的图数据库。它由原来 RedisGraph 的团队重新做的,不依赖 Redis。
谁在用?
- 数据科学家做知识图谱
- 推荐系统工程师找用户关系
- AI 产品团队做语义搜索
- 欺诈检测团队挖隐藏联系
典型场景:
- 你问“谁和这个用户有共同好友且买过类似商品?”
- 你搜“癌症治疗和哪些基因有关?”它能画出整条证据链
- 你输入一段文字,它自动把关键词变成图里的节点,连上关系
它怎么做到的?
1. 一边查图,一边查文本
你不用在两个系统之间来回切换。
比如:
- 先用 Cypher 找出“买过A产品的用户”
- 再用 SQL 找出这些用户里“年龄>30”的
- 最后用图遍历找出他们“还关注了哪些话题”
这三步,一条命令就能做完。
2. 快,是真的快
它用数学方法(稀疏矩阵)算图关系,比 Neo4j 快 5 到 10 倍。
- 1000万节点,1亿条边
- 查询响应时间 < 50 毫秒
- 不用买昂贵服务器,普通云主机就能跑
3. 能理解语义,不只是关键词
它能直接存向量嵌入(embedding)。
比如:
- 把“苹果”这个词变成一个 768 维的向量
- 把它挂到“水果”这个节点上
- 你搜“甜的水果”,它不光找“苹果”,还会找到“梨”“芒果”,因为它们的向量接近
用法:你把知乎文章、客服对话、产品评论都转成向量,存进图里。LLM 问“用户最近抱怨什么?”,它能返回“抱怨物流慢”的路径:用户A → 提交评论 → 含“物流慢” → 关联标签 → 涉及快递公司B
4. 数据存得聪明
- 主要数据放内存,速度快
- 不常改的数据自动存硬盘,不丢数据
- 用列式压缩,存几百个属性也不卡
- 节点多了?加机器,自动分片,不用重写代码
AI 怎么用它?
传统 AI 只知道“词”和“句”。FalkorDB 让它知道“谁和谁有关系”。
| 能力 | 举个实际例子 |
|---|---|
| 语义节点扩展 | “苹果”和“iPhone”向量相似 → 自动连一条边,权重0.92 |
| 多跳检索 | 用户A → 买过手机 → 常看评测 → 关注博主X → 博主X 推荐过耳机 → 所以推耳机给A |
| 知识对齐 | 把维基百科的实体关系导入,变成图的一部分,LLM 能引用真实结构 |
| 可解释 | 不是“系统推荐了这个”,而是“因为你看过A,A和B有关,B和C有关” |
你问:“为什么推荐这篇论文?”
它答:“因为这篇论文引用了你读过的三篇论文,而这三篇都被你关注的专家引用过。”
它能和谁一起用?
- LangChain:当你的知识库,不是靠向量库瞎撞
- LlamaIndex:替换掉简单向量检索,用图做推理
- GraphRAG:让它能走多跳路径,不是只看单个向量
- OpenAI / Hugging Face:嵌入模型输出直接存进图节点
- Neo4j / RedisGraph:现有数据能一键导入,不重做
你不用换掉整个系统。把 FalkorDB 插在 LLM 和数据库中间,它就负责“搞懂关系”。
和别的图数据库比,差在哪?
| 对比项 | FalkorDB | Neo4j | TigerGraph | RedisGraph |
|---|---|---|---|---|
| 速度 | 很快 | 一般 | 快 | 快但停更 |
| AI 支持 | 原生向量 | 有限 | 有但难用 | 无 |
| 扩展性 | 支持分片 | 不好扩 | 很好 | 单机 |
| 开源 | 完全开源 | 商业限制多 | 部分闭源 | 已停止维护 |
| 易用性 | SDK + Docker | 有界面 | 配置复杂 | 以前好,现在没人管 |
选它,不是因为“最新”,是因为它能跑、能连AI、还能改代码。
以后会怎么变化?
- GraphAI 模块:直接在图上跑聚类、更新嵌入,不用导出数据
- 自然语言查图:你说“找出所有和肺癌有关的基因”,它自动生成 Cypher 查询
- Falkor Cloud:不用自己搭,点一下就开一个图数据库
- 时序图支持:记录“关系怎么变的”,比如“用户上周关注A,本周关注B”