一、破圈:客户基数和市场规模以 Deepseek 为代表的大模型快速普及,扩大了对高性能存储基础设施的需求;而模型拉低低成本,降低使用门槛,有利于低预算客户。最可贵的是,在应用端呈现出破圈态势,不只是各云服务厂商上线 Deepseek,各种 APP 也以接入 Deepseek 作为近期更新的卖点。可以预见的是,政企客户在 2025 年的采购中,会极大增加 Deepseek 类产品比例,嗅觉敏...
一、GSA 是什么GSA (Gated Slot Attention)是一种结合了 Transformer 和 RNN 特点的模型架构,既保留了Transformer的注意力机制,又借鉴了RNN的高效性运算复杂度从抛物线增长变为等比线性增长在需要上下文记忆的任务中表现优异二、GSA 能做什么:Transformer 类大模型的加速器理解成 Transformer 类大模型的 SideCar,...
一、核心观点音乐类 AI 应用,本质上是内容消费,不只是大模型的应用内容消费是一种“策展”,组合和顺序也是内容音乐是耐用品,但在单次消费场景里,表现出很强的快销品属性,受到潮流节目或意外事件的传播,音乐被赋予新意义,变成新内容“生成”可以理解成“搜索的召回”,音乐类 AI 应用召回 playlist,作为个性化推荐,也可用于真正的“音乐生成”二、将 GraphRAG 应用于音乐类服务2.1....
LLM 在企业中的应用,需要获取内部知识和资料,有两种主流的应用方式:Fine-tuning model 模型微调RAG (Retrieval Augmented Generation) 检索增强生成一、模型微调与 RAG 的区别特性描述适合领域RAG (检索增强生成)RAG是一种结合了检索模型和生成模型的框架,用于知识密集型的自然语言处理任务。它通过检索相关的外部信息来辅助生成过程,从而提...
在本文的语境里,NPU 不单指 Neural Processing Unit(神经网络处理器),而是指一类可以独立于 CPU、GPU 存在的 AI 芯片。当前的 AIPC 概念,是指集成了 AI 芯片的 SoC PC,可能会推动一轮硬件升级,但是存量的,数量庞大的“旧” PC 应该怎么办?一、升级思路:PC + AI sidecar ≈ AIPC1、一种 24 小时在线的独立设备考虑到数据隐...
中昊芯英介绍全称:中昊芯英(杭州)科技有限公司创始人:杨龚轶凡,曾在谷歌TPU核心研发团队参与过TPU v2/3/4的设计与研发工作概括:公司已盈利,已经完成了Pre-B、Pre-B+轮融资什么是 GPTPUGPTPU(General-Purpose Tensor Processing Unit)是一种通用目的张量处理单元,它是一种专门为执行张量操作而设计的硬件加速器。GPTPU的设计目标是...
明星AI企业纷纷筹谋被并购,预示着大模型领域从基础设施到应用生态的重组浪潮已经开始OpenAI 收购 Muti、RocksetGoogle 收购 C.ai一、Rockset 公司概述公司历史与创始团队由前Facebook工程师创办,在实时搜索及数据分析领域的有技术创新核心技术:向量搜索与多维索引对实时数据敏感的推荐引擎、语音助手和聊天机器人领域极其重要优化了结构化、半结构化、地理空间和时间序...
一、符号主义和连接主义的结合符号主义:符号主义在 AI 音乐生成中通常使用 MIDI(Musical Instrument Digital Interface) 作为中间产物,它不包含音频文件,而是以符号化的形式表示音乐,例如音符、和弦、旋律等。符号主义方法可以提供更多的控制和精确性,允许用户对生成的音乐进行细致的编辑和调整。它适用于需要对音乐结构有明确控制的场景,例如专业的音乐制作或者教育...
一、AI 大模型的存储系统,突出在需要同时适应 GPU、CPU、NPU等多种芯片算力特点描述具体要求高吞吐数据访问在AI场景中,存储系统需要能够提供高吞吐的数据访问能力,以充分发挥GPU的计算性能例如,在智能制造生产线上通过高精度相机给物品拍照,用缺陷识别模型自动找出质量问题,这类模型的训练集可能达到10TB,训练过程中如果存储系统吞吐不足,会成为GPU训练的瓶颈海量文件管理AI场景中常常需...
二向箔是什么?这不是一款事项待办和时间管理的工具,也不是一个日记甚至带有双向链接的笔记类应用,内置了记忆力训练的功能。这是一个可以安静跟自己对话的App、可以反复打磨自己想法的空间,按照大纲式对话的样子把跨时间的思维组织在一起的瞬间。为什么要做这个应用?灵感、漫步、回顾、觉醒、涌现出认知溪流,也许是开发者制作这款应用最大的初心;希望不仅仅是一个 flavor-based software,而...