2024-07-23 闲言碎语

大模型行研：AI 时代适用的大容量存储特点

一、AI 大模型的存储系统，突出在需要同时适应 GPU、CPU、NPU等多种芯片算力特点描述具体要求高吞吐数据访问在AI场景中，存储系统需要能够提供高吞吐的数据访问能力，以充分发挥GPU的计算性能例如，在智能制造生产线上通过高精度相机给物品拍照，用缺陷识别模型自动找出质量问题，这类模型的训练集可能达到10TB，训练过程中如果存储系统吞吐不足，会成为GPU训练的瓶颈海量文件管理AI场景中常常需要处理大规模的文件集，例如自动驾驶领域的训练集可能包含数千万张图片，每张图片就是一个文件，总的训练数据可能多达几十亿甚至上百亿文件存储系统需要能够有效管理这些海量小文件热点数据吞吐扩展在量化投资等领域...

二向箔 - 让 AI 协助我们与自己对话的APP

二向箔是什么？这不是一款事项待办和时间管理的工具，也不是一个日记甚至带有双向链接的笔记类应用，内置了记忆力训练的功能。这是一个可以安静跟自己对话的App、可以反复打磨自己想法的空间，按照大纲式对话的样子把跨时间的思维组织在一起的瞬间。为什么要做这个应用？灵感、漫步、回顾、觉...

阅读全文

大模型行研：算力加速的技术标准 - RDMA

一、什么是 RDMA远程直接内存访问 (RDMA) 是一种允许联网计算机直接访问彼此主内存的技术，无需涉及处理器、缓存或操作系统，是一个由多个公司和组织合作开发的技术标准。这种旁路方法减少了 CPU 负载并降低了延迟，从而实现更快的数据传输速度，非常适合需要高速数据传输的应...

阅读全文

大模型行研：模型与算力的优化大师 - AI 编程语言与编译器

人工智能模型（软件）与算力（硬件）之间，存在一个由算子、编程语言和编译器构成的开发工具生态，关系如下图：为了增强软硬件之间的协作效率，出现了一类专用的 AI 编程语言和针对 AI 场景优化的编译器，作用是方便开发者使用和协作，并能针对不同硬件做专有的优化。在 NVDIA 的...

阅读全文

大模型行研：人工智能框架的“世界语” - ONNX

ONNX（Open Neural Network Exchange）是一个开源项目，旨在实现不同人工智能框架之间的模型互操作性，是开放的 AI 生态系统。它允许开发者在首选框架中训练模型，并在多种硬件和平台上高效部署。最初由微软和Facebook（现Meta）联合开发，并于...

阅读全文

创新芯片行研：寒序科技，基于自旋的非全硅基异构概率计算芯片，组合优化问题的另类解法

在浏览创新类计算芯片的过程中，看到了一款比较另类的芯片，全称可以是“基于自旋的非全硅基异构概率计算芯片”特殊之处计算原理：利用自旋进行基于马尔可夫链和蒙特卡洛的高性能伊辛（Ising）求解计算简单说，就是在类似“组合优化”这一类的特定计算上：量子计算优势：对比经典电子比特计...

阅读全文

大模型行研：大模型推理算力应该什么样？（续）

一、推理算力的解决思路根据基本思路的不同，推理算力可以做以下分类：专精熟练工路线：牺牲通用性换取高性能，如各类专用芯片、加速器型芯片缺点：贵，无法支持新算法人多力量大路线：堆计算核心，高并发计算缺点：核心间通信可能成为瓶颈，编程复杂性增加混合路线：大小核设计，存算一体芯片...

阅读全文

大模型行研：大模型推理算力应该什么样？

一、AI 训练和推理的区别：学车与开车对比开车来理解：AI 的训练是一场漫长的学车过程在学习过大量的交规和教练车实习后，可以上路驾驶阶段，只需学习一次想驾驶货车、摩托车，则需要重新学习家用轿车学习时间短，货车/公交车学习时间长，特种车辆还需要单独学习和训练AI 的推理则是每...

阅读全文

AI API不止可以插入广告，还可以竞价

在国内大厂纷纷召开的AI发布会上，不是降价就是降价，看起来就像是跑步进入熟悉的“补贴”大战，直到出现了“免费”，很多朋友开玩笑说，该不会是往AI的结果里插入广告来盈利吧？从商业模式的惯性看：不止会插入广告，还可以竞价谁来付费AI 大模型的研发投入巨大，后续运营需要投入的推理...

阅读全文

研究大模型的商业场景，应该看算法备案列表

相关信息来自「国家互联网信息办公室关于发布第五批深度合成服务算法备案信息的公告」，可以搜索得到这份公开的列表，共有 394 个备案算法，意味着涉及到的公司，可以将对应的AI算法应用到实际的商业运作中，更重要的是，对应着394个实际的使用场景。将获得的算法分类，并统计，得到以...

阅读全文