AI Infra:用 HTTP3 访问可能比原生 MySQL 二进制协议还快

https://planetscale.com/blog/faster-mysql-with-http3「Faster MySQL with HTTP/3」一、文章在讲什么?PlanetScale 做了一套实验性的 HTTP API,通过 HTTP/2、HTTP/3 去访问其 MySQL 兼容数据库,并写了一个 Go 驱动与之对接,然后在多种场景下与传统的 MySQL 协议做了性能对比,重点关注:冷启动连接(connect + SELECT 1)并发小查询中等数据量读写大数据量读写不同网络环境(高延迟 vs 低延迟)结论:在很多真实场景下,HTTP/2 / HTTP/3 访问 MySQL...

在大模型快速普及的今天,很多人把 AI 当作一个可以随时调用的“智能黑盒”:输入问题,等待答案,然后要么照单全收,要么完全不信。真正缺失的,是把“人与 AI 的协作”当作一个可以系统设计、持续优化的工程对象。借用工程控制论的视角,我们可以更清晰地理解: 人与 AI 不是简...

2025年的圣诞节,Nvidia 花200亿美元,购入 Groq 的核心资产和团队一、Groq 概览:做什么、强在哪1.1 Groq 公司与产品一览维度关键信息公司Groq, Inc.,2016 年成立,总部美国加州 Mountain View,由前 Google TPU ...

前言:国产算力不能只烧钱国产算力参与者很多,是一个生态,想让这个生态赚到钱,可以拆解问题:用国产芯片和国产算力基础设施,找到愿意长期付费的场景,并用合适的商业模式把钱赚回来。结合2025年的市场数据和案例,按「从上到下」分三层来看:顶层:赚谁的钱?——客户与场景选择中层:怎...

在与大模型(LLM)交互时,很多人发现:对话越长,模型的回答就越容易产生冗余、复读或忽略关键指令。这并非偶然,大模型的注意力分配与人类的记忆模式高度相似。通过心理学中的首因效应(Primacy Effect)和近因效应(Recency Effect),我们可以找到优化输入顺...