2 llm-echo 0.5a0

2026-05-05T01:31

LLM 插件 llm-echo 发布 0.5a0 版本，新增 -o thinking 1 选项，用于测试推理功能。该插件提供假模型，适用于编写自动化测试。

llm-echo 0.5a0 版本发布
新增 -o thinking 1 选项用于测试推理功能
该插件提供假模型用于自动测试

3 Quoting John Gruber

2026-05-05T00:46

John Gruber透露Y Combinator持有OpenAI约0.6%股份，基于OpenAI当前8520亿美元估值，该股份价值超过50亿美元。

Y Combinator持有OpenAI约0.6%股份
OpenAI当前估值8520亿美元
YC持股价值超50亿美元

Simon Willison AI 公司

3 New ways to buy ChatGPT ads

2026-05-05T00:00

OpenAI扩展ChatGPT广告业务，推出测试版自助广告管理器，支持CPC竞价和增强测量工具，旨在保护隐私并确保广告与对话分离。

OpenAI推出ChatGPT广告自助管理平台测试版
支持CPC竞价和增强测量工具
广告系统设计保护用户隐私

OpenAI News 行业动态 AI

3 Granite 4.1 3B SVG Pelican Gallery

2026-05-04T23:49

IBM发布Granite 4.1系列LLM，包括3B、8B和30B三种尺寸，采用Apache 2.0开源许可。Unsloth提供了21个GGUF量化变体，文件大小从1.2GB到6.34GB，总计51.3GB。文章还提及该系列的训练过程详情。

IBM发布Granite 4.1系列LLM，有3B、8B、30B三种尺寸
Granite 4.1采用Apache 2.0开源许可
Unsloth提供21个GGUF量化变体，总大小51.3GB

Simon Willison AI 行业动态算力

3 @ycombinator: .@JeffDean is speaking at Startup School 2026. Jeff is the Chief Scientist at Google DeepMind and Google Research. He's been at the center ...

2026-05-04T22:44

Y Combinator宣布Jeff Dean将在Startup School 2026发表演讲。Jeff Dean是Google DeepMind和Google Research的首席科学家，曾主导Google多项基础设施革新，并于2011年共同创立Google Brain。

Jeff Dean将在Startup School 2026发表演讲。
Jeff Dean是Google DeepMind和Google Research首席科学家。

@ycombinator ↗ X 活动 AI

3 @NVIDIAAI: Internally at NVIDIA, we use cuOpt based agentic workflows with agent skills to optimize our supply chains. Since it’s open source, you can ...

2026-05-04T22:30

NVIDIA内部使用基于cuOpt的智能工作流优化供应链，该工具已开源，支持多智能体编排和GPU加速求解器，可在几分钟内完成优化，并提供预配置GPU环境供开发者试用。

NVIDIA内部使用cuOpt优化供应链
cuOpt已开源，支持多智能体编排
提供预配置GPU环境供开发者试用

@NVIDIAAI ↗ X AI 算力行业

3 @jeremyphoward: RT @ProximalHQ: Deepseek V4 works more thoroughly than other open source models: It writes its own tests and performs extensive validation.…

2026-05-04T22:29

Deepseek V4 模型能够比其他开源模型更彻底地工作，包括自行编写测试并进行广泛验证。

Deepseek V4 能自动编写测试
Deepseek V4 能进行广泛验证

@jeremyphoward ↗ X AI

3 OpenAI’s cozy partner Cerebras is on track for a blockbuster IPO

2026-05-04T21:53

AI芯片制造商Cerebras正在筹备大规模IPO，估值可能达266亿美元或更高，该公司与OpenAI关系密切。

Cerebras即将进行IPO，估值可能达266亿美元以上
Cerebras与OpenAI存在深度合作关系

TechCrunch AI AI 半导体行业

3 @c_valenzuelab: RT @runwayml: Real-time video agents are here. Today, we’re sharing how we built Runway Characters, allowing you to turn one image into a…

2026-05-04T21:17

Runway发布实时视频代理功能Runway Characters，能将单张图片转化为实时视频角色。

Runway发布实时视频代理功能
新功能名为Runway Characters
可将一张图片转化为实时视频角色

Cristóbal Valenzuela ↗ X AI 行业动态

3 @SemiAnalysis_: MINECRAFT STEVE ALERT: GB300 ultra NVL72 is already 2.7x faster 🚀 than GB200 NVL72 on one of the industry standard inference engine known a...

2026-05-04T21:00

据推特消息，GB300 ultra NVL72在vllm推理引擎上比GB200 NVL72快2.7倍。虽然理论性能提升仅1.5倍，但通过全栈优化实现了更高实际性能。该临时样机由英伟达、Inferact和CoreWeave提供用于开源项目。

GB300 ultra NVL72在vllm上比GB200 NVL72快2.7倍
理论上GB300仅有1.5倍NVFP4 FLOP和1.5倍HBM容量
性能提升源于全栈优化带来的复合增益

@SemiAnalysis_ ↗ X AI 算力行业

3 @NVIDIAAI: Training Kimi K2 and Qwen3 30B-scale models efficiently requires more than standard data-parallel tricks. NVIDIA Megatron Core now provides...

2026-05-04T21:00

NVIDIA Megatron Core 新增对 Muon、MOP 和 REKLS 等优化器的支持，旨在提升 GB300 GPU 和 NVL72 系统上训练 Kimi K2、Qwen3 30B 等大模型的效率。

NVIDIA Megatron Core 支持 Muon 等高阶优化器
针对 GB300 GPU 和 NVL72 系统优化训练效率
用于训练 Kimi K2 和 Qwen3 30B 规模模型

@NVIDIAAI ↗ X AI 算力行业动态

3 OpenAI and PwC collaborate to reimagine the office of the CFO

2026-05-04T21:00

OpenAI与普华永道（PwC）宣布合作，旨在通过AI代理帮助企业自动化财务工作流程、改进预测、加强控制，并现代化CFO职能。

OpenAI与PwC达成合作
合作目标是用AI代理自动化财务工作流程

OpenAI News AI 行业动态

3 Optimize Supply Chain Decision Systems Using NVIDIA cuOpt Agent Skills

2026-05-04T20:55

英伟达发布cuOpt Agent Skills，用于优化供应链决策系统，能够加速将业务问题转化为数学模型，应对需求波动和成本压力。

英伟达推出cuOpt Agent Skills优化供应链决策系统
该工具可加速业务问题转化为数学模型

NVIDIA Technical Blog AI 算力行业

3 @huggingface: RT @cmpatino_: Introducing nanowhale 🐳! A tiny DeepSeek model fully pretrained by an agent. Inspired by @karpathy's nanochat, we gave ml-i…

2026-05-04T20:55

一个名为nanowhale的小型DeepSeek模型被推出，该模型由智能体完全预训练，灵感来自Karpathy的nanochat。

nanowhale是一个小型DeepSeek模型，由agent完全预训练。
该模型灵感来自Karpathy的nanochat项目。

@huggingface ↗ X AI 行业

3 5月4日全球版 | 美联储主席更迭、私有信贷财报强劲、微软AI卖铲人策略

2026-05-04T20:07

美股延续强势，标普500创历史新高。Twilio财报超预期，股价盘后飙升24%并上调指引。AMD过去一月涨71%后遭分析师下调评级。31家REITs上调全年FFO指引。Celestica业绩超预期并上调预测。美联储主席更迭在即，Warsh与鲍威尔政策分歧引关注。

Twilio财报超预期，股价盘后飙升24%
AMD过去一月涨71%后遭分析师下调评级
31家REITs上调全年FFO指引

Alpha 派宏观行业财报美股 AI

3 @NVIDIAAI: Benchmarks should reflect real-world performance. That’s why we’re excited to share that Nemotron 3 Super has topped the open source catego...

2026-05-04T20:04

NVIDIA宣布其Nemotron 3 Super模型在EnterpriseOps-Gym排行榜开源类别中排名第一。该排行榜通过1150项任务和512个功能工具评估企业级AI代理性能。

Nemotron 3 Super在EnterpriseOps-Gym开源类别中排名第一
该排行榜基于1150项任务和512个功能工具评估

@NVIDIAAI ↗ X AI 行业动态

3 @rauchg: 𝚗𝚙𝚡 𝚍𝚎𝚎𝚙𝚜𝚎𝚌 We're introducing an open-source agent orchestrator for deep security reviews. We built it for internal use, and after running...

2026-05-04T19:41

Vercel 创始人宣布开源一个用于深度安全审查的智能体编排工具 deepspec。该工具内部使用后，已在多个大型开源项目中发现关键漏洞。它针对 Vercel Sandbox 优化，可并行调度数千个智能体扫描代码库，将数月的工作缩短至几分钟。作者邀请用户尝试，并为开源项目提供赞助支持。

开源深度安全审查工具 deepspec 发布
工具可并行数千个智能体扫描代码库
工具优化用于 Vercel Sandbox 环境

Guillermo Rauch ↗ X AI 算力

3 Image AI models now drive app growth, beating chatbot upgrades

2026-05-04T19:12

Appfigures数据显示，推出视觉模型的应用下载量增长是仅升级聊天机器人的6.5倍，但大多数应用未能将下载高峰转化为收入。

视觉模型推出带来6.5倍下载增长
多数应用未将下载峰值转化为收入

TechCrunch AI AI 行业动态

3 @HarryStebbings: What % of Shopify Code is AI and What Tools Has Shopify Built Internally: "It is a fair deal over 50%. Many of our best engineers have no...

2026-05-04T18:37

Shopify CEO Tobi Lütke 在采访中透露，公司超过50%的代码由AI生成，许多最佳工程师今年没有手动提交代码。内部开发了名为River的工具，在Slack中运行，承担了大量工程工作。

Shopify超过50%代码由AI生成
最佳工程师今年未手动提交代码
内部工具River负责大量工程工作

@HarryStebbings ↗ X 公司 AI

3 @ClementDelangue: RT @cmpatino_: Introducing nanowhale 🐳! A tiny DeepSeek model fully pretrained by an agent. Inspired by @karpathy's nanochat, we gave ml-i…

2026-05-04T18:01

推文介绍nanowhale，一个由代理完全预训练的小型DeepSeek模型，灵感来自Karpathy的nanochat。

nanowhale是一个小型DeepSeek模型
该模型由代理完全预训练

@ClementDelangue ↗ X AI 行业动态

3 Beyond BI: How the Dataset Q&A feature of Amazon Quick powers the next generation of data decisions

2026-05-04T17:46

Amazon QuickSight 推出 Dataset Q&A 功能，支持自然语言数据集问答，用户无需构建新仪表板即可秒级获取答案，旨在解决传统 BI 仪表板无法灵活应对临时、多维问题的瓶颈。该功能面向 AWS 技术现场团队等用户，提升数据决策效率。

Amazon QuickSight 推出 Dataset Q&A 功能
用户可用自然语言提问并秒级获得答案
该功能无需构建新仪表板或等待 BI 团队

AWS ML Blog AI 云计算行业

3 Introducing the agent quality loop: AgentCore Optimization now in preview

2026-05-04T17:13

AWS 宣布 Amazon Bedrock AgentCore 推出新功能预览，包括基于生产痕迹的推荐、批量评估和A/B测试，以优化AI agent质量，解决agent性能退化问题。

Amazon Bedrock AgentCore 新增推荐功能，可从生产痕迹生成优化建议。
新功能支持批量评估和A/B测试来验证优化建议。
AgentCore 旨在提供观测、评估、改进的闭环优化agent质量。

AWS ML Blog AI 云计算行业动态

3 Agent-guided workflows to accelerate model customization in Amazon SageMaker AI

2026-05-04T17:10

Amazon SageMaker AI推出智能体引导的模型定制工作流程，用户通过自然语言描述用例，AI编码助手自动完成数据准备、技术选择、微调、评估和部署，支持SFT、DPO、RLVR等技术，并生成可编辑的代码工件。

Amazon SageMaker AI发布智能体引导的模型定制功能
支持自然语言描述用例，自动化微调全流程
集成LLM-as-a-Judge评估和灵活部署到Bedrock或SageMaker

AWS ML Blog AI 云计算算力

3 @SemiAnalysis_: A common misconception is that TPU v8i must be the training chip because it has two compute dies. Die count is not the relevant metric, what...

2026-05-04T17:00

SemiAnalysis指出常见误解：TPU v8i并非训练芯片，而是推理芯片。v8i配备8组HBM3E 12-Hi显存，共288GB，带宽8.6 TB/s，而v8t为6组216GB、6.5 TB/s。v8i有384MB片上SRAM，v8t为128MB。FP4算力上，v8i为10.1 PFLOPs，v8t为12.6 PFLOPs。

TPU v8i配备8组HBM3E 12-Hi，共288GB显存，带宽8.6 TB/s
TPU v8t配备6组HBM3E，共216GB显存，带宽6.5 TB/s
TPU v8i的FP4算力为10.1 PFLOPs，v8t为12.6 PFLOPs

@SemiAnalysis_ ↗ X AI 算力半导体

3 @levie: Both Anthropic and OpenAI have new initiatives to help enterprises deploy AI agents within their organizations. This is a trend that’s early...

2026-05-04T16:54

Anthropic 和 OpenAI 分别推出新举措，帮助企业在其组织内部署 AI 代理。该趋势尚处早期但预计将迅速扩大，涉及升级 IT 系统、调整工作流程以及管理人与代理的关系。

Anthropic 和 OpenAI 推出帮助企业部署 AI 代理的新举措
AI 代理进入知识工作领域，需升级 IT 系统和流程

Aaron Levie ↗ X AI 行业动态

3 Generate dashboards from natural language prompts in Amazon Quick

2026-05-04T16:51

Amazon Quick发布新的生成式AI功能，用户可通过自然语言提示从数据集生成包含多工作表、可视化、筛选器和计算字段的仪表板，大幅缩短制作时间。用户可审核编辑交互式计划后一键发布为仪表板。

Amazon Quick从自然语言提示生成多工作表仪表板
功能包括自动选择可视化、添加筛选器和计算字段
用户可审核编辑计划后一键发布

AWS ML Blog AI 云计算行业动态

3 Sierra raises $950M as the race to own enterprise AI gets serious

2026-05-04T16:45

Sierra 完成 9.5 亿美元融资，至此公司可用资金超过 10 亿美元。Sierra 表示将利用这笔资金成为 AI 驱动客户体验的全球标准。

Sierra 完成 9.5 亿美元融资
公司可用资金超过 10 亿美元
计划成为 AI 客户体验的全球标准

TechCrunch AI 行业动态 AI 美股

3 Elon Musk sent ominous texts to Greg Brockman, Sam Altman after asking for a settlement, OpenAI claims

2026-05-04T16:36

OpenAI声称，马斯克在诉讼中发送短信，称如果OpenAI不和解，Altman和Brockman将成为美国最被憎恨的人。

马斯克短信称OpenAI若不解散，Altman和Brockman将成最被憎恨的人

TechCrunch AI 公司动态 AI

3 @garrytan: GStack v1.26.3 now works with GBrain, which means your coding agent now has much more context than it did before. https://t.co/DB6tQgjIZQ

2026-05-04T16:31

GStack v1.26.3版本现已与GBrain集成，使得编程代理能够获取比以往更多的上下文信息，提升了其智能性。

GStack v1.26.3版本与GBrain集成

Garry Tan ↗ X 动态 AI 云计算

3 From data lake to AI-ready analytics: Introducing new data source with S3 Tables in Amazon Quick

2026-05-04T16:12

Amazon Quick 现支持将 Amazon S3 Tables（Apache Iceberg 表）作为新数据源，用户可直接查询和可视化数据湖中的 Iceberg 表，无需中间层，减少数据移动、提升性能并保持单一真实来源。

Amazon Quick 引入 S3 Tables 作为新数据源
用户可直接查询 Apache Iceberg 表，无需中间数据层
新功能旨在减少数据移动，提升性能并保持单一真实来源

AWS ML Blog 云计算 AI

3 Introducing Dataset Q&A: Expanding natural language querying for structured datasets in Amazon Quick

2026-05-04T16:08

Amazon Quick 推出 Dataset Q&A 新功能，用户可直接用自然语言查询整个数据集，无需预配置。该功能将问题转化为 SQL 并快速返回结果，同时保持企业级安全与治理，解决了商业智能中临时查询的瓶颈问题。

Amazon Quick 新增 Dataset Q&A 功能
支持自然语言查询完整数据集，无需预配置
系统自动将问题转为 SQL 并确保安全权限

AWS ML Blog AI 云计算行业动态

3 Capacity-aware inference: Automatic instance fallback for SageMaker AI endpoints

2026-05-04T16:05

AWS宣布SageMaker AI推理端点支持容量感知实例池，允许用户定义优先级实例类型列表，在创建、扩展时自动fallback到可用实例，无需手动干预，适用于多种端点类型。

SageMaker AI推出容量感知实例池功能
用户可定义多个优先级实例类型
端点在创建、扩展时自动选择可用实例

AWS ML Blog AI 云计算算力

3 Anthropic and OpenAI are both launching joint ventures for enterprise AI services

2026-05-04T15:59

Anthropic和OpenAI分别与资产管理公司成立合资企业，旨在更积极地向企业客户营销其AI服务产品。

Anthropic与资产管理公司合作推出企业AI服务合资企业
OpenAI与资产管理公司合作推出企业AI服务合资企业

TechCrunch AI AI 行业公司

3 @thorstenball: Something to kick off the week: GPT-5.5 now in Amp. I've been using it pretty much exclusively last week. Very impressive and IMHO best of...

2026-05-04T15:34

@thorstenball 发推称 GPT-5.5 已在 Amp 上线，本人上周主要使用该模型，认为它兼具 Opus 的互动性和更少触发、更全面的优点。

GPT-5.5 已在 Amp 上线
@thorstenball 上周主要使用 GPT-5.5

Thorsten Ball ↗ X 行业 AI 动态

3 AI Data Center Boom Rewires US Power Supply Chain

2026-05-04T15:25

AI数据中心热潮正在重塑美国电力供应链。电力设备需求增长推动供应增长，超大规模数据中心建设加速，但基础设施挑战持续存在。

数据中心电力设备需求增长推动供应增长
超大规模数据中心建设加速
基础设施挑战持续存在

Data Center Knowledge 行业动态数据中心算力 AI

3 Building trust into AI

2026-05-04T15:07

亚马逊在负责任AI方面投入大量资源，建立了覆盖预训练、后训练、评估和第三方监控的RAI流程，开发了超过70个内部和外部RAI工具，发表了500多篇研究论文，并提供了数万小时的RAI培训。

亚马逊建立覆盖预训练、后训练、评估和第三方监控的RAI流程
亚马逊开发了超过70个内部和外部RAI工具
亚马逊发表了500多篇RAI相关研究论文

Amazon Science AI 动态研究云计算

3 🎙️ This week on How I AI: The internal AI tool that’s transforming how Stripe designs products

2026-05-04T15:01

Stripe的设计经理Owen Williams构建了内部AI原型工具Protodash，该工具基于Cursor规则、React组件和MCP集成，使设计师和产品经理能快速将设计系统转化为可点击的原型，从而加速从备忘录到可演示原型的流程，意外收获是产品经理成为主要用户。

Stripe设计经理Owen Williams开发了内部AI原型工具Protodash
Protodash基于Cursor规则、React组件和MCP集成
该工具让设计师和PM在几分钟内制作生产质量原型

Lenny's Newsletter AI 行业动态

3 @ycombinator: Expanse (@ExpanseCompute) unlocks wasted GPU capacity. Submit jobs with the right resources. Optimize them to run faster. Debug failures in ...

2026-05-04T15:00

Expanse 推出新平台，利用空闲 GPU 容量，支持云和本地 HPC 环境，提供作业提交、优化和调试功能。

Expanse 推出释放浪费 GPU 容量的平台。
平台支持云和本地 HPC 环境。
提供作业提交、优化和调试功能。

@ycombinator ↗ X AI 算力云计算

3 @ClementDelangue: RT @hoseta: Reachy Mini wireless has landed in Singapore! #ReachyMini @ClementDelangue https://t.co/27xAxg2OaP

2026-05-04T14:20

Pollen Robotics的Reachy Mini无线版机器人已在新加坡上市。此消息源自推特转发，显示产品在新加坡市场正式推出。

Reachy Mini无线版在新加坡上市。
Pollen Robotics推出Reachy Mini无线版机器人。

@ClementDelangue ↗ X 行业动态 AI

3 @HarryStebbings: I love Tobi Lütke but lets be honest, we have all heard him on several podcasts. This episode is @tobi like you have never seen before. Spi...

2026-05-04T14:07

Shopify CEO Tobi Lütke在播客中透露，AI现已生成Shopify超过50%的代码，且比例持续增长；许多顶级工程师自2023年12月以来未手动编写代码，而是转向AI代理的引导。他还讨论了AI被用作裁员替罪羊等话题。

Shopify超过50%的代码由AI生成，比例持续增长。
许多顶级工程师自2023年12月未手动编写代码。

@HarryStebbings ↗ X 行业 AI 公司

3 @gregisenberg: THIS HARVARD STUDY JUST PUT AN LLM AHEAD OF ER DOCTORS Beth Israel gave o1 and real doctors the same 76 ER triage cases. o1: 67%. Doctors: ...

2026-05-04T14:00

哈佛研究显示，Beth Israel医院用o1和真实医生进行76例急诊分诊测试，o1准确率67%，医生为50-55%。研究指出当前缺乏AI医疗问责框架。

o1在76个急诊分诊案例中准确率67%
医生准确率为50-55%

@gregisenberg ↗ X AI 行业研究

3 @huggingface: RT @andrew_n_carr: somebody made a huggingface model visualizer!! just plug in the url and explore at any granularity https://t.co/QH4vGPNP…

2026-05-04T13:38

第三方开发了一个Huggingface模型可视化工具，用户只需输入模型URL即可探索任意粒度的模型结构。该工具由@andrew_n_carr在社交媒体上推荐，获得大量关注。

有人开发了Huggingface模型可视化工具
工具可通过URL探索任意粒度模型

@huggingface ↗ X AI 行业动态

3 Preview|APP 1Q26: No META Impact Observed; E-Commerce Reaccelerating After 1Q26 QoQ Decline; Gaming Growth Robust

2026-05-04T13:35

专家调研显示AppLovin 1Q26电商广告占比达32%，CTV首次贡献显著；Apple Link-out推动iOS游戏广告市场增长约5.5%，AppLovin及Unity受益。1Q26广告预算同比增长132.8%，超预期。

1Q26 AppLovin电商广告占代理预算约32%
Apple Link-out使iOS游戏广告市场增长约5.5%
AppLovin 1Q26广告预算同比增长132.8%

FundaAI 行业调研 AI 动态

3 Weekly|Cloud Acceleration Confirmed, CSP Capex Raised, DeepSeek V4 Triggers NAND Inflection, Tiktok, LITE & COHR, TPU CoWoS Raised, RKLB, PLTR, AXTI

2026-05-04T13:18

本周财报显示谷歌、微软、亚马逊云均提高资本开支，云收入加速增长：GCP增长63%，Azure增长39%，AWS预计下季度加速。DeepSeek V4推动KV缓存从DRAM/HBM大规模迁移至SSD，成为NAND需求的结构性拐点。

谷歌/微软/亚马逊云提高资本开支，云收入加速增长
GCP增长63%，Azure增长39%，AWS预期加速
DeepSeek V4推动KV缓存从DRAM/HBM迁移至SSD

FundaAI 行业 AI 数据中心云计算算力

3 AI shows its skills in the emergency room

2026-05-04T09:00

哈佛大学研究显示，OpenAI的o1-preview模型在76个真实急诊病例中，诊断准确率高于两名主治医生。该模型仅使用原始电子健康记录文本，在分诊阶段准确率达67.1%，医生为63.2%。研究发表于《Science》。

哈佛研究对比OpenAI o1-preview与两名医生在76个急诊病例中的诊断准确率
AI模型在分诊阶段准确率67.1%，高于医生的63.2%
研究仅使用原始电子健康记录文本，未使用结构化数据

The Rundown AI 行业 AI

3 AI时代需要什么样的团队

2026-05-04T07:30

cover_image

AI时代需要什么样的团队

Original 李智勇李智勇琢磨事

极端值几乎百分百确定就是“无人公司”。

但在许许多多领域显然并不能一步到达“无人公司”，这时候就需要新的组织模式来适配AI这边高速增长是生产力。

那这种新模式是什么呢？

如果我们重新审视“人与技术”的协作关系，未来的团队一定是极简的：

一个人类角色加上一个AI，去覆盖一个完整的业务职能。

正如缝隙理论

AI时代需要什么样的团队

微信公众号 · 琢磨事微信公众号琢磨事 AI 半导体投资研究

2 @huggingface: RT @0xSero: Weekly best models for your hardware: ~~ 8 to 16gb ~~ Granite models are amazing: [NEW] - https://t.co/EWYMmJO0cF Gemma-E4B…

2026-05-04T00:21

推文推荐Granite模型（新）和Gemma-E4B模型，适用于8-16GB显存硬件，附有链接。

推文推荐Granite模型（新）和Gemma-E4B模型
模型适用于8-16GB显存硬件

@huggingface ↗ X AI 动态

3 How OpenAI delivers low-latency voice AI at scale

2026-05-04T00:00

OpenAI重构了其WebRTC技术栈，以支持低延迟、全球规模的实时语音AI，并实现无缝的对话轮换。

OpenAI重构WebRTC栈以支持实时语音AI
新架构实现低延迟和全球规模
对话轮换无缝衔接

OpenAI News AI 算力

3 OpenAI missed revenue and user targets, faces internal concern over meeting data center spend commitments - report

2026-05-03T18:29

据报告，OpenAI未达到收入和用户目标，内部对数据中心支出承诺存在担忧。公司正在重组Stargate项目并筹备IPO。

OpenAI未达到收入和用户目标
内部对数据中心支出承诺存在担忧
公司正在重组Stargate项目并筹备IPO

DCD AI 行业动态

3 @rasbt: Here is a 2nd batch of April architecture drops. What a month! - Ant Ling 2.6 1T - Minimax M2.7 - Xiaomi MiMo V2.5 - Poolside Laguna XS.2 - ...

2026-05-03T17:17

2026年4月第二波AI模型架构发布，包括蚂蚁Ant Ling 2.6 1T、Minimax M2.7、小米MiMo V2.5、Poolside Laguna XS.2、腾讯Hy3-preview、IBM Granite 4.1等。

蚂蚁发布Ant Ling 2.6 1T模型
Minimax发布M2.7模型
小米、腾讯、IBM等发布新模型

@rasbt ↗ X AI 行业动态