清除 当前 2582 条 / 共 3572 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 6 小时前 微信公众号 · 42章经 · 5 天前 微信公众号 · DeepTech深科技 · 5 天前 微信公众号 · Founder Park · 5 天前 微信公众号 · FundaAI · 5 天前 微信公众号 · 九章智驾 · 5 天前 微信公众号 · 晚点LatePost · 5 天前 微信公众号 · 琢磨事 · 5 天前 微信公众号 · 甲子光年 · 5 天前
2026-05-05T01:31

LLM 插件 llm-echo 发布 0.5a0 版本,新增 -o thinking 1 选项,用于测试推理功能。该插件提供假模型,适用于编写自动化测试。

  • llm-echo 0.5a0 版本发布
  • 新增 -o thinking 1 选项用于测试推理功能
  • 该插件提供假模型用于自动测试
2026-05-05T00:46

John Gruber透露Y Combinator持有OpenAI约0.6%股份,基于OpenAI当前8520亿美元估值,该股份价值超过50亿美元。

  • Y Combinator持有OpenAI约0.6%股份
  • OpenAI当前估值8520亿美元
  • YC持股价值超50亿美元
2026-05-05T00:00

OpenAI扩展ChatGPT广告业务,推出测试版自助广告管理器,支持CPC竞价和增强测量工具,旨在保护隐私并确保广告与对话分离。

  • OpenAI推出ChatGPT广告自助管理平台测试版
  • 支持CPC竞价和增强测量工具
  • 广告系统设计保护用户隐私

IBM发布Granite 4.1系列LLM,包括3B、8B和30B三种尺寸,采用Apache 2.0开源许可。Unsloth提供了21个GGUF量化变体,文件大小从1.2GB到6.34GB,总计51.3GB。文章还提及该系列的训练过程详情。

  • IBM发布Granite 4.1系列LLM,有3B、8B、30B三种尺寸
  • Granite 4.1采用Apache 2.0开源许可
  • Unsloth提供21个GGUF量化变体,总大小51.3GB

Y Combinator宣布Jeff Dean将在Startup School 2026发表演讲。Jeff Dean是Google DeepMind和Google Research的首席科学家,曾主导Google多项基础设施革新,并于2011年共同创立Google Brain。

  • Jeff Dean将在Startup School 2026发表演讲。
  • Jeff Dean是Google DeepMind和Google Research首席科学家。

NVIDIA内部使用基于cuOpt的智能工作流优化供应链,该工具已开源,支持多智能体编排和GPU加速求解器,可在几分钟内完成优化,并提供预配置GPU环境供开发者试用。

  • NVIDIA内部使用cuOpt优化供应链
  • cuOpt已开源,支持多智能体编排
  • 提供预配置GPU环境供开发者试用

Deepseek V4 模型能够比其他开源模型更彻底地工作,包括自行编写测试并进行广泛验证。

  • Deepseek V4 能自动编写测试
  • Deepseek V4 能进行广泛验证

AI芯片制造商Cerebras正在筹备大规模IPO,估值可能达266亿美元或更高,该公司与OpenAI关系密切。

  • Cerebras即将进行IPO,估值可能达266亿美元以上
  • Cerebras与OpenAI存在深度合作关系

Runway发布实时视频代理功能Runway Characters,能将单张图片转化为实时视频角色。

  • Runway发布实时视频代理功能
  • 新功能名为Runway Characters
  • 可将一张图片转化为实时视频角色

据推特消息,GB300 ultra NVL72在vllm推理引擎上比GB200 NVL72快2.7倍。虽然理论性能提升仅1.5倍,但通过全栈优化实现了更高实际性能。该临时样机由英伟达、Inferact和CoreWeave提供用于开源项目。

  • GB300 ultra NVL72在vllm上比GB200 NVL72快2.7倍
  • 理论上GB300仅有1.5倍NVFP4 FLOP和1.5倍HBM容量
  • 性能提升源于全栈优化带来的复合增益

NVIDIA Megatron Core 新增对 Muon、MOP 和 REKLS 等优化器的支持,旨在提升 GB300 GPU 和 NVL72 系统上训练 Kimi K2、Qwen3 30B 等大模型的效率。

  • NVIDIA Megatron Core 支持 Muon 等高阶优化器
  • 针对 GB300 GPU 和 NVL72 系统优化训练效率
  • 用于训练 Kimi K2 和 Qwen3 30B 规模模型

OpenAI与普华永道(PwC)宣布合作,旨在通过AI代理帮助企业自动化财务工作流程、改进预测、加强控制,并现代化CFO职能。

  • OpenAI与PwC达成合作
  • 合作目标是用AI代理自动化财务工作流程

英伟达发布cuOpt Agent Skills,用于优化供应链决策系统,能够加速将业务问题转化为数学模型,应对需求波动和成本压力。

  • 英伟达推出cuOpt Agent Skills优化供应链决策系统
  • 该工具可加速业务问题转化为数学模型

一个名为nanowhale的小型DeepSeek模型被推出,该模型由智能体完全预训练,灵感来自Karpathy的nanochat。

  • nanowhale是一个小型DeepSeek模型,由agent完全预训练。
  • 该模型灵感来自Karpathy的nanochat项目。

美股延续强势,标普500创历史新高。Twilio财报超预期,股价盘后飙升24%并上调指引。AMD过去一月涨71%后遭分析师下调评级。31家REITs上调全年FFO指引。Celestica业绩超预期并上调预测。美联储主席更迭在即,Warsh与鲍威尔政策分歧引关注。

  • Twilio财报超预期,股价盘后飙升24%
  • AMD过去一月涨71%后遭分析师下调评级
  • 31家REITs上调全年FFO指引

NVIDIA宣布其Nemotron 3 Super模型在EnterpriseOps-Gym排行榜开源类别中排名第一。该排行榜通过1150项任务和512个功能工具评估企业级AI代理性能。

  • Nemotron 3 Super在EnterpriseOps-Gym开源类别中排名第一
  • 该排行榜基于1150项任务和512个功能工具评估

Vercel 创始人宣布开源一个用于深度安全审查的智能体编排工具 deepspec。该工具内部使用后,已在多个大型开源项目中发现关键漏洞。它针对 Vercel Sandbox 优化,可并行调度数千个智能体扫描代码库,将数月的工作缩短至几分钟。作者邀请用户尝试,并为开源项目提供赞助支持。

  • 开源深度安全审查工具 deepspec 发布
  • 工具可并行数千个智能体扫描代码库
  • 工具优化用于 Vercel Sandbox 环境

Appfigures数据显示,推出视觉模型的应用下载量增长是仅升级聊天机器人的6.5倍,但大多数应用未能将下载高峰转化为收入。

  • 视觉模型推出带来6.5倍下载增长
  • 多数应用未将下载峰值转化为收入

Shopify CEO Tobi Lütke 在采访中透露,公司超过50%的代码由AI生成,许多最佳工程师今年没有手动提交代码。内部开发了名为River的工具,在Slack中运行,承担了大量工程工作。

  • Shopify超过50%代码由AI生成
  • 最佳工程师今年未手动提交代码
  • 内部工具River负责大量工程工作

推文介绍nanowhale,一个由代理完全预训练的小型DeepSeek模型,灵感来自Karpathy的nanochat。

  • nanowhale是一个小型DeepSeek模型
  • 该模型由代理完全预训练

Amazon QuickSight 推出 Dataset Q&A 功能,支持自然语言数据集问答,用户无需构建新仪表板即可秒级获取答案,旨在解决传统 BI 仪表板无法灵活应对临时、多维问题的瓶颈。该功能面向 AWS 技术现场团队等用户,提升数据决策效率。

  • Amazon QuickSight 推出 Dataset Q&A 功能
  • 用户可用自然语言提问并秒级获得答案
  • 该功能无需构建新仪表板或等待 BI 团队

AWS 宣布 Amazon Bedrock AgentCore 推出新功能预览,包括基于生产痕迹的推荐、批量评估和A/B测试,以优化AI agent质量,解决agent性能退化问题。

  • Amazon Bedrock AgentCore 新增推荐功能,可从生产痕迹生成优化建议。
  • 新功能支持批量评估和A/B测试来验证优化建议。
  • AgentCore 旨在提供观测、评估、改进的闭环优化agent质量。

Amazon SageMaker AI推出智能体引导的模型定制工作流程,用户通过自然语言描述用例,AI编码助手自动完成数据准备、技术选择、微调、评估和部署,支持SFT、DPO、RLVR等技术,并生成可编辑的代码工件。

  • Amazon SageMaker AI发布智能体引导的模型定制功能
  • 支持自然语言描述用例,自动化微调全流程
  • 集成LLM-as-a-Judge评估和灵活部署到Bedrock或SageMaker

SemiAnalysis指出常见误解:TPU v8i并非训练芯片,而是推理芯片。v8i配备8组HBM3E 12-Hi显存,共288GB,带宽8.6 TB/s,而v8t为6组216GB、6.5 TB/s。v8i有384MB片上SRAM,v8t为128MB。FP4算力上,v8i为10.1 PFLOPs,v8t为12.6 PFLOPs。

  • TPU v8i配备8组HBM3E 12-Hi,共288GB显存,带宽8.6 TB/s
  • TPU v8t配备6组HBM3E,共216GB显存,带宽6.5 TB/s
  • TPU v8i的FP4算力为10.1 PFLOPs,v8t为12.6 PFLOPs

Anthropic 和 OpenAI 分别推出新举措,帮助企业在其组织内部署 AI 代理。该趋势尚处早期但预计将迅速扩大,涉及升级 IT 系统、调整工作流程以及管理人与代理的关系。

  • Anthropic 和 OpenAI 推出帮助企业部署 AI 代理的新举措
  • AI 代理进入知识工作领域,需升级 IT 系统和流程

Amazon Quick发布新的生成式AI功能,用户可通过自然语言提示从数据集生成包含多工作表、可视化、筛选器和计算字段的仪表板,大幅缩短制作时间。用户可审核编辑交互式计划后一键发布为仪表板。

  • Amazon Quick从自然语言提示生成多工作表仪表板
  • 功能包括自动选择可视化、添加筛选器和计算字段
  • 用户可审核编辑计划后一键发布

Sierra 完成 9.5 亿美元融资,至此公司可用资金超过 10 亿美元。Sierra 表示将利用这笔资金成为 AI 驱动客户体验的全球标准。

  • Sierra 完成 9.5 亿美元融资
  • 公司可用资金超过 10 亿美元
  • 计划成为 AI 客户体验的全球标准

OpenAI声称,马斯克在诉讼中发送短信,称如果OpenAI不和解,Altman和Brockman将成为美国最被憎恨的人。

  • 马斯克短信称OpenAI若不解散,Altman和Brockman将成最被憎恨的人

GStack v1.26.3版本现已与GBrain集成,使得编程代理能够获取比以往更多的上下文信息,提升了其智能性。

  • GStack v1.26.3版本与GBrain集成

Amazon Quick 现支持将 Amazon S3 Tables(Apache Iceberg 表)作为新数据源,用户可直接查询和可视化数据湖中的 Iceberg 表,无需中间层,减少数据移动、提升性能并保持单一真实来源。

  • Amazon Quick 引入 S3 Tables 作为新数据源
  • 用户可直接查询 Apache Iceberg 表,无需中间数据层
  • 新功能旨在减少数据移动,提升性能并保持单一真实来源

Amazon Quick 推出 Dataset Q&A 新功能,用户可直接用自然语言查询整个数据集,无需预配置。该功能将问题转化为 SQL 并快速返回结果,同时保持企业级安全与治理,解决了商业智能中临时查询的瓶颈问题。

  • Amazon Quick 新增 Dataset Q&A 功能
  • 支持自然语言查询完整数据集,无需预配置
  • 系统自动将问题转为 SQL 并确保安全权限

AWS宣布SageMaker AI推理端点支持容量感知实例池,允许用户定义优先级实例类型列表,在创建、扩展时自动fallback到可用实例,无需手动干预,适用于多种端点类型。

  • SageMaker AI推出容量感知实例池功能
  • 用户可定义多个优先级实例类型
  • 端点在创建、扩展时自动选择可用实例

Anthropic和OpenAI分别与资产管理公司成立合资企业,旨在更积极地向企业客户营销其AI服务产品。

  • Anthropic与资产管理公司合作推出企业AI服务合资企业
  • OpenAI与资产管理公司合作推出企业AI服务合资企业

@thorstenball 发推称 GPT-5.5 已在 Amp 上线,本人上周主要使用该模型,认为它兼具 Opus 的互动性和更少触发、更全面的优点。

  • GPT-5.5 已在 Amp 上线
  • @thorstenball 上周主要使用 GPT-5.5

AI数据中心热潮正在重塑美国电力供应链。电力设备需求增长推动供应增长,超大规模数据中心建设加速,但基础设施挑战持续存在。

  • 数据中心电力设备需求增长推动供应增长
  • 超大规模数据中心建设加速
  • 基础设施挑战持续存在
2026-05-04T15:07

亚马逊在负责任AI方面投入大量资源,建立了覆盖预训练、后训练、评估和第三方监控的RAI流程,开发了超过70个内部和外部RAI工具,发表了500多篇研究论文,并提供了数万小时的RAI培训。

  • 亚马逊建立覆盖预训练、后训练、评估和第三方监控的RAI流程
  • 亚马逊开发了超过70个内部和外部RAI工具
  • 亚马逊发表了500多篇RAI相关研究论文

Stripe的设计经理Owen Williams构建了内部AI原型工具Protodash,该工具基于Cursor规则、React组件和MCP集成,使设计师和产品经理能快速将设计系统转化为可点击的原型,从而加速从备忘录到可演示原型的流程,意外收获是产品经理成为主要用户。

  • Stripe设计经理Owen Williams开发了内部AI原型工具Protodash
  • Protodash基于Cursor规则、React组件和MCP集成
  • 该工具让设计师和PM在几分钟内制作生产质量原型

Expanse 推出新平台,利用空闲 GPU 容量,支持云和本地 HPC 环境,提供作业提交、优化和调试功能。

  • Expanse 推出释放浪费 GPU 容量的平台。
  • 平台支持云和本地 HPC 环境。
  • 提供作业提交、优化和调试功能。

Pollen Robotics的Reachy Mini无线版机器人已在新加坡上市。此消息源自推特转发,显示产品在新加坡市场正式推出。

  • Reachy Mini无线版在新加坡上市。
  • Pollen Robotics推出Reachy Mini无线版机器人。

Shopify CEO Tobi Lütke在播客中透露,AI现已生成Shopify超过50%的代码,且比例持续增长;许多顶级工程师自2023年12月以来未手动编写代码,而是转向AI代理的引导。他还讨论了AI被用作裁员替罪羊等话题。

  • Shopify超过50%的代码由AI生成,比例持续增长。
  • 许多顶级工程师自2023年12月未手动编写代码。

哈佛研究显示,Beth Israel医院用o1和真实医生进行76例急诊分诊测试,o1准确率67%,医生为50-55%。研究指出当前缺乏AI医疗问责框架。

  • o1在76个急诊分诊案例中准确率67%
  • 医生准确率为50-55%

第三方开发了一个Huggingface模型可视化工具,用户只需输入模型URL即可探索任意粒度的模型结构。该工具由@andrew_n_carr在社交媒体上推荐,获得大量关注。

  • 有人开发了Huggingface模型可视化工具
  • 工具可通过URL探索任意粒度模型

专家调研显示AppLovin 1Q26电商广告占比达32%,CTV首次贡献显著;Apple Link-out推动iOS游戏广告市场增长约5.5%,AppLovin及Unity受益。1Q26广告预算同比增长132.8%,超预期。

  • 1Q26 AppLovin电商广告占代理预算约32%
  • Apple Link-out使iOS游戏广告市场增长约5.5%
  • AppLovin 1Q26广告预算同比增长132.8%

本周财报显示谷歌、微软、亚马逊云均提高资本开支,云收入加速增长:GCP增长63%,Azure增长39%,AWS预计下季度加速。DeepSeek V4推动KV缓存从DRAM/HBM大规模迁移至SSD,成为NAND需求的结构性拐点。

  • 谷歌/微软/亚马逊云提高资本开支,云收入加速增长
  • GCP增长63%,Azure增长39%,AWS预期加速
  • DeepSeek V4推动KV缓存从DRAM/HBM迁移至SSD

哈佛大学研究显示,OpenAI的o1-preview模型在76个真实急诊病例中,诊断准确率高于两名主治医生。该模型仅使用原始电子健康记录文本,在分诊阶段准确率达67.1%,医生为63.2%。研究发表于《Science》。

  • 哈佛研究对比OpenAI o1-preview与两名医生在76个急诊病例中的诊断准确率
  • AI模型在分诊阶段准确率67.1%,高于医生的63.2%
  • 研究仅使用原始电子健康记录文本,未使用结构化数据

cover_image

AI时代需要什么样的团队

Original 李智勇 李智勇 琢磨事

极端值几乎百分百确定就是“无人公司”。

但在许许多多领域显然并不能一步到达“无人公司”,这时候就需要新的组织模式来适配AI这边高速增长是生产力。

那这种新模式是什么呢?

如果我们重新审视“人与技术”的协作关系,未来的团队一定是极简的:

一个人类角色加上一个AI,去覆盖一个完整的业务职能。

正如缝隙理论

  • AI时代需要什么样的团队
微信公众号 · 琢磨事 微信公众号 琢磨事 AI 半导体 投资研究

推文推荐Granite模型(新)和Gemma-E4B模型,适用于8-16GB显存硬件,附有链接。

  • 推文推荐Granite模型(新)和Gemma-E4B模型
  • 模型适用于8-16GB显存硬件

OpenAI重构了其WebRTC技术栈,以支持低延迟、全球规模的实时语音AI,并实现无缝的对话轮换。

  • OpenAI重构WebRTC栈以支持实时语音AI
  • 新架构实现低延迟和全球规模
  • 对话轮换无缝衔接

据报告,OpenAI未达到收入和用户目标,内部对数据中心支出承诺存在担忧。公司正在重组Stargate项目并筹备IPO。

  • OpenAI未达到收入和用户目标
  • 内部对数据中心支出承诺存在担忧
  • 公司正在重组Stargate项目并筹备IPO

2026年4月第二波AI模型架构发布,包括蚂蚁Ant Ling 2.6 1T、Minimax M2.7、小米MiMo V2.5、Poolside Laguna XS.2、腾讯Hy3-preview、IBM Granite 4.1等。

  • 蚂蚁发布Ant Ling 2.6 1T模型
  • Minimax发布M2.7模型
  • 小米、腾讯、IBM等发布新模型