LLM 插件 llm-echo 发布 0.5a0 版本,新增 -o thinking 1 选项,用于测试推理功能。该插件提供假模型,适用于编写自动化测试。
John Gruber透露Y Combinator持有OpenAI约0.6%股份,基于OpenAI当前8520亿美元估值,该股份价值超过50亿美元。
OpenAI扩展ChatGPT广告业务,推出测试版自助广告管理器,支持CPC竞价和增强测量工具,旨在保护隐私并确保广告与对话分离。
IBM发布Granite 4.1系列LLM,包括3B、8B和30B三种尺寸,采用Apache 2.0开源许可。Unsloth提供了21个GGUF量化变体,文件大小从1.2GB到6.34GB,总计51.3GB。文章还提及该系列的训练过程详情。
Y Combinator宣布Jeff Dean将在Startup School 2026发表演讲。Jeff Dean是Google DeepMind和Google Research的首席科学家,曾主导Google多项基础设施革新,并于2011年共同创立Google Brain。
NVIDIA内部使用基于cuOpt的智能工作流优化供应链,该工具已开源,支持多智能体编排和GPU加速求解器,可在几分钟内完成优化,并提供预配置GPU环境供开发者试用。
Deepseek V4 模型能够比其他开源模型更彻底地工作,包括自行编写测试并进行广泛验证。
AI芯片制造商Cerebras正在筹备大规模IPO,估值可能达266亿美元或更高,该公司与OpenAI关系密切。
Runway发布实时视频代理功能Runway Characters,能将单张图片转化为实时视频角色。
据推特消息,GB300 ultra NVL72在vllm推理引擎上比GB200 NVL72快2.7倍。虽然理论性能提升仅1.5倍,但通过全栈优化实现了更高实际性能。该临时样机由英伟达、Inferact和CoreWeave提供用于开源项目。
NVIDIA Megatron Core 新增对 Muon、MOP 和 REKLS 等优化器的支持,旨在提升 GB300 GPU 和 NVL72 系统上训练 Kimi K2、Qwen3 30B 等大模型的效率。
OpenAI与普华永道(PwC)宣布合作,旨在通过AI代理帮助企业自动化财务工作流程、改进预测、加强控制,并现代化CFO职能。
英伟达发布cuOpt Agent Skills,用于优化供应链决策系统,能够加速将业务问题转化为数学模型,应对需求波动和成本压力。
一个名为nanowhale的小型DeepSeek模型被推出,该模型由智能体完全预训练,灵感来自Karpathy的nanochat。
美股延续强势,标普500创历史新高。Twilio财报超预期,股价盘后飙升24%并上调指引。AMD过去一月涨71%后遭分析师下调评级。31家REITs上调全年FFO指引。Celestica业绩超预期并上调预测。美联储主席更迭在即,Warsh与鲍威尔政策分歧引关注。
NVIDIA宣布其Nemotron 3 Super模型在EnterpriseOps-Gym排行榜开源类别中排名第一。该排行榜通过1150项任务和512个功能工具评估企业级AI代理性能。
Vercel 创始人宣布开源一个用于深度安全审查的智能体编排工具 deepspec。该工具内部使用后,已在多个大型开源项目中发现关键漏洞。它针对 Vercel Sandbox 优化,可并行调度数千个智能体扫描代码库,将数月的工作缩短至几分钟。作者邀请用户尝试,并为开源项目提供赞助支持。
Appfigures数据显示,推出视觉模型的应用下载量增长是仅升级聊天机器人的6.5倍,但大多数应用未能将下载高峰转化为收入。
Shopify CEO Tobi Lütke 在采访中透露,公司超过50%的代码由AI生成,许多最佳工程师今年没有手动提交代码。内部开发了名为River的工具,在Slack中运行,承担了大量工程工作。
推文介绍nanowhale,一个由代理完全预训练的小型DeepSeek模型,灵感来自Karpathy的nanochat。
Amazon QuickSight 推出 Dataset Q&A 功能,支持自然语言数据集问答,用户无需构建新仪表板即可秒级获取答案,旨在解决传统 BI 仪表板无法灵活应对临时、多维问题的瓶颈。该功能面向 AWS 技术现场团队等用户,提升数据决策效率。
AWS 宣布 Amazon Bedrock AgentCore 推出新功能预览,包括基于生产痕迹的推荐、批量评估和A/B测试,以优化AI agent质量,解决agent性能退化问题。
Amazon SageMaker AI推出智能体引导的模型定制工作流程,用户通过自然语言描述用例,AI编码助手自动完成数据准备、技术选择、微调、评估和部署,支持SFT、DPO、RLVR等技术,并生成可编辑的代码工件。
SemiAnalysis指出常见误解:TPU v8i并非训练芯片,而是推理芯片。v8i配备8组HBM3E 12-Hi显存,共288GB,带宽8.6 TB/s,而v8t为6组216GB、6.5 TB/s。v8i有384MB片上SRAM,v8t为128MB。FP4算力上,v8i为10.1 PFLOPs,v8t为12.6 PFLOPs。
Anthropic 和 OpenAI 分别推出新举措,帮助企业在其组织内部署 AI 代理。该趋势尚处早期但预计将迅速扩大,涉及升级 IT 系统、调整工作流程以及管理人与代理的关系。
Amazon Quick发布新的生成式AI功能,用户可通过自然语言提示从数据集生成包含多工作表、可视化、筛选器和计算字段的仪表板,大幅缩短制作时间。用户可审核编辑交互式计划后一键发布为仪表板。
Sierra 完成 9.5 亿美元融资,至此公司可用资金超过 10 亿美元。Sierra 表示将利用这笔资金成为 AI 驱动客户体验的全球标准。
OpenAI声称,马斯克在诉讼中发送短信,称如果OpenAI不和解,Altman和Brockman将成为美国最被憎恨的人。
GStack v1.26.3版本现已与GBrain集成,使得编程代理能够获取比以往更多的上下文信息,提升了其智能性。
Amazon Quick 现支持将 Amazon S3 Tables(Apache Iceberg 表)作为新数据源,用户可直接查询和可视化数据湖中的 Iceberg 表,无需中间层,减少数据移动、提升性能并保持单一真实来源。
Amazon Quick 推出 Dataset Q&A 新功能,用户可直接用自然语言查询整个数据集,无需预配置。该功能将问题转化为 SQL 并快速返回结果,同时保持企业级安全与治理,解决了商业智能中临时查询的瓶颈问题。
AWS宣布SageMaker AI推理端点支持容量感知实例池,允许用户定义优先级实例类型列表,在创建、扩展时自动fallback到可用实例,无需手动干预,适用于多种端点类型。
Anthropic和OpenAI分别与资产管理公司成立合资企业,旨在更积极地向企业客户营销其AI服务产品。
@thorstenball 发推称 GPT-5.5 已在 Amp 上线,本人上周主要使用该模型,认为它兼具 Opus 的互动性和更少触发、更全面的优点。
AI数据中心热潮正在重塑美国电力供应链。电力设备需求增长推动供应增长,超大规模数据中心建设加速,但基础设施挑战持续存在。
亚马逊在负责任AI方面投入大量资源,建立了覆盖预训练、后训练、评估和第三方监控的RAI流程,开发了超过70个内部和外部RAI工具,发表了500多篇研究论文,并提供了数万小时的RAI培训。
Stripe的设计经理Owen Williams构建了内部AI原型工具Protodash,该工具基于Cursor规则、React组件和MCP集成,使设计师和产品经理能快速将设计系统转化为可点击的原型,从而加速从备忘录到可演示原型的流程,意外收获是产品经理成为主要用户。
Expanse 推出新平台,利用空闲 GPU 容量,支持云和本地 HPC 环境,提供作业提交、优化和调试功能。
Pollen Robotics的Reachy Mini无线版机器人已在新加坡上市。此消息源自推特转发,显示产品在新加坡市场正式推出。
Shopify CEO Tobi Lütke在播客中透露,AI现已生成Shopify超过50%的代码,且比例持续增长;许多顶级工程师自2023年12月以来未手动编写代码,而是转向AI代理的引导。他还讨论了AI被用作裁员替罪羊等话题。
哈佛研究显示,Beth Israel医院用o1和真实医生进行76例急诊分诊测试,o1准确率67%,医生为50-55%。研究指出当前缺乏AI医疗问责框架。
第三方开发了一个Huggingface模型可视化工具,用户只需输入模型URL即可探索任意粒度的模型结构。该工具由@andrew_n_carr在社交媒体上推荐,获得大量关注。
专家调研显示AppLovin 1Q26电商广告占比达32%,CTV首次贡献显著;Apple Link-out推动iOS游戏广告市场增长约5.5%,AppLovin及Unity受益。1Q26广告预算同比增长132.8%,超预期。
本周财报显示谷歌、微软、亚马逊云均提高资本开支,云收入加速增长:GCP增长63%,Azure增长39%,AWS预计下季度加速。DeepSeek V4推动KV缓存从DRAM/HBM大规模迁移至SSD,成为NAND需求的结构性拐点。
哈佛大学研究显示,OpenAI的o1-preview模型在76个真实急诊病例中,诊断准确率高于两名主治医生。该模型仅使用原始电子健康记录文本,在分诊阶段准确率达67.1%,医生为63.2%。研究发表于《Science》。
Original 李智勇 李智勇 琢磨事
极端值几乎百分百确定就是“无人公司”。
但在许许多多领域显然并不能一步到达“无人公司”,这时候就需要新的组织模式来适配AI这边高速增长是生产力。
那这种新模式是什么呢?
如果我们重新审视“人与技术”的协作关系,未来的团队一定是极简的:
一个人类角色加上一个AI,去覆盖一个完整的业务职能。
正如缝隙理论
推文推荐Granite模型(新)和Gemma-E4B模型,适用于8-16GB显存硬件,附有链接。
OpenAI重构了其WebRTC技术栈,以支持低延迟、全球规模的实时语音AI,并实现无缝的对话轮换。
据报告,OpenAI未达到收入和用户目标,内部对数据中心支出承诺存在担忧。公司正在重组Stargate项目并筹备IPO。
2026年4月第二波AI模型架构发布,包括蚂蚁Ant Ling 2.6 1T、Minimax M2.7、小米MiMo V2.5、Poolside Laguna XS.2、腾讯Hy3-preview、IBM Granite 4.1等。