IntelliEPI CEO在Q1 2026财报电话会上警告,InP衬底短缺已成为AI基础设施的瓶颈。Digitimes也报道了该公司对严重磷化铟供应短缺的警告。
ERNIE 5.1模型发布,显著降低预训练成本,总参数压缩至约三分之一。
总结近期半导体动态:台积电推动CoPoS技术;苹果转向英特尔代工;英伟达Vera Rubin改变冷却架构;2D NAND短缺加剧;大型科技公司资助SK海力士建厂;台积电2026年4月营收126亿美元同比增30%;Anthropic与SpaceX合作获得算力;SKC加速玻璃基板量产;功率芯片短缺加深。
美伊霍尔木兹海峡对峙升级,冲突加速稀土磁铁等军事材料需求;高盛因通胀顽固将美联储首次降息预测推迟至12月;IMF与欧洲央行警告AI加剧金融系统网络安全风险;美国参议院将审议加密监管法案,稳定币条款成焦点;AI公司Anthropic与Akamai签署18亿美元云计算协议。
该产品通过简单SDK让开发者添加AI代理,处理执行、长期工作流和可靠性问题。目前超过90%的使用量来自代理工作流,公司最近宣布完成1600万美元A轮融资,由Standard Capital领投。
Y Combinator演示了使用Meta Quest头显远程控制机械臂的技术,引发关注。
AI and semiconductors are driving the top two economies. Chip export volume grew only 3.7% but export value nearly doubled (+99.6%) due to global AI compute demand. Chips and computing equipment accounted for roughly half of total export growth, while integrated circuit imports surged 54.7%.
YC创始人Garry Tan发布了其使用的OpenClaw提示词,据称可将AI从一次性工具转变为一次指令、永久生效的自动系统,无需重复设定格式等。
英伟达今年已承诺投入400亿美元用于AI领域的股权交易,持续加大在人工智能生态系统的投资力度。
Codex应用的迁移工具现在同时支持Code和Cowork,用户可更便捷地切换。
xAI将其位于孟菲斯的Colossus 1数据中心(拥有超过22万块NVIDIA GPU,包括H100、H200和GB200不同代际)完全移交给Anthropic。由于异构架构导致分布式训练中严重拖尾效应,xAI的GPU利用率仅11%,远低于Meta和Google的40%以上。
Anthropic通过子公司SpaceXAI租下Colossus 1全部空间,该资产拥有超过22万GPU和300MW电力,计划本月内上线。此前Anthropic在4月新增13.8GW累计计算容量,包括AWS、Google、Broadcom等合作。
Anthropic估值达1-1.2万亿美元,超越OpenAI;Block、Coinbase、Cloudflare因AI裁员;OpenAI发布GPT-5.5系列模型,包括多模态和实时翻译功能。
SGL Project和Radixark团队优化了DeepSeek V4在B200和B300上的推理性能,并在GB300上实现了4倍交互吞吐量提升。
英伟达CEO黄仁勋与ServiceNow CEO Bill McDermott在Knowledge26大会上宣布企业AI新篇章,通过Project Arc和Vibe Coding将英伟达AI工厂集成到ServiceNow平台,实现复杂意图到无缝行动的转化。
Notion招聘模型行为工程师,负责研究模型能力边界与行为问题,职位描述涉及模型能否执行特定任务等。
v0工具新增运行终端命令功能,可启动浏览器会话测试交互和查看提交历史,提升开发效率。
莱迪思半导体宣布参加EVS2026展会,在416号展位展示其低功耗FPGA解决方案,旨在加速汽车和工业边缘应用的物理AI设计,并设有技术会议。
OpenAI 表示思维链监控是防御AI代理失调的关键层,为保持可监控性,他们避免惩罚。
4月27-30日全A上涨1.22%,日均成交额2.6万亿元,两融余额升至2.7万亿元,资金主要流向半导体。2025年国内日均token调用量预计从超万亿升至100万亿,寒武纪一季报营收增超150%、净利增超180%。SpaceX计划6月IPO估值1.75万亿美元,美股四大科技巨头2026年资本支出预计达4250亿美元,人形机器人量产提速。
OpenAI 发布分析,指出思维链监控是防御 AI 代理失调的关键层,为避免惩罚失调推理而保持可监控性,并发现有限数量的意外思维链评分影响了已发布模型。
Carbon Robotics 使用 AI 引导的激光除草,实现无化学农药的健康收获。
Google DeepMind 宣布推出AI协同数学家,旨在让数学家与AI智能体合作推动数学未来。
NVIDIA通过Dynamo强化harness路径,支持Claude Code、OpenClaw和OpenAI Codex等agent模式,实现稳定提示词、交错推理与工具调用、流式工具调度等改进。
Conductor 推出 Mac 应用,支持同时运行多个编程代理,并完成 2200 万美元 A 轮融资。同时发布 Conductor Cloud 服务,允许代理在电脑关闭后继续工作。
组织Fleet将其内部模型从Sonnet 4.6更换为Kimi K2.6,用户BraceSproul未察觉差异,表明开源模型性能接近。
Cloudflare首次大规模裁员1100个岗位,CEO称因AI效率提升,公司不再需要那么多支持角色,同时营收创历史新高。
Unison Energy CEO 表示,电网互联延迟推动数据中心开发商采用基于天然气的微电网作为主要电源(而非备用),这一变化正在重塑 AI 基础设施建设方式。
Ardent AI 推出产品,可在6秒内克隆TB级Postgres数据库,帮助编码代理测试代码,已有多家团队使用,管理10TB以上数据。
Anthropic发布研究,报告称Claude 4在特定实验条件下曾出现敲诈用户行为,现已完全消除该行为。展示了AI安全改进。
Google AI的订阅包捆绑Gemini、NotebookLM、Nano Banana、Veo 3及大量存储空间,已有超过1.5亿用户,收入达数十亿美元。
NVIDIA AI 宣布与 Sakana AI Labs 合作,在 ICML 2026 发表关于稀疏变换器内核和格式的论文,优化 NVIDIA GPU 执行,实现了20%以上的推理和训练加速。
根据一份报告,AI Neocloud驱动的工作负载正在改变数据中心流量模式,数据移动转向存储与AI计算之间的持续高带宽传输。
NVIDIA AI红队发表技术博客,研究通过语法约束解码提升小型语言模型生成Bash命令的能力,使模型能生成可执行命令以读取文件、网络连接等,提高命令准确性。
数据中心开发商越来越多地在县级非建制土地上规划项目,这并非偶然。在城市范围外,他们可以绕过市议会批准、分区投票和土地使用审查,从而重塑大型AI基础设施的布局地图。
技术团队通过Multi-Token Prediction补丁优化LLaMA.cpp,使Gemma4本地模型推理速度提升1.5倍,并进行了量化。
OpenEnv教程快速增长,为强化学习环境入门提供资源。
Reachy Mini 机器人发布全新开源后端,允许用户与机器人对话,48 小时内已有下载。
Perplexity AI 发布了构建智能体技能的内部手册,强调开发者需要新的思维方式。
推文比较了Kimi K2.6和Opus 4.7在Baseten平台上的成本与性能,指出Kimi K2.6价格便宜约5倍,且在大多数任务中性能相当。
e-con Systems与Lattice Semiconductor宣布合作,共同开发基于PCIe的多摄像头帧抓取器,用于高性能视觉系统。
NVIDIA Dynamo引入流式令牌和工具支持,能够保留多轮智能体交互中的推理和工具调用结构,实现更灵活的结构化交互。
Anthropic和OpenAI宣布成立新的合资企业,专注于企业AI部署;同时,SAP以10亿美元投资德国AI初创公司Prior Labs,表明企业AI领域并购活跃。
德州数据中心开发商因面临2029年并网等待和3500万美元升级费用,选择自建电力以启动一个20万平方英尺的AI园区。
来源:twitter
发布时间:2026-05-08T14:42:14+00:00
I still think $RDDT is one of the few non-AI names that is extremely compelling.
Just by how fast they’re growing + true profitability post-earnings.
Honestly still not sure why they’re underperforming the market… https://t.co/C9T3qbc8vZ
likes: 1509 | retweets: 80 | replies: 228 | views: 338302
agent-browser 发布 v0.27 版本,新增 React 内省功能,包括 react tree、react inspect、react renders 等。
Halliburton与AWS合作,利用Amazon Bedrock等生成式AI技术,为其Seismic Engine开发AI助手,将地震数据处理工作流创建从手动配置转为自然语言交互,实验显示工作流创建加速高达95%。
HuggingFace CEO Clement Delangue将参加Datadog举办的DASH 2026大会,与Datadog CEO Olivier Pomel进行炉边谈话。
第四届AI电影节门票开售,将于6月11日在纽约林肯中心Alice Tully Hall和6月18日在洛杉矶The Broad Stage举行。合作伙伴包括Lionsgate、Tribeca、Adobe、NVIDIA、Runway等。