清除 当前 2582 条 / 共 3572 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 6 小时前 微信公众号 · 42章经 · 5 天前 微信公众号 · DeepTech深科技 · 5 天前 微信公众号 · Founder Park · 5 天前 微信公众号 · FundaAI · 5 天前 微信公众号 · 九章智驾 · 5 天前 微信公众号 · 晚点LatePost · 5 天前 微信公众号 · 琢磨事 · 5 天前 微信公众号 · 甲子光年 · 5 天前

xAI宣布放弃JAX GPU,转而自研C语言训练框架。报告称xAI的JAX堆栈MFU低于10%,NVIDIA JAX团队两年支持但失败。

  • xAI宣布放弃JAX GPU,自研C训练框架。
  • xAI的JAX堆栈MFU低于10%。
  • NVIDIA JAX团队两年支持xAI但失败。

HUD宣布为RSI黑客马拉松提供强化学习环境,活动将于6月20-21日在旧金山举行。

  • HUD为RSI黑客马拉松提供RL环境
  • 活动于6月20-21日在旧金山举行

NVIDIA AI 发布了 DeepSeek-V4-Pro-NVFP4 的固定版本,这是一个重要的人工智能模型更新。

  • NVIDIA AI 发布了 DeepSeek-V4-Pro-NVFP4 的固定版本

Anthropic发布了Claude Opus 4.8,社区评测显示增量改进但非主导。同时推出平台级变化如对话中系统指令编辑,以及AIE的Forward Deployed Engineer和Founders项目,包括YCombinator联合的创业竞赛。

  • Anthropic发布Claude Opus 4.8,多维度评测显示增量改进。
  • Anthropic推出对话中系统指令编辑等平台级变化。
  • AIE推出Forward Deployed Engineer和Founders项目,与YCombinator合作。

字节跳动AI for Science团队正在进行重组,由资深工程师杨振远负责。杨振远是字节跳动任职时间最长的工程师之一。

  • 字节跳动AI4S团队正在进行重组
  • AI4S团队由资深工程师杨振远负责

Twitter用户指出,NVIDIA Blackwell GPU在机密计算模式下不支持NVLink multicast,导致SGLang Qwen3.5模型性能下降61%。同时,Hopper的机密计算也被曝NVLink未加密。

  • Blackwell机密计算不支持NVLink multicast,Qwen3.5性能降61%
  • Hopper机密计算中NVLink未加密(据NVIDIA白皮书)

NVIDIA发布DynoSim仿真工具,用于模拟LLM服务的Pareto前沿,帮助优化模型后端、张量并行、预填充/解码拆分等多层交互的配置选择,解决现代LLM服务调优难题。

  • NVIDIA发布DynoSim仿真工具
  • DynoSim用于模拟LLM服务的Pareto前沿
  • 该工具帮助优化多层交互的配置选择

NVIDIA发布Metropolis Blueprint视频搜索与摘要的agent技能和模块化架构,可部署于兼容编码agent,将视频转化为可搜索、可行动的情报,用户通过自然语言提问获得剪辑、摘要和答案,无需手动配置多个微服务。

  • NVIDIA发布Metropolis Blueprint视频搜索与摘要的agent技能和模块化架构
  • 该方案消除手动配置微服务,通过聊天界面搜索视频

英伟达CEO黄仁勋与戴尔CEO迈克尔·戴尔在拉斯维加斯Dell TechWorld上共同启动活动,介绍戴尔AI工厂与英伟达如何帮助企业构建、运行和扩展AI。现场演示了NemoClaw支持端侧AI以及机器人物理AI,展示了企业级AI用例。

  • 黄仁勋与迈克尔·戴尔共同启动Dell TechWorld活动
  • 双方展示戴尔AI工厂与英伟达的AI解决方案

Angstrom_ai与AstraZeneca合作发布论文,评估新模型CS...,具体细节未披露。

  • Angstrom_ai与AstraZeneca合作发布新模型评估论文

NVIDIA AI转发消息,Harvey和Trajectory Labs对Nemotron 3 Super模型进行后训练应用于复杂法律任务,取得初步印象深刻结果,模型具有可审计权重、安全性和清晰来源。

  • Nemotron 3 Super被后训练用于复杂法律任务。
  • 后训练由Harvey和Trajectory Labs完成,结果印象深刻。

隔夜美股科技股强劲,标普500和纳指创历史新高。Dell业绩超预期,AI服务器订单额244亿美元,股价飙升近40%。三星开始出货12层HBM4E内存样品。蓝色起源新格伦火箭测试中爆炸。零售股分化,Gap等指引疲软下跌。

  • 标普500和纳斯达克指数创历史新高,连续第九周上涨
  • Dell AI服务器订单额244亿美元,积压订单513亿美元
  • 三星开始向客户出货12层HBM4E内存样品

OpenAI推出实时翻译功能,支持70多种输入语言和13种输出语言,用户可通过说话实现即时翻译。

  • OpenAI发布实时翻译功能
  • 支持70多种输入语言
  • 支持13种输出语言

LangChain发布LangSmith Fleet,支持用户用日常语言创建无代码代理,用于实际工作。

  • LangChain发布LangSmith Fleet,支持无代码agent创建
  • 用户可用日常语言构建agent

一条来自Twitter的推文宣布了Windows上Codex用户的重大升级,获得高互动量。

  • Codex在Windows上获得重大升级

OpenAI宣布Codex的Computer use功能现已支持Windows系统,用户可以通过ChatGPT移动应用远程控制Windows电脑执行任务,目前为早期体验阶段。

  • Codex现在支持在Windows系统上执行计算机操作
  • ChatGPT移动应用中的Codex可远程控制Windows电脑

理想汽车在1Q26业绩交流电话会中披露,一季度总收入230亿元,毛利率7.9%,1-4月重夺20万以上新能源品牌销冠,累计交付超166万辆。新L9 Luxe版获超万订单,自研5nm马赫M100芯片已上车,自建超充站超4000座。预计二季度毛利率恢复至10%,全年目标销量增20%、毛利率15%,年内推新L8、纯电I9,Q3新L9进入中东中亚,下半年智驾能力有望追平特斯拉FSD V14北美水平。

  • 一季度总收入230亿元,毛利率7.9%
  • 新L9上市两周Luxe版获超万订单
  • 自研5nm马赫M100芯片已上车

LangChain发布LangSmith Signal报告,称三分之一的AI团队使用了开放权重模型,显示开源模型在行业中的采用率正在上升。

  • LangChain报告称1/3的AI团队运行了开放权重模型

abidlabs 在推特上分享,本周成功将 GitHub Actions 的工作流从默认 CI runners 迁移至 HuggingFace Jobs,运行速度显著提升。

  • abidlabs 将 GitHub Actions 切换到 HuggingFace Jobs
  • 工作流运行速度得到提升

Box创始人Aaron Levie指出公司用AI替代员工的现象为“AI幻觉”。ClickUp裁减22%员工由AI代理替代,2026年科技行业裁员人数已接近2025年全年总和。

  • ClickUp裁减22%员工,由AI代理替代。
  • 2026年科技行业裁员人数接近2025年全年。

AI芯片初创公司Groq据报正寻求6.5亿美元内部融资,并计划从硬件转向专注于AI推理领域。

  • Groq寻求6.5亿美元内部融资
  • Groq从硬件转向AI推理

a16z发布推特称,IT资本支出正接近标普所有资本支出的40%,并附有本周图表链接。

  • IT资本支出占标普所有资本支出近40%

SemiAnalysis研究指出,在ERCOT地区,AI运营商的数据中心互连请求与电网实际核准能力之间存在巨大差距,反映了电力危机中供需不匹配。

  • 在ERCOT,数据中心互连请求与电网承保意愿存在差距
  • 该差距揭示了AI运营商建设计划与电网审批能力的错配

NVIDIA祝贺Teton Ridge和Cowboy+的AIQ项目获得体育艾美奖提名,并宣布Palantir Technologies集成NVIDIA软件,构建端到端实时视频分析系统,已在FOX的The American节目中直播运行。

  • AIQ项目获得体育艾美奖提名
  • Palantir集成NVIDIA软件用于实时视频分析系统
  • 系统在FOX的The American节目中直播运行

推特消息称,用户 @nasch 在消费级 AMD 显卡上运行 Qwen3.6 27B 模型,推理速度达到 87 tok/s,展示了 AI 本地推理的性能进展。

  • 在消费级 AMD 显卡上,Qwen3.6 27B 模型推理速度达 87 tok/s

小鹏汽车2026年一季报业绩交流显示,一季度毛利率优于预期,二季度预计维持20%左右;X9旗舰版订单占比超八成,品牌高端化突破;4月出口6000台,预计四季度海外月销过万,全年海外销量有望增3倍;Robotaxi三季度将在广州载客运营,机器人量产冲刺阶段,预计年底工厂投产。

  • 小鹏汽车一季度毛利率优于预期,二季度预计维持20%左右
  • X9旗舰版订单占比超八成,品牌高端化取得突破
  • 4月出口6000台,预计四季度海外月销过万

OpenBMB发布了1500万个样本,可用于微调AI模型,使得GPT-4o级别的模型能够在手机或笔记本上运行。

  • OpenBMB发布1500万个样本用于微调AI模型

MLCC市场整体规模1500亿美元,2025年服务器MLCC市场13亿美元(AI服务器6亿,通用服务器7亿)。AI服务器MLCC市场CAGR超80%,通用服务器MLCC市场CAGR 30-40%。智能手机MLCC市场2026-27年负增长。高镍和银价上涨导致涨价,高端MLCC交期超20周。Murata等厂商扩产或影响格局。

  • MLCC整体市场规模1500亿美元,服务器MLCC市场2025年达13亿美元
  • AI服务器MLCC市场CAGR超80%,通用服务器MLCC市场CAGR 30-40%
  • 高镍和银价上涨推高MLCC价格,高端MLCC交货周期超20周

OpenAI 目前有超过 700 个开放职位,覆盖多个领域。

  • OpenAI 有 700 多个开放职位

llama.cpp项目推出了官方网站,旨在让本地AI人人可用。

  • llama.cpp项目推出官方网站。

llama.cpp 项目宣布推出官方网站,目标让本地 AI 易于访问,推动本地 AI 普及。

  • llama.cpp 推出官方网站

pibot项目实现全本地运行,采用Parakeet进行语音识别,Qwen3-TTS进行语音合成,并整合Qwen 3.6多模态大模型,全部在本地部署完成。

  • pibot实现全本地运行
  • 使用Parakeet STT、Qwen3-TTS和Qwen 3.6多模态LLM

Cognition公司开发的AI编码代理Devin被认为是首个且最成功的AI编码代理,但其CEO Scott Wu表示该工具并非旨在取代人类程序员,而是辅助人类。

  • Cognition公司开发了AI编码代理Devin。
  • CEO Scott Wu称Devin不是设计来取代人类程序员。

a16z指出,超大规模企业越来越多地通过债务融资来支撑人工智能基础设施的巨额资本开支。

  • 超大规模企业用债务融资支撑AI资本开支

DraftedAI发布新功能,用户可快速生成房屋平面图、立面图和3D设计。过去一个月,12万人使用该工具生成了超过32.5万个房屋设计。

  • DraftedAI能快速生成房屋平面图、立面图和3D设计
  • 过去一个月12万人生成了32.5万+个房屋设计

YC正在建立反无人机生态系统,涉及两家初创公司:PerseusDefense开发制导导弹击落无人机,9Mothers利用AI技术参与其中。内容来源于个人推特转发,信息初步且不完整。

  • YC正在构建反无人机生态系统
  • PerseusDefense开发制导导弹击落无人机
  • 9Mothers利用AI技术参与反无人机

LangSmith LLM Gateway 新增功能,可在请求到达模型前强制执行支出限制和脱敏个人身份信息,提升AI应用的安全性和成本控制能力。

  • LangSmith LLM Gateway 支持在请求到达模型前强制执行支出限制和PII脱敏。

GigaAI联合创始人Varun Vummadi在Startup School India分享创业经历,公司为DoorDash、一家大型加密货币交易所和全球前三电信商提供AI客服,8人团队击败400人竞争者赢得DoorDash合同。

  • GigaAI为DoorDash、大型加密货币交易所和全球前三电信商提供AI客服
  • 8人团队击败400人竞争者赢得DoorDash合同
  • Varun曾拒绝高薪量化工作去创业

Hugging Face CEO表示,平台上50%的模型和数据集是私有的,该比例因企业使用其S3替代产品buckets而持续增长,更多公司开始内部构建AI而非依赖外部API。

  • Hugging Face上50%模型和数据集为私有
  • 私有比例因buckets产品增长而上升
  • 更多企业转向内部AI开发

OpenAI宣布加速生物防御进展,推出Rosalind Biodefense项目,帮助受信任的开发者构建生物防御和流行病应对能力;同时向美国政府及盟友扩展GPT-Rosalind的访问权限,以支持公共卫生和生物防御任务。

  • OpenAI推出Rosalind Biodefense项目,用于生物防御和流行病应对
  • 扩大GPT-Rosalind对美国政府及盟友的访问

Wealor正在构建面向财富管理者的AI原生平台,整合财富管理、税务和法律信息,并使用AI代理自动化跨传统系统的操作工作。

  • Wealor构建面向财富管理者的AI原生平台
  • 平台整合财富管理、税务和法律信息
  • 使用AI代理自动化跨传统系统的运营工作

NVIDIA 发布 MCG 工具包,用于自动化 AI 模型文档(模型卡片)的生成。该工具旨在应对加州 AB-2013 和 EU AI Act 等监管框架对模型文档的合规要求,简化复杂 AI 模型的文档编写流程。

  • NVIDIA 推出 MCG 工具包。
  • 该工具用于自动化生成 AI 模型文档。
  • 监管要求如加州 AB-2013 和 EU AI Act 推动需求。

字节跳动正与一家量产RRAM的中国内存公司合作,开发类似Groq LPU的AI芯片。该合作旨在构建LPU-like架构,涉及新型存储技术。

  • 字节跳动与中国RRAM内存公司合作开发Groq LPU类似芯片
  • 该中国公司已量产RRAM

在deepagents中,通过“Harness profiles”解决不同模型需要不同提示和工具的问题。

  • Deepagents使用Harness profiles处理不同模型的提示和工具需求

LangChain发布Deep Agents v0.6,将harness profiles作为第一类抽象,旨在从模型获得生产级性能。

  • Deep Agents v0.6发布
  • harness profiles成为第一类抽象
  • 可从模型获得生产级性能

超大规模AI园区扩张中,水资源和废水处理能力成为选址关键因素,重塑冷却选择、市政规划和项目审批。

  • 水资源和废水处理能力成为AI数据中心选址的关键约束
  • 冷却技术选择、市政规划和项目审批受水资源影响

Google免费AI Agents课程回归,本次主题为vibe coding with agents。上次课程吸引了150万学员。

  • Google免费AI Agents课程回归
  • 本次主题为vibe coding with agents
  • 上次课程有150万学员

Braintrust 工程师利用 OpenAI 的 Codex 模型和 GPT-5.5 进行实验,实现更快的编码。该案例展示了 AI 在软件开发中的实际应用。

  • Braintrust 使用 Codex 和 GPT-5.5 加速编码实验
  • 该技术由 OpenAI 提供支持

波士顿儿童医院利用OpenAI技术改善患者护理、减少运营负担,并已成功诊断40多例罕见病病例。

  • 波士顿儿童医院使用OpenAI技术诊断40多例罕见病
  • AI用于改善患者护理并减少运营负担

韩国芯片初创公司XCENA完成1.35亿美元融资,公司认为AI发展的最大瓶颈是内存而非算力,将致力于解决内存限制问题。

  • XCENA获得1.35亿美元融资
  • 公司来自韩国,专注AI内存瓶颈
  • 认为AI瓶颈在内存而非算力