清除 当前 2562 条 / 共 3547 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 18 小时前 微信公众号 · 42章经 · 4 天 12 小时前 微信公众号 · DeepTech深科技 · 4 天 12 小时前 微信公众号 · Founder Park · 4 天 12 小时前 微信公众号 · FundaAI · 4 天 12 小时前 微信公众号 · 九章智驾 · 4 天 12 小时前 微信公众号 · 晚点LatePost · 4 天 12 小时前 微信公众号 · 琢磨事 · 4 天 12 小时前 微信公众号 · 甲子光年 · 4 天 12 小时前

Box创始人Aaron Levie指出公司用AI替代员工的现象为“AI幻觉”。ClickUp裁减22%员工由AI代理替代,2026年科技行业裁员人数已接近2025年全年总和。

  • ClickUp裁减22%员工,由AI代理替代。
  • 2026年科技行业裁员人数接近2025年全年。

AI芯片初创公司Groq据报正寻求6.5亿美元内部融资,并计划从硬件转向专注于AI推理领域。

  • Groq寻求6.5亿美元内部融资
  • Groq从硬件转向AI推理

a16z发布推特称,IT资本支出正接近标普所有资本支出的40%,并附有本周图表链接。

  • IT资本支出占标普所有资本支出近40%

SemiAnalysis研究指出,在ERCOT地区,AI运营商的数据中心互连请求与电网实际核准能力之间存在巨大差距,反映了电力危机中供需不匹配。

  • 在ERCOT,数据中心互连请求与电网承保意愿存在差距
  • 该差距揭示了AI运营商建设计划与电网审批能力的错配

NVIDIA祝贺Teton Ridge和Cowboy+的AIQ项目获得体育艾美奖提名,并宣布Palantir Technologies集成NVIDIA软件,构建端到端实时视频分析系统,已在FOX的The American节目中直播运行。

  • AIQ项目获得体育艾美奖提名
  • Palantir集成NVIDIA软件用于实时视频分析系统
  • 系统在FOX的The American节目中直播运行

推特消息称,用户 @nasch 在消费级 AMD 显卡上运行 Qwen3.6 27B 模型,推理速度达到 87 tok/s,展示了 AI 本地推理的性能进展。

  • 在消费级 AMD 显卡上,Qwen3.6 27B 模型推理速度达 87 tok/s

OpenBMB发布了1500万个样本,可用于微调AI模型,使得GPT-4o级别的模型能够在手机或笔记本上运行。

  • OpenBMB发布1500万个样本用于微调AI模型

MLCC市场整体规模1500亿美元,2025年服务器MLCC市场13亿美元(AI服务器6亿,通用服务器7亿)。AI服务器MLCC市场CAGR超80%,通用服务器MLCC市场CAGR 30-40%。智能手机MLCC市场2026-27年负增长。高镍和银价上涨导致涨价,高端MLCC交期超20周。Murata等厂商扩产或影响格局。

  • MLCC整体市场规模1500亿美元,服务器MLCC市场2025年达13亿美元
  • AI服务器MLCC市场CAGR超80%,通用服务器MLCC市场CAGR 30-40%
  • 高镍和银价上涨推高MLCC价格,高端MLCC交货周期超20周

OpenAI 目前有超过 700 个开放职位,覆盖多个领域。

  • OpenAI 有 700 多个开放职位

llama.cpp项目推出了官方网站,旨在让本地AI人人可用。

  • llama.cpp项目推出官方网站。

llama.cpp 项目宣布推出官方网站,目标让本地 AI 易于访问,推动本地 AI 普及。

  • llama.cpp 推出官方网站

pibot项目实现全本地运行,采用Parakeet进行语音识别,Qwen3-TTS进行语音合成,并整合Qwen 3.6多模态大模型,全部在本地部署完成。

  • pibot实现全本地运行
  • 使用Parakeet STT、Qwen3-TTS和Qwen 3.6多模态LLM

Cognition公司开发的AI编码代理Devin被认为是首个且最成功的AI编码代理,但其CEO Scott Wu表示该工具并非旨在取代人类程序员,而是辅助人类。

  • Cognition公司开发了AI编码代理Devin。
  • CEO Scott Wu称Devin不是设计来取代人类程序员。

a16z指出,超大规模企业越来越多地通过债务融资来支撑人工智能基础设施的巨额资本开支。

  • 超大规模企业用债务融资支撑AI资本开支

DraftedAI发布新功能,用户可快速生成房屋平面图、立面图和3D设计。过去一个月,12万人使用该工具生成了超过32.5万个房屋设计。

  • DraftedAI能快速生成房屋平面图、立面图和3D设计
  • 过去一个月12万人生成了32.5万+个房屋设计

YC正在建立反无人机生态系统,涉及两家初创公司:PerseusDefense开发制导导弹击落无人机,9Mothers利用AI技术参与其中。内容来源于个人推特转发,信息初步且不完整。

  • YC正在构建反无人机生态系统
  • PerseusDefense开发制导导弹击落无人机
  • 9Mothers利用AI技术参与反无人机

LangSmith LLM Gateway 新增功能,可在请求到达模型前强制执行支出限制和脱敏个人身份信息,提升AI应用的安全性和成本控制能力。

  • LangSmith LLM Gateway 支持在请求到达模型前强制执行支出限制和PII脱敏。

GigaAI联合创始人Varun Vummadi在Startup School India分享创业经历,公司为DoorDash、一家大型加密货币交易所和全球前三电信商提供AI客服,8人团队击败400人竞争者赢得DoorDash合同。

  • GigaAI为DoorDash、大型加密货币交易所和全球前三电信商提供AI客服
  • 8人团队击败400人竞争者赢得DoorDash合同
  • Varun曾拒绝高薪量化工作去创业

Hugging Face CEO表示,平台上50%的模型和数据集是私有的,该比例因企业使用其S3替代产品buckets而持续增长,更多公司开始内部构建AI而非依赖外部API。

  • Hugging Face上50%模型和数据集为私有
  • 私有比例因buckets产品增长而上升
  • 更多企业转向内部AI开发

OpenAI宣布加速生物防御进展,推出Rosalind Biodefense项目,帮助受信任的开发者构建生物防御和流行病应对能力;同时向美国政府及盟友扩展GPT-Rosalind的访问权限,以支持公共卫生和生物防御任务。

  • OpenAI推出Rosalind Biodefense项目,用于生物防御和流行病应对
  • 扩大GPT-Rosalind对美国政府及盟友的访问

Wealor正在构建面向财富管理者的AI原生平台,整合财富管理、税务和法律信息,并使用AI代理自动化跨传统系统的操作工作。

  • Wealor构建面向财富管理者的AI原生平台
  • 平台整合财富管理、税务和法律信息
  • 使用AI代理自动化跨传统系统的运营工作

NVIDIA 发布 MCG 工具包,用于自动化 AI 模型文档(模型卡片)的生成。该工具旨在应对加州 AB-2013 和 EU AI Act 等监管框架对模型文档的合规要求,简化复杂 AI 模型的文档编写流程。

  • NVIDIA 推出 MCG 工具包。
  • 该工具用于自动化生成 AI 模型文档。
  • 监管要求如加州 AB-2013 和 EU AI Act 推动需求。

字节跳动正与一家量产RRAM的中国内存公司合作,开发类似Groq LPU的AI芯片。该合作旨在构建LPU-like架构,涉及新型存储技术。

  • 字节跳动与中国RRAM内存公司合作开发Groq LPU类似芯片
  • 该中国公司已量产RRAM

在deepagents中,通过“Harness profiles”解决不同模型需要不同提示和工具的问题。

  • Deepagents使用Harness profiles处理不同模型的提示和工具需求

LangChain发布Deep Agents v0.6,将harness profiles作为第一类抽象,旨在从模型获得生产级性能。

  • Deep Agents v0.6发布
  • harness profiles成为第一类抽象
  • 可从模型获得生产级性能

超大规模AI园区扩张中,水资源和废水处理能力成为选址关键因素,重塑冷却选择、市政规划和项目审批。

  • 水资源和废水处理能力成为AI数据中心选址的关键约束
  • 冷却技术选择、市政规划和项目审批受水资源影响

Google免费AI Agents课程回归,本次主题为vibe coding with agents。上次课程吸引了150万学员。

  • Google免费AI Agents课程回归
  • 本次主题为vibe coding with agents
  • 上次课程有150万学员

Braintrust 工程师利用 OpenAI 的 Codex 模型和 GPT-5.5 进行实验,实现更快的编码。该案例展示了 AI 在软件开发中的实际应用。

  • Braintrust 使用 Codex 和 GPT-5.5 加速编码实验
  • 该技术由 OpenAI 提供支持

波士顿儿童医院利用OpenAI技术改善患者护理、减少运营负担,并已成功诊断40多例罕见病病例。

  • 波士顿儿童医院使用OpenAI技术诊断40多例罕见病
  • AI用于改善患者护理并减少运营负担

韩国芯片初创公司XCENA完成1.35亿美元融资,公司认为AI发展的最大瓶颈是内存而非算力,将致力于解决内存限制问题。

  • XCENA获得1.35亿美元融资
  • 公司来自韩国,专注AI内存瓶颈
  • 认为AI瓶颈在内存而非算力

超大规模数据中心正采用电动汽车风格的800V直流电系统,以降低铜材用量、冷却负担和转换损耗,推动AI基础设施向高压供电演进。

  • 超大规模数据中心采用800V直流电系统
  • 高压供电减少铜材、冷却和转换损耗

TrendForce预测,受代理型AI驱动,全球DRAM市场收入将在2026年同比增长303%,2027年同比增长46%。

  • TrendForce预测2026年全球DRAM市场收入同比增303%
  • TrendForce预测2027年全球DRAM市场收入同比增46%

OpenAI在ChatGPT中发布了新的5.5 instant模型,该信息来源于推特,获得较多关注。

  • ChatGPT推出新的5.5 instant模型

TrendForce预测,受代理式AI驱动,全球DRAM市场2026年收入将同比增长303%,2027年增长46%;NAND闪存市场2026年增长208.7%,2027年增长40.2%。

  • TrendForce预测2026年全球DRAM收入同比增长303%
  • TrendForce预测2026年全球NAND闪存收入增长208.7%
2026-05-29T09:00

Anthropic同日发布Claude Opus 4.8模型,在多项基准测试中超越GPT-5.5和Gemini 3.1 Pro,并宣布完成大规模融资,估值接近1万亿美元,成为全球最有价值AI实验室,同时计划公开上市。

  • Anthropic发布Claude Opus 4.8,性能超越GPT-5.5和Gemini 3.1 Pro。
  • Anthropic完成大规模融资,估值接近1万亿美元。
  • Anthropic计划公开上市。

施耐德电气将在2026年法国戛纳举行的Datacloud全球大会上展示其面向AI的电力、冷却和基础设施系统。

  • 施耐德电气将在Datacloud Global Congress 2026展示AI就绪基础设施

Visa投资AI编码平台Replit,探索将自动化支付功能集成到开发流程中,旨在使开发者能够通过AI助手完成支付操作。

  • Visa投资了AI编码平台Replit
  • 双方探索自动化支付应用

推文指出更多中国公司进入OpenAI供应链,此前曾试图建立不含中国的供应链。

  • 更多中国公司进入OpenAI供应链
  • 此前有建立无中国供应链的意图

三星电子在SAFE论坛确认,美国泰勒工厂已准备就绪,明年开始量产,采用2nm工艺(SF2P+),生产特斯拉AI5/AI6芯片,总投资170亿美元。

  • 三星泰勒工厂明年开始量产,采用2nm工艺。
  • 工厂将生产特斯拉自动驾驶芯片AI5和AI6。
  • 总投资170亿美元,今年建立2nm产能。

作者体验了索尼AI的Project Ace高速自主乒乓球机器人系统,该系统曾击败精英人类运动员,但作者成功赢得一分。

  • 索尼AI的Project Ace是高速自主乒乓球机器人系统
  • 该系统曾击败精英人类运动员
  • 作者与机器人对打并赢得一分

作者@garrytan 发推称GBrain在LongMemEval评估中达到SOTA水平,并日常在OpenClaw中使用GBrain处理300k markdown文件知识库,通过修复失败用例持续改进。

  • GBrain在LongMemEval上达到SOTA
  • 作者使用GBrain处理300k markdown知识库

SemiAnalysis发推称,在Cerebras上运行深度编码模型需24个系统(2400万美元资本支出)仅支持256并发用户,而同等资金下标准GB300机架能提供更多内存带宽。

  • Cerebras运行深度编码模型需24系统(2400万美元)支持256并发用户
  • 同等资金下标准GB300机架可提供更多内存带宽

OpenAI推出Rosalind Biodefense,向审核开发者及美国政府合作伙伴提供GPT-Rosalind访问,用于推进生物防御、公共卫生和大流行防备。

  • OpenAI发布Rosalind Biodefense计划
  • 该计划扩大对GPT-Rosalind的受控访问
  • 目标用户包括开发者和美国政府合作方

NVIDIA 发布了 Nemotron 3 Nano Omni,一个高效的开源多模态模型,统一处理视频、音频、图像和文本。

  • NVIDIA 发布 Nemotron 3 Nano Omni 模型
  • 该模型为高效开源模型,统一处理多模态数据

VikParuchuri 宣布发布 Surya OCR 2 模型,拥有 6.5 亿参数,在 olmocr 基准测试中得分 83.3%,在内部 91 语言基准测试中得分 87%,在其他多项基准测试中表现领先。

  • Surya OCR 2 模型参数规模为 650M。
  • olmocr 基准得分 83.3%,在 3B 以下排名第一。
  • 内部 91 语言基准得分 87%。

Gradio推文宣布一场名为Build Small的黑客马拉松,要求参赛模型参数不超过32B并能在笔记本电脑上运行,赞助商包括OpenAI、NVIDIA和OpenBMB。

  • Build Small黑客马拉松限制模型参数不超过32B
  • 活动要求模型可运行在笔记本电脑上
  • 赞助商包括OpenAI、NVIDIA和OpenBMB

AnthropicAI完成9650亿美元H轮融资,并发布Opus 4.8模型及Dynamic Workflows/ultracode工具。

  • AnthropicAI完成9650亿美元H轮融资
  • 发布Opus 4.8模型
  • 推出Dynamic Workflows/ultracode工具

Anthropic完成H轮融资,估值9650亿美元,筹集650亿美元,并报告470亿美元收入运行率。同时发布Opus 4.8模型,修复多项问题并达到经济相关基准最优。Claude Code推出动态工作流功能,支持大规模代码重写。

  • Anthropic以9650亿美元估值完成650亿美元H轮融资
  • Anthropic报告470亿美元收入运行率
  • Anthropic发布Opus 4.8模型并推出动态工作流功能

阶跃星辰发布Step 3.7 Flash模型,该模型专注于代理效率,并在ClawEval-1.1和SimpleVQA Search基准测试中取得第一名。

  • 阶跃星辰发布Step 3.7 Flash模型
  • 模型在ClawEval-1.1基准测试中得分67.1排名第一
  • 在SimpleVQA Search基准测试中得分79.2排名第一

Axios引用Anthropic自报数据,其收入从300亿美元增长至470亿美元,JimVandeHei表示未见过如此快速的有机收入增长。

  • Anthropic自报收入从300亿增至470亿美元
  • Axios称其收入增速前所未有