清除 当前 2582 条 / 共 3572 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 6 小时前 微信公众号 · 42章经 · 5 天前 微信公众号 · DeepTech深科技 · 5 天前 微信公众号 · Founder Park · 5 天前 微信公众号 · FundaAI · 5 天前 微信公众号 · 九章智驾 · 5 天前 微信公众号 · 晚点LatePost · 5 天前 微信公众号 · 琢磨事 · 5 天前 微信公众号 · 甲子光年 · 5 天前

Superlog是一款可观测性工具,由Y Combinator支持推出。该工具每日自动设置日志、追踪、告警和仪表盘,并配备AI代理调查事件,生成可合并的PR至Slack。产品正在发布推广中。

  • Superlog可每日自动设置日志、追踪、告警和仪表盘
  • AI代理可调查事件并生成合并PR到Slack
  • Superlog由Y Combinator支持并已发布

Hugging Face 发布 Marionette 工具,可通过手部动作实时操控 Reachy Mini 机器人,基于浏览器,支持手机端使用。

  • Marionette 工具可通过手部动作创建机器人运动
  • 支持 Reachy Mini 机器人
  • 基于浏览器,可在手机上使用

Soumith Chintala在Twitter发布招聘信息,正在寻找超算工程师,负责构建实时交互模型和大规模训练基础设施,包括调度、存储、网络、可靠性及分布式系统,工作地点在纽约和旧金山。

  • 正在招聘超算工程师
  • 工作地点在纽约和旧金山
  • 涉及实时交互模型和大型训练基础设施

Google DeepMind宣布用AI重新设计鼠标指针,展示了通过动作、语音和自然简写与Gemini交互的实验演示,旨在提升人机交互的直观性。

  • DeepMind用AI重新想象鼠标指针界面
  • 演示通过动作、语音和自然简写与Gemini交互

一篇推文介绍通过组合多个B200 8-GPU机器,使用RoCEv2 CX-7以太网和Tomahawk交换机,并应用PD分解推理优化,使每GPU token吞吐量提升高达7倍,每百万token成本降低7倍。

  • 通过RoCEv2和Tomahawk交换机组合B200机器实现PD分解优化
  • 每GPU token吞吐量提升高达7倍
  • 每百万token成本降低7倍

谷歌在Android Show上发布多项更新,包括AI-first的Googlebooks笔记本、更智能的Gemini功能、vibe-coded Android小部件、Chrome中的Gemini集成以及改进的Android Auto等。

  • 谷歌发布AI-first Googlebooks笔记本
  • Gemini功能获得更多智能化升级
  • 推出vibe-coded Android小部件和Gemini in Chrome

Aseon Labs推出用于自动驾驶汽车的机器人维修站,可在运营区域直接为自动驾驶车队提供充电、清洁和检查服务。该产品已正式发布。

  • Aseon Labs推出机器人维修站,用于自动驾驶汽车
  • 维修站可提供充电、清洁和检查服务
  • 产品针对自动驾驶车队在运营区域使用

NVIDIA与科罗拉多州立大学合作,利用Earth-2和PhysicsNeMo,结合生成式AI与高分辨率雷达数据,将冰雹预警提前时间从分钟级延长至小时级,实现实时可扩展的天气预报。

  • NVIDIA与科罗拉多州立大学合作改进天气预报
  • 使用Earth-2和PhysicsNeMo结合生成式AI与雷达数据
  • 冰雹预警时间从分钟级延长到小时级

谷歌在Gboard中集成Gemini驱动的听写功能,初始支持三星Galaxy和谷歌Pixel手机。

  • 谷歌在Gboard中加入Gemini驱动的听写功能
  • 该功能初始在三星Galaxy和谷歌Pixel手机上推出

亚马逊金融科技团队使用Amazon Bedrock等AWS服务构建生成式AI应用,自动化处理来自不同管辖区的监管问询。该方案允许各团队创建和维护自己的专用知识库,以提高信息检索和响应效率。

  • 亚马逊金融科技团队基于AWS构建AI应用处理监管问询
  • 各团队可创建和维护自己的专用知识库
2026-05-12T16:28

来源:alphapai
发布时间:2026-05-12T16:28:53.367000+00:00
热度次数 66; 涨跌幅 16.56%

Chat LangChain 进行了改版并重新开源,这是该产品的重要更新。

  • Chat LangChain 进行了改版
  • Chat LangChain 重新开源

Scale AI 宣布 thinkymachines 发布 TML-Interaction-Small 模型,并在其音频 MC S2S 排行榜上并列第一。

  • thinkymachines 发布 TML-Interaction-Small 模型
  • 该模型在 Scale AI 音频 MC S2S 排行榜并列第一

Vapi AI宣布完成5000万美元B轮融资,由Peak XV Partners领投,累计融资总额达7200万美元。

  • Vapi AI宣布完成5000万美元B轮融资
  • 本轮融资由Peak XV Partners领投
  • 公司累计融资总额达7200万美元

Y Combinator 宣布 FinalDose 正在构建首个可编程药物平台,利用智能药物分子通过 DNA 识别并摧毁病变细胞,初期专注于所有癌症。

  • FinalDose 构建首个可编程药物平台
  • 该平台通过 DNA 识别并摧毁病变细胞
  • 初期专注于所有癌症

介绍physics-intern框架,这是一个用于理论物理的智能体框架。该框架使Gemini 3.1 Pro在CritP基准上的正确率从17.7%提升至31.4%。

  • physics-intern是一个用于理论物理的智能体框架
  • 该框架将Gemini 3.1 Pro在CritP上的正确率从17.7%提升至31.4%

Reachy Mini因RAM价格上涨和关税成本增加,将于6月1日调整价格。

  • Reachy Mini因RAM价格上涨和关税成本增加将于6月1日调价

文章探讨开源AI生态系统的成本优势,引用Ai2和Epoch AI的研究指出,前沿模型研发算力占总算力的约80%。中国开源生态通过避免重复研发,可降低算力成本,形成持续发展优势。

  • 前沿模型研发算力占总算力的约80%
  • 中国开源生态可避免重复研发算力支出
  • Ai2和Epoch AI的研究支持该估计

Hugging Face 宣布其 Hub 上开放数据集数量达到 100 万个,强调开放数据对开放模型的重要性。

  • Hugging Face Hub 上开放数据集达到 100 万个

AWS发布多文档发现功能,作为IDP加速器的预处理步骤,自动分析未知文档、聚类文档类型并生成提取模式,基于视觉嵌入和智能代理,降低人工创建模式的工作量。

  • AWS推出多文档发现功能,自动聚类文档并生成提取模式
  • 该功能作为IDP加速器的预处理,减少人工模式创建
  • 基于视觉嵌入和智能代理实现自动化和可扩展

EU AI Act要求LLM微调跟踪FLOPs以确定合规义务,AWS推出开源Fine-Tuning FLOPs Meter工具,集成到SageMaker AI,帮助用户通过配置标志生成审计文档。

  • EU AI Act要求LLM微调跟踪FLOPs
  • AWS推出Fine-Tuning FLOPs Meter工具
  • 工具集成到SageMaker AI管道

Perplexity AI 发布新研究,详述如何在 NVIDIA GB200 NVL72 Blackwell 机架上服务后训练的 Qwen3 235B 模型,展示了高性能推理部署方案。

  • Perplexity AI 发布新研究
  • 研究涉及服务 Qwen3 235B 模型
  • 使用 NVIDIA GB200 NVL72 Blackwell 机架

Hugging Face CEO Clement Delangue宣布,该平台公有数据集数量突破100万,提供PB级数据供AI开发者使用。

  • Hugging Face公有数据集达100万个
  • 数据总量达PB级别

Hugging Face Hub宣布开放数据集数量达到100万,强调开放数据对开放模型的重要性。

  • Hugging Face Hub开放数据集数量达到100万

Hugging Face 公开数据集数量突破100万个,过去8个月数量翻倍(从50万到100万),加速原因与AI Agents能力提升相关。数据被视为AI构建的下一个瓶颈。

  • Hugging Face 公开数据集达到100万个
  • 过去8个月数据集数量翻倍
  • 数据被认为是AI构建的下一个瓶颈

Hugging Face转发消息称,本周将发布两个开源小型语言模型(SLM)。其中一个在比SOTA模型小93倍的情况下达到同等精度,另一个在更小尺寸下实现类似准确性。

  • 本周将发布两个开源SLM
  • 一个模型尺寸小93倍仍达SOTA精度
  • 另一个模型在更小尺寸下精度类似

Unsloth发布了支持MTP的量化GGUF格式,适用于Qwen3.6-35B-A3B模型。

  • Unsloth发布了MTP-enabled的量化GGUF文件
  • 针对Qwen3.6-35B-A3B模型

Hugging Face CEO Clement Delangue在推特宣布,由于RAM成本上涨和关税影响,公司产品价格将于6月1日起上调。

  • Hugging Face因RAM成本及关税上涨,将于6月1日提价

推特消息:Reason-ModernColBERT模型在BrowseComp-Plus任务上接近解决,性能超越当前最优水平,且模型大小仅为先前模型的1/54,展示出高效能。

  • Reason-ModernColBERT接近解决BrowseComp-Plus任务
  • 模型性能超越现有最优,且比54倍大的模型更好

芝加哥商品交易所(CME)宣布将创建用于支持人工智能的计算能力期货市场,这是金融工具创新,旨在为AI算力提供定价和风险管理工具。

  • CME计划推出算力期货市场

NVIDIA GB200芯片改变了服务大型MoE模型(如Qwen)时的prefill和decode分离方式,相比Hopper芯片有吞吐量优势,团队已发表量化对比结果。

  • GB200改变了大型MoE模型的prefill和decode分离方式
  • 与Hopper相比,GB200在服务Qwen时吞吐量有提升

Perplexity AI发布新研究,展示在NVIDIA GB200 NVL72 Blackwell机架系统上部署后训练Qwen3 235B模型的成果,涉及硬件与模型推理优化。

  • Perplexity AI发布在NVIDIA GB200 NVL72上的模型部署研究
  • 研究涉及后训练的Qwen3 235B模型
  • 部署基于Blackwell架构的GB200系统

Meta上周悄然发布Sapiens2模型家族,这是一组高分辨率模型,基于10亿张人类图像训练,主要用于姿态估计等任务。

  • Meta发布Sapiens2模型家族
  • 模型训练使用10亿张人类图像
  • 模型用于姿态估计等任务

flowscope 推出可学习并记录企业运营流程的AI代理,能在此基础上重新设计和自动化流程,并在数天内将AI部署到公司现有系统中。

  • flowscope 部署可学习和记录企业运营的AI代理
  • 该AI代理能重新设计和自动化业务流程
  • 可在数天内将AI部署到现有系统

Nscale为挪威AI数据中心园区获得7.9亿美元融资,该交易采用公用事业风格,凸显AI基础设施正加剧对能源容量、工业资本和电网接入的竞争。

  • Nscale获得7.9亿美元融资用于挪威AI数据中心园区
  • 该融资采用公用事业式交易结构
  • 交易显示AI基础设施正竞争能源容量、资本和电网接入

微软研究院宣布MatterSim扩展AI在材料科学中的应用,推出更快的模拟和新多任务模型MatterSim-MT,用于模拟势能面以外的性质。

  • MatterSim推出多任务模型MatterSim-MT
  • MatterSim加速大规模材料科学模拟

初创公司Dessn完成600万美元融资,用于开发AI驱动、直接与生产代码库协作的设计工具。该轮融资将支持产品开发与团队扩展。

  • Dessn完成600万美元融资
  • 融资用于开发AI驱动设计工具,直接对接生产代码库

OpenMed Agent 预览版发布,基于 Hugging Face 的端点,用于临床数据提取和术语处理。

  • OpenMed Agent 预览版发布
  • 构建在 Hugging Face 之上,支持临床提取和术语

推特消息称,AWS可能通过联发科在低端版Trainium中使用EMIB技术,类似TPU v9项目;下一代Trainium可能同时使用EMIB和CoWoS。

  • AWS可能通过联发科使用EMIB技术于低端版Trainium
  • 下一代Trainium可能同时使用EMIB和CoWoS

Red Hat宣布扩展其AI Factory平台,新增计算和治理功能,并与NVIDIA合作,旨在帮助企业安全部署自主AI。该合作整合了NVIDIA的AI技术和Red Hat的开源解决方案,强化了AI工厂的安全性与管理能力。

  • Red Hat扩展AI Factory平台,新增计算与治理功能
  • Red Hat与NVIDIA合作,帮助企业安全部署自主AI

PingCAP 联合创始人黄东旭复盘了 TiDB Cloud 成为 Kimi Agent 服务商的合作细节。Kimi K2.6 Agent 为大众用户提供端到端在线应用构建服务,TiDB Cloud 为其提供动态大规模数据库支持,实现了 Agent Infrastructure 的规模化落地。

  • TiDB Cloud 正式成为 Kimi Agent 的数据库服务商
  • Kimi K2.6 Agent 面向非技术用户提供全托管建站服务
  • 合作降低了 Agent 应用 hosting 成本,用户无需技术背景

AI语音初创公司Vapi在赢得亚马逊Ring合同后估值达5亿美元,竞标中击败40个竞争对手。自2025年初以来,其企业业务增长10倍,企业客户正将客服和销售电话转向AI代理。

  • Vapi赢得亚马逊Ring合同,击败40个对手
  • Vapi估值达到5亿美元
  • Vapi企业业务自2025年初增长10倍

理想汽车自研芯片马赫M100即将量产装车,采用数据流架构,单颗有效算力1280 TOPS,声称有效算力是英伟达Thor-U的3倍。CTO谢炎表示业务目标达成度仅60%,需实现智驾能力业界第一。

  • 理想自研芯片马赫M100即将量产装车,采用数据流架构
  • 马赫M100单颗有效算力1280 TOPS,自称有效算力是英伟达Thor-U的3倍
  • 理想CTO谢炎表示马赫M100业务目标达成度60%

atNorth 加入 Nordic Compass Alliance,这是一个由北欧科技组织组成的行业联盟,旨在加强该地区的主权数字基础设施和韧性。

  • atNorth 加入 Nordic Compass Alliance
  • 该联盟旨在加强北欧主权数字基础设施和韧性

Thinking Machines Lab(TML)发布交互模型研究预览,该模型可在200毫秒内处理语音、视频和文本,实现实时流式协作,无需轮换等待。

  • TML推出交互模型研究预览
  • 模型以200ms块处理多模态输入并实时响应

GFHK报告称,英伟达的Vera CPU机架已获得阿里巴巴、CoreWeave、Meta和Oracle等早期客户;高通的数据中心CPU预计2028年出货,并正在开发用于机架级解决方案的交换和连接芯片。

  • 英伟达Vera CPU机架已获阿里巴巴、CoreWeave、Meta、Oracle早期客户
  • 高通数据中心CPU预计2028年出货
  • 高通同时开发机架级交换与连接芯片

Thinking Machines正在构建一种新型AI模型,能够同时处理用户输入并生成响应,模拟实时对话体验,而非传统的轮流交流方式。

  • 当前所有AI模型均采用轮流对话模式
  • Thinking Machines构建同时处理输入和生成响应的模型

Thinking Machines 发布 TML-Interaction-Small 276B-A12B 模型,声称在实时语音领域达到 SOTA 并取消标准 VAD。

  • Thinking Machines 发布新模型 TML-Interaction-Small 276B-A12B
  • 新模型在实时语音方面达到 SOTA
  • 该模型取消了标准语音活动检测 (VAD)

Thinking Machines发布TML-Interaction-Small 276B-A12B模型,采用编码器自由早期融合,在实时语音对话任务上实现SOTA;MiMo-V2.5-Pro在Claw-Eval agentic基准中领先,DeepSeek V4 Flash效率突出;同时,多篇分析指出TurboQuant量化技术效果不理想。

  • Thinking Machines发布TML-Interaction-Small模型,推进实时语音SOTA。
  • MiMo-V2.5-Pro在Claw-Eval agentic任务中领先,DeepSeek V4 Flash效率突出。
  • 多篇分析指出TurboQuant量化技术效果不理想。

@garrytan 在推特上发布 GBrain 项目更新:72 小时内合并 14 个 PR,净增 28,746 行代码,涉及事实加入系统记录、v2 重写、实时热内存提取、路由表压缩、新嵌入配方等功能,版本从 v0.31.2 升级到 v0.32.4。

  • 14 个 PR 在 72 小时内合并,代码净增 28,746 行
  • GBrain 项目从 v0.31.2 升级至 v0.32.4