Superlog是一款可观测性工具,由Y Combinator支持推出。该工具每日自动设置日志、追踪、告警和仪表盘,并配备AI代理调查事件,生成可合并的PR至Slack。产品正在发布推广中。
Hugging Face 发布 Marionette 工具,可通过手部动作实时操控 Reachy Mini 机器人,基于浏览器,支持手机端使用。
Soumith Chintala在Twitter发布招聘信息,正在寻找超算工程师,负责构建实时交互模型和大规模训练基础设施,包括调度、存储、网络、可靠性及分布式系统,工作地点在纽约和旧金山。
Google DeepMind宣布用AI重新设计鼠标指针,展示了通过动作、语音和自然简写与Gemini交互的实验演示,旨在提升人机交互的直观性。
一篇推文介绍通过组合多个B200 8-GPU机器,使用RoCEv2 CX-7以太网和Tomahawk交换机,并应用PD分解推理优化,使每GPU token吞吐量提升高达7倍,每百万token成本降低7倍。
谷歌在Android Show上发布多项更新,包括AI-first的Googlebooks笔记本、更智能的Gemini功能、vibe-coded Android小部件、Chrome中的Gemini集成以及改进的Android Auto等。
Aseon Labs推出用于自动驾驶汽车的机器人维修站,可在运营区域直接为自动驾驶车队提供充电、清洁和检查服务。该产品已正式发布。
NVIDIA与科罗拉多州立大学合作,利用Earth-2和PhysicsNeMo,结合生成式AI与高分辨率雷达数据,将冰雹预警提前时间从分钟级延长至小时级,实现实时可扩展的天气预报。
谷歌在Gboard中集成Gemini驱动的听写功能,初始支持三星Galaxy和谷歌Pixel手机。
亚马逊金融科技团队使用Amazon Bedrock等AWS服务构建生成式AI应用,自动化处理来自不同管辖区的监管问询。该方案允许各团队创建和维护自己的专用知识库,以提高信息检索和响应效率。
来源:alphapai
发布时间:2026-05-12T16:28:53.367000+00:00
热度次数 66; 涨跌幅 16.56%
Chat LangChain 进行了改版并重新开源,这是该产品的重要更新。
Scale AI 宣布 thinkymachines 发布 TML-Interaction-Small 模型,并在其音频 MC S2S 排行榜上并列第一。
Vapi AI宣布完成5000万美元B轮融资,由Peak XV Partners领投,累计融资总额达7200万美元。
Y Combinator 宣布 FinalDose 正在构建首个可编程药物平台,利用智能药物分子通过 DNA 识别并摧毁病变细胞,初期专注于所有癌症。
介绍physics-intern框架,这是一个用于理论物理的智能体框架。该框架使Gemini 3.1 Pro在CritP基准上的正确率从17.7%提升至31.4%。
Reachy Mini因RAM价格上涨和关税成本增加,将于6月1日调整价格。
文章探讨开源AI生态系统的成本优势,引用Ai2和Epoch AI的研究指出,前沿模型研发算力占总算力的约80%。中国开源生态通过避免重复研发,可降低算力成本,形成持续发展优势。
Hugging Face 宣布其 Hub 上开放数据集数量达到 100 万个,强调开放数据对开放模型的重要性。
AWS发布多文档发现功能,作为IDP加速器的预处理步骤,自动分析未知文档、聚类文档类型并生成提取模式,基于视觉嵌入和智能代理,降低人工创建模式的工作量。
EU AI Act要求LLM微调跟踪FLOPs以确定合规义务,AWS推出开源Fine-Tuning FLOPs Meter工具,集成到SageMaker AI,帮助用户通过配置标志生成审计文档。
Perplexity AI 发布新研究,详述如何在 NVIDIA GB200 NVL72 Blackwell 机架上服务后训练的 Qwen3 235B 模型,展示了高性能推理部署方案。
Hugging Face CEO Clement Delangue宣布,该平台公有数据集数量突破100万,提供PB级数据供AI开发者使用。
Hugging Face Hub宣布开放数据集数量达到100万,强调开放数据对开放模型的重要性。
Hugging Face 公开数据集数量突破100万个,过去8个月数量翻倍(从50万到100万),加速原因与AI Agents能力提升相关。数据被视为AI构建的下一个瓶颈。
Hugging Face转发消息称,本周将发布两个开源小型语言模型(SLM)。其中一个在比SOTA模型小93倍的情况下达到同等精度,另一个在更小尺寸下实现类似准确性。
Unsloth发布了支持MTP的量化GGUF格式,适用于Qwen3.6-35B-A3B模型。
Hugging Face CEO Clement Delangue在推特宣布,由于RAM成本上涨和关税影响,公司产品价格将于6月1日起上调。
推特消息:Reason-ModernColBERT模型在BrowseComp-Plus任务上接近解决,性能超越当前最优水平,且模型大小仅为先前模型的1/54,展示出高效能。
芝加哥商品交易所(CME)宣布将创建用于支持人工智能的计算能力期货市场,这是金融工具创新,旨在为AI算力提供定价和风险管理工具。
NVIDIA GB200芯片改变了服务大型MoE模型(如Qwen)时的prefill和decode分离方式,相比Hopper芯片有吞吐量优势,团队已发表量化对比结果。
Perplexity AI发布新研究,展示在NVIDIA GB200 NVL72 Blackwell机架系统上部署后训练Qwen3 235B模型的成果,涉及硬件与模型推理优化。
Meta上周悄然发布Sapiens2模型家族,这是一组高分辨率模型,基于10亿张人类图像训练,主要用于姿态估计等任务。
flowscope 推出可学习并记录企业运营流程的AI代理,能在此基础上重新设计和自动化流程,并在数天内将AI部署到公司现有系统中。
Nscale为挪威AI数据中心园区获得7.9亿美元融资,该交易采用公用事业风格,凸显AI基础设施正加剧对能源容量、工业资本和电网接入的竞争。
微软研究院宣布MatterSim扩展AI在材料科学中的应用,推出更快的模拟和新多任务模型MatterSim-MT,用于模拟势能面以外的性质。
初创公司Dessn完成600万美元融资,用于开发AI驱动、直接与生产代码库协作的设计工具。该轮融资将支持产品开发与团队扩展。
OpenMed Agent 预览版发布,基于 Hugging Face 的端点,用于临床数据提取和术语处理。
推特消息称,AWS可能通过联发科在低端版Trainium中使用EMIB技术,类似TPU v9项目;下一代Trainium可能同时使用EMIB和CoWoS。
Red Hat宣布扩展其AI Factory平台,新增计算和治理功能,并与NVIDIA合作,旨在帮助企业安全部署自主AI。该合作整合了NVIDIA的AI技术和Red Hat的开源解决方案,强化了AI工厂的安全性与管理能力。
PingCAP 联合创始人黄东旭复盘了 TiDB Cloud 成为 Kimi Agent 服务商的合作细节。Kimi K2.6 Agent 为大众用户提供端到端在线应用构建服务,TiDB Cloud 为其提供动态大规模数据库支持,实现了 Agent Infrastructure 的规模化落地。
AI语音初创公司Vapi在赢得亚马逊Ring合同后估值达5亿美元,竞标中击败40个竞争对手。自2025年初以来,其企业业务增长10倍,企业客户正将客服和销售电话转向AI代理。
理想汽车自研芯片马赫M100即将量产装车,采用数据流架构,单颗有效算力1280 TOPS,声称有效算力是英伟达Thor-U的3倍。CTO谢炎表示业务目标达成度仅60%,需实现智驾能力业界第一。
atNorth 加入 Nordic Compass Alliance,这是一个由北欧科技组织组成的行业联盟,旨在加强该地区的主权数字基础设施和韧性。
Thinking Machines Lab(TML)发布交互模型研究预览,该模型可在200毫秒内处理语音、视频和文本,实现实时流式协作,无需轮换等待。
GFHK报告称,英伟达的Vera CPU机架已获得阿里巴巴、CoreWeave、Meta和Oracle等早期客户;高通的数据中心CPU预计2028年出货,并正在开发用于机架级解决方案的交换和连接芯片。
Thinking Machines正在构建一种新型AI模型,能够同时处理用户输入并生成响应,模拟实时对话体验,而非传统的轮流交流方式。
Thinking Machines 发布 TML-Interaction-Small 276B-A12B 模型,声称在实时语音领域达到 SOTA 并取消标准 VAD。
Thinking Machines发布TML-Interaction-Small 276B-A12B模型,采用编码器自由早期融合,在实时语音对话任务上实现SOTA;MiMo-V2.5-Pro在Claw-Eval agentic基准中领先,DeepSeek V4 Flash效率突出;同时,多篇分析指出TurboQuant量化技术效果不理想。
@garrytan 在推特上发布 GBrain 项目更新:72 小时内合并 14 个 PR,净增 28,746 行代码,涉及事实加入系统记录、v2 重写、实时热内存提取、路由表压缩、新嵌入配方等功能,版本从 v0.31.2 升级到 v0.32.4。