清除 当前 2582 条 / 共 3571 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 2 小时前 微信公众号 · 42章经 · 4 天 21 小时前 微信公众号 · DeepTech深科技 · 4 天 21 小时前 微信公众号 · Founder Park · 4 天 21 小时前 微信公众号 · FundaAI · 4 天 21 小时前 微信公众号 · 九章智驾 · 4 天 21 小时前 微信公众号 · 晚点LatePost · 4 天 21 小时前 微信公众号 · 琢磨事 · 4 天 21 小时前 微信公众号 · 甲子光年 · 4 天 21 小时前

Stainless 宣布加入 Anthropic,该公司最初致力于让软件变得更好。

  • Stainless 宣布加入 Anthropic
  • Stainless 的创始使命是让软件更好

Y Combinator发布InsForge产品,该工具可将编程代理转化为后端工程师,管理后端服务器、数据库、LLM网关、前端部署等基础设施,专为编码代理工作流设计。

  • InsForge产品发布,定位为编码代理的后端工程工具
  • 支持后端服务器、数据库、LLM网关、前端部署等功能

Perplexity AI基于pplx-embed-0.6b继续训练了一个小型ColBERT模型,相关推文获得79点赞和16转发。

  • Perplexity AI训练了一个小型ColBERT模型
  • 该模型是pplx-embed-0.6b的继续训练版本

加州陪审团一致裁定,埃隆·马斯克针对OpenAI联合创始人萨姆·奥尔特曼的诉讼因超过诉讼时效而败诉,马斯克主张的受虐待指控未获支持。

  • 马斯克起诉OpenAI和奥尔特曼的诉讼被加州陪审团驳回
  • 陪审团一致认定诉讼已超过法定时效

法律行业软件公司Aderant利用Amazon Quick的AI能力,统一了六个知识系统的搜索,并自动化文档流程,实现了搜索时间加快90%、文档处理加速75%,提升了云运营团队的效率。

  • Aderant使用Amazon Quick统一了六个知识系统的搜索
  • 搜索时间加快90%,文档处理加速75%
  • Aderant的Expert Sierra云解决方案获得更高效支持

LangChain发布SmithDB,一个专为Agent可观测性和评估工作负载构建的数据层,支持日益复杂的查询。

  • LangChain发布SmithDB数据层
  • SmithDB用于Agent可观测性和评估工作负载

LangChain 于上周发布了 Deep Agents v0.6 版本,并表示这是迄今为止最大的一次发布。

  • LangChain 发布 Deep Agents v0.6
  • 该版本是迄今为止最大的一次发布

deepagents发布0.6版本,包含多项改进。该版本由Sydney撰写介绍文章。

  • deepagents发布0.6版本

人工智能公司Anthropic宣布收购Stainless API,后者是一家SDK和MCP服务器平台,自Anthropic API早期以来一直为其提供SDK支持。

  • Anthropic收购了Stainless API
  • Stainless API是SDK和MCP服务器平台

NextEra与Dominion以670亿美元合并,创建美国最大受监管公用事业平台,瞄准AI数据中心电力需求增长。

  • NextEra与Dominion合并,交易金额670亿美元
  • 合并后成为美国最大受监管公用事业平台
  • 合并目标是为AI数据中心提供电力

微软研究团队公布最新研究进展,涵盖云效率优化、智能体成本削减、3D远程医疗随机试验,并开放非洲包容性AI语言项目申请。

  • 微软发布云效率与智能体成本削减研究
  • 开展3D远程医疗随机试验
  • 开放非洲包容性AI语言项目申请

Nebius与LangChain宣布合作,将Nebius Token Factory集成到LangChain的Deep Agents中。

  • Nebius与LangChain达成合作
  • 集成Nebius Token Factory与LangChain Deep Agents

ParasmaAI宣布获知名孵化器Y Combinator S26批次录取。创始人披露该项目当前处于极早期阶段,尚无成型产品、无营收、无联合创始人,且团队非美国本土背景。该动态在社交平台引发关注,体现了早期创投机构对非传统背景项目的筛选与孵化情况。

  • ParasmaAI获Y Combinator S26批次录取
  • 该项目目前尚无产品、营收及联合创始人
  • 创始团队非美国本土背景

亚马逊AWS宣布Atlassian Confluence Cloud与Quick平台集成,用户可通过自然语言查询和管理Confluence文档,减少上下文切换。集成支持知识库创建、语义搜索及操作执行,并连接Amazon S3、JIRA等系统。文章详细介绍了设置步骤。

  • Quick平台集成Atlassian Confluence Cloud
  • 支持通过自然语言查询和管理Confluence页面
  • 集成包括知识库和Actions两类功能

知名开源AI推理引擎llama.cpp新增对Qwen3.6系列模型的多标记预测(MTP)支持,被认为对本地AI生态具有里程碑意义。

  • llama.cpp新增对Qwen3.6系列的MTP支持

Amazon Bedrock AgentCore推出自定义代码评估器功能,允许用户通过AWS Lambda函数进行确定性质量检查,满足金融等专业领域的特定需求,如实时股价验证、JSON模式校验和PII过滤。该功能可应用于开发CI/CD管道和在线评估场景。

  • Amazon Bedrock AgentCore推出自定义代码评估器
  • 评估器基于AWS Lambda实现确定性逻辑
  • 支持金融领域实时股价验证和JSON模式检查

Transload 公司利用已安装的安防摄像头,在货物运动过程中测量尺寸,解决托运人经常误报尺寸导致物流公司损失的问题。该技术无需新增设备。

  • Transload 用安防摄像头测量货运尺寸
  • 托运人常误报尺寸导致物流公司损失
  • Transload 利用现有 CCTV 在运动中测量

亚马逊宣布其智能助手Alexa+推出新功能,可根据需求生成定制AI播客,将Alexa扩展为个性化AI内容平台。

  • 亚马逊Alexa+推出生成定制AI播客功能
  • 该功能将Alexa扩展为个性化AI内容平台

Tether公司在iPhone 16上成功微调了一个130亿参数的AI模型,无需数据中心和企业级GPU,实现了完全隐私保护。这一技术突破展示了在移动设备上运行大模型的可行性。

  • Tether在iPhone 16上微调了13B参数的AI模型
  • 无需数据中心和企业级GPU
  • 实现了完全隐私保护

Anthropic研究PM Alex Albert分享了构建下一代Claude模型的五个要点:模型与外部工具紧密耦合设计、Claude自我审查记忆的‘梦境’机制、基于真实用户问题生成评估、设有研究Claude意识的团队,以及写作文化为模型提供上下文。

  • Anthropic构建Claude模型时考虑模型与外部工具的耦合
  • Claude模型通过自我审查记忆来优化,类似人类的梦境过程
  • Anthropic有全职研究人员探索Claude的意识和自主性

UnslothAI发布Qwen3.6通过MTP GGUFs实现本地运行加速,速度提升约1.4-2.2倍,仅需18GB RAM。

  • Qwen3.6使用MTP GGUFs运行速度提升2倍
  • 本地运行仅需18GB RAM

播客节目采访The Fourth Law创始人Yaroslav Azhnyuk,探讨乌克兰战争中无人机技术的演变,包括FPV无人机、AI引导、光纤与AI对比、五级自主性,以及中国制造业优势导致的西方差距。

  • The Fourth Law公司开发AI引导无人机系统
  • 中国在无人机制造上具有显著优势
  • 乌克兰战争展示了无人机战术的演进

安全公司SentinelOne发现一款名为fast16.sys的古老计算机病毒,该病毒能篡改高精度计算软件,通过内存补丁改变计算结果,并以自传播机制扩散。研究发现其包含复杂的浮点运算代码,疑似用于武器程序。

  • fast16.sys病毒通过内存补丁篡改高精度计算软件
  • 病毒包含复杂浮点运算代码,与常规恶意代码不同
  • 自传播机制可导致整个设施的计算结果错误

推特用户ngxson宣布Qwen3.6-27B模型在WebGPU上实现100%运行,但速度并非最佳。该演示展示了AI模型在浏览器端推理的可行性。

  • Qwen3.6-27B模型在WebGPU上实现100%运行
  • 运行速度并非最佳

开发者正在将SAM模型移植到Apple silicon,并在MLX上实现1.25倍推理速度提升。

  • 正在将SAM模型移植到Apple silicon
  • 在MLX上推理速度提升1.25倍

用户ErikKaum在huggingface上发布了其首个kernel MaxSim,旨在优化延迟交互检索(ColBERT/PyLate)的瓶颈问题。

  • ErikKaum在huggingface发布了MaxSim kernel
  • MaxSim用于优化ColBERT/PyLate的交互检索瓶颈

2026年国内医院上线AI项目数量快速增长,但行业面临“科室各自采购”模式导致的数据孤岛、算力浪费等问题。华为对南方医院24个科室调研,总结超100项AI需求,推动从分散工具转向统一底座,实现算力、数据、模型和应用统一。

  • 2026年国内医院AI项目数量快速增长
  • 华为对南方医院24个科室调研,总结超100项AI需求

豆包成为中国唯一日活过亿的AI产品,但近期正降低对用户规模的关注。字节计划五一开启付费订阅,引发用户质疑其能力。过去两年字节仅花17亿元投流豆包,远低于腾讯元宝的222亿。豆包延续字节方法论,但AI行业变化迅速,聊天机器人作为入口的信念动摇。

  • 豆包是中国唯一日活过亿的AI产品
  • 字节计划五一开启豆包付费订阅
  • 字节过去两年仅花17亿元投流豆包

Erik Kaum在HuggingFace上发布了首个kernel MaxSim,旨在解决延迟交互检索(ColBERT/PyLate)中材料化瓶颈问题。

  • Erik Kaum在HuggingFace上发布MaxSim kernel
  • MaxSim针对ColBERT/PyLate延迟交互检索的材料化瓶颈

OpenAI和Anthropic于5月初分别成立企业服务公司,均采用Palantir推广的FDE模式。Anthropic与黑石、高盛合资成立估值15亿美元的企业服务公司;OpenAI筹建The Development Company,计划融资40亿美元,估值100亿美元。FDE岗位数量从2025年4月的643个飙升到2026年4月的5330个,同比增长729%。

  • Anthropic与黑石、高盛成立估值15亿美元的企业服务合资公司。
  • OpenAI筹建The Development Company,计划融资40亿美元,估值100亿美元。
  • FDE岗位从2025年4月的643个增长至2026年4月的5330个,同比增长729%。

韩国初创公司LetinAR正在开发用于AI眼镜的微型光学元件,其透镜仅有指甲盖大小,有望成为AI眼镜时代的光学基础。

  • LetinAR是韩国初创公司,专注于AI眼镜光学元件
  • 其透镜尺寸如指甲盖,为AI眼镜提供光学支持

OpenAI与Dell达成合作,将AI编码工具Codex引入混合云和本地环境,帮助企业安全部署AI编码代理,实现数据和工作流程的集成。

  • OpenAI与Dell建立合作伙伴关系
  • Codex将支持混合云和本地部署
  • 目标是为企业提供安全的AI编码代理

瑞银预测2026年TPU出货总量413万块,其中博通368万块、联发科45万块;2027年出货987万块,博通676万块、联发科311万块。

  • 瑞银预测2026年TPU出货413万块
  • 博通和联发科分别为368万和45万块
  • 2027年TPU出货增至987万块

Colt DCS任命Fumi Takei领导日本业务,以扩大该国AI就绪数据中心容量并推进战略。

  • Colt DCS任命Fumi Takei为日本负责人
  • 该任命旨在支持日本AI数据中心容量扩张

空心光纤(Hollow-core fiber)承诺更快的速度和能效,但高成本和有限收益可能阻碍其在数据中心的广泛应用。

  • 空心光纤提供更快速度和更高能效
  • 高成本和有限收益可能限制其应用
  • 主要面向数据中心领域

艺术家SHL0MS将一幅真实的莫奈画作伪装成AI生成图片发布到X平台,引发大量网友批评该“AI图像”质量低劣。实验揭示了艺术界对AI的强烈偏见,引发关于技术与创作关系的讨论。

  • SHL0MS将真实莫奈画作伪称为AI生成图片发布
  • 网友激烈批评该图像的构图和光影等细节
  • 实验显示创作界存在对AI的反射性反感

Cognizant以6亿美元收购Astreya,旨在增强其AI基础设施和数据中心服务能力,顺应超大规模云服务商投资增长趋势。

  • Cognizant以6亿美元收购Astreya

普华永道发布报告,追踪数据中心对脱碳的影响。报告指出,随着AI增长和数据中心能源需求变化,企业继续投资可持续性,脱碳策略正在被重塑。

  • 普华永道发布报告关注数据中心对脱碳的影响
  • AI增长和能耗需求推动企业调整脱碳策略

TrendForce最新研究指出,高端MLCC因AI芯片需求强劲而供需趋紧,消费级MLCC供应也承压,部分分销商开始预防性补库,供应商提价。ODM与供应商的谈判显示,MLCC整体价格平均跌幅降至近三年最低,预示定价周期进入可能反弹的关键阶段。

  • 高端MLCC因AI芯片需求强劲而供需趋紧
  • 部分分销商开始预防性补库,供应商提价
  • MLCC整体价格平均跌幅降至近三年最低

行业调查显示,用于代理AI的CPU专用服务器通常采用双插槽配置,其DDR5内存容量相比1-2插槽通用服务器提升2至4倍。

  • CPU专用服务器标准配置为双插槽
  • DDR5容量比通用服务器增加2-4倍

Sam Altman在推文中表示,ChatGPT Images 2.0在印度已创建超过10亿张图片,显示了该产品在印度市场的广泛应用。

  • ChatGPT Images 2.0在印度已创建超10亿张图片

台积电CPO方案COUPE on Substrate计划2026年下半年量产。AI GPU基板面积和层数大幅增加,使ABF材料消耗比常规CPU扩大5-10倍。高端ABF基板供需预计长期紧张。

  • 台积电COUPE on Substrate计划2026年下半年量产
  • AI GPU基板ABF材料消耗比CPU扩大5-10倍
  • 高端ABF基板供需预计长期紧张

GBrain宣布将ZeroEntropy作为默认的嵌入和重排序选项,推荐使用以替代OpenAI和Voyage AI。

  • GBrain推荐ZeroEntropy作为默认嵌入和重排序选项,替代OpenAI和Voyage AI。

Garry Tan 开源了他的整个 Claude 代码设置,包含 23 个斜杠命令和 7 个角色,一条安装命令即可使用。该项目在两个月内获得了 97k 星。

  • Garry Tan 开源其 Claude 代码设置
  • 包含 23 个斜杠命令和 7 个角色
  • 两个月内获得 97k 星

Y Combinator首席执行官Garry Tan发布开源AI记忆系统GBrain,采用8层结构增强代理记忆,区别于传统RAG方法。该系统可集成到OpenClaw和Hermes等AI代理中,提升对用户个人信息的理解和记忆能力。

  • Garry Tan发布开源AI记忆系统GBrain。
  • GBrain采用8层结构,不同于RAG。
  • GBrain可集成到OpenClaw和Hermes代理中。

苹果将在新版Siri中强调隐私,可能加入自动删除聊天记录功能。

  • 苹果将推出新版Siri
  • 隐私是新版Siri的主要主题
  • 新版Siri可能包括自动删除聊天记录

谷歌宣布将Google AI Ultra订阅用户的访问权限扩展到全球,并推出基于Street View的新功能,使用户能够模拟真实世界地点。

  • Google AI Ultra订阅用户全球访问权限扩展
  • 推出由Street View驱动的新功能
2026-05-17T19:50

Google DeepMind发布Gemini Omni,这是其在AI领域的新产品/模型。

  • Google DeepMind发布了Gemini Omni

LangSmith Engine推出持续自我改进循环功能,为每个智能体提供始终在线的追踪和自优化能力,推动AI代理开发效率提升。

  • LangSmith Engine实现智能体持续自我改进循环
  • 该引擎为每个智能体提供始终在线的追踪功能

来源:twitter
发布时间:2026-05-17T17:15:04+00:00
This week, the company has been trying out all types of different AI tools including Devin, Mistral, Grok, Perplexity, Cerebras Public API, etc in addition to the typical Claude & ChatGPT/Codex tools. Most of them we will probably churn from very rapidly as it has negative value add, but one tool that has been shocking better than Claude is @AravSrinivas '