清除 当前 2582 条 / 共 3571 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 2 小时前 微信公众号 · 42章经 · 4 天 20 小时前 微信公众号 · DeepTech深科技 · 4 天 20 小时前 微信公众号 · Founder Park · 4 天 20 小时前 微信公众号 · FundaAI · 4 天 20 小时前 微信公众号 · 九章智驾 · 4 天 20 小时前 微信公众号 · 晚点LatePost · 4 天 20 小时前 微信公众号 · 琢磨事 · 4 天 20 小时前 微信公众号 · 甲子光年 · 4 天 20 小时前

推文指出,Gemini 3.5 Flash定价9美元,较15个月前发布的Gemini 2.0 Flash的0.4美元上涨22.5倍。

  • Gemini 3.5 Flash定价9美元
  • Gemini 2.0 Flash定价0.4美元
  • 3.5 Flash价格是2.0 Flash的22.5倍

Eric Jang报告指出,当前AI模型已能良好实现和运行实验,但无法可靠地选择下一个要探究的正确问题,也无法判断何时陷入死胡同,这是自动化AI研究的主要瓶颈。

  • 当前AI模型能良好实现和运行实验
  • 无法可靠选择下一个正确问题或判断死胡同

JeffDean在推特宣布Google发布新模型Gemini 3.5 Flash,强调其快速且能力强大。

  • Google发布Gemini 3.5 Flash模型
  • 该模型强调快速与能力兼备

OpenAI 宣布 ChatGPT 每周生成超过 15 亿张图片,产品负责人和研究专家探讨图像 2.0 的新用例和趋势。

  • ChatGPT 每周生成超 15 亿张图片
  • OpenAI 产品负责人与研究专家讨论图像 2.0 新趋势

在Google IO 2026上,Google宣布为Gmail的AI收件箱增加对话式语音搜索功能,允许用户通过语音指令让Gemini AI查找邮件中的特定信息。

  • Google IO 2026宣布Gmail新增对话式语音搜索
  • 用户可语音让Gemini查找邮件细节

Google推出AI驱动的“信息代理”功能,可后台监控用户指定主题,主动推送相关更新和变化,提升搜索体验。该功能适用于需要持续跟踪动态的场景。

  • Google发布AI信息代理,可后台监控主题并主动提醒更新。

Ocean,一个代理型邮件安全平台,从Lightspeed Venture Partners获得了2800万美元的融资。

  • Ocean获得2800万美元融资
  • 投资方为Lightspeed Venture Partners
  • Ocean是代理型邮件安全平台

伯克希尔哈撒韦于2025年Q3首次投资谷歌,并在2026年Q1加仓。巴菲特引用对TPU v5p架构的理解,表示其类似于铁路系统。

  • 伯克希尔哈撒韦于2025年Q3首次投资谷歌
  • 2026年Q1伯克希尔加仓谷歌股份
2026-05-19T20:45

datasette-llm-accountant 0.1a4版本发布,修复了跟踪响应链的bug,涉及datasette-llm项目。

  • datasette-llm-accountant 0.1a4发布
  • 修复了跟踪响应链的bug
2026-05-19T20:36

llm-gemini 0.32a0 版本发布,兼容 llm>=0.32a0 alpha,新增流式推理令牌功能。

  • llm-gemini 0.32a0 发布
  • 兼容 llm>=0.32a0 alpha
  • 新增流式推理令牌功能

OpenAI启动与新加坡的多年度AI合作,旨在扩大AI部署、培养本地人才、支持企业和公共服务使用AI。

  • OpenAI宣布与新加坡建立多年AI合作伙伴关系
  • 合作重点包括扩大AI部署、培养本地人才
  • 计划支持企业和公共服务的AI应用
2026-05-19T20:28

开源项目datasette-llm发布0.1a8版本,修复了llm_prompt_context()钩子未完整收集响应链的bug。

  • datasette-llm 0.1a8版本发布
  • 修复llm_prompt_context()钩子未完整收集响应链的bug

OpenAI CEO Sam Altman在推特表示,客户对算力确定性需求增加,随着模型进步,全球算力将长期供不应求。公司推出1-3年承诺的折扣令牌,以帮助规划并实现双赢。

  • OpenAI提供1-3年承诺的折扣令牌。
  • 客户对算力确定性需求增加。
  • 算力可能长期供不应求。

GoogleDeepMind展示Gemini 3.5 Flash模型与Antigravity合作,通过部署多个子代理实现城市设计与建造,并附有演示视频。

  • Gemini 3.5 Flash可部署多个子代理
  • 用于设计并构建整个城市

NVIDIA宣布与Blue Yonder合作,致力于为全球供应链带来可扩展的AI创新。双方未披露具体合作细节。

  • NVIDIA宣布与Blue Yonder合作

OpenAI推出新服务Guaranteed Capacity,允许客户长期保证对OpenAI计算资源的访问。该服务基于OpenAI在基础设施、合作伙伴关系和容量规划方面的长期投资,帮助客户在计算资源受限的环境下提前规划关键工作负载。

  • OpenAI推出Guaranteed Capacity新服务
  • 该服务让客户长期保证OpenAI计算资源访问

Hugging Face 发布了名为 Carbon 的 DNA 模型,速度比次优模型快 275 倍,能够高效处理 DNA 数据。

  • Hugging Face 发布 Carbon DNA 模型
  • Carbon 速度比次优模型快 275 倍

在推特上,LoubnaBenAllal1宣布推出开源生成式DNA基础模型系列Carbon,其中Carbon-3B性能与Evo2-7B相当,但运行速度快250倍。

  • 发布Carbon系列开源生成式DNA基础模型
  • Carbon-3B性能匹配Evo2-7B
  • Carbon-3B运行速度快250倍

发布Carbon DNA模型,速度比现有最佳模型快275倍,可快速处理大量数据。

  • 发布Carbon DNA模型
  • 速度比次优模型快275倍

a16z合伙人引用案例对比了德克萨斯州奥斯丁和邻近城镇对Flock监控系统的使用效果:奥斯丁关闭Flock后未能追踪到嫌疑人,而邻近城镇启用Flock后迅速抓获了嫌疑人。

  • 奥斯丁关闭Flock后未能找到嫌疑人
  • 邻近城镇启用Flock后快速抓获嫌疑人

英伟达技术博客区分了AI模型评估与AI代理评估的不同:模型评估测试基础模型能力,代理评估测试端到端系统行为如规划、工具调用和处理不确定性。

  • AI代理评估与模型评估回答不同问题
  • 模型评估测试基础模型的语言理解、指令遵循等能力
  • 代理评估测试系统端到端行为:规划、调用工具、处理不确定性

Google DeepMind宣布推出Gemini for Science,一套实验性AI工具,旨在帮助科学家探索假设、规模化验证工作、轻松理解文献,以加速科学发现。

  • Google DeepMind推出Gemini for Science工具套件
  • 该工具帮助科学家探索假设、验证工作、理解文献

Andrej Karpathy提交2026年Q1 13F文件,前十大持仓包括做空半导体ETF及多家科技股看跌期权,同时增持AI基础设施多头仓位,如Bloom Energy、SanDisk等。新开看跌期权持仓总规模约84.5亿美元。

  • Andrej Karpathy提交2026年Q1 13F文件
  • 前十大持仓中有8个为看跌期权,包括SMH、NVDA、ORCL等
  • 新开看跌期权总规模约84.5亿美元

NVIDIA AI团队发布SANA-WM开源世界模型,参数26亿,单GPU运行,输入图像、文本和相机轨迹即可生成60秒可控视频。

  • NVIDIA发布SANA-WM开源世界模型
  • 模型参数26亿,单GPU运行
  • 支持60秒视频生成与精准相机控制

Google在Google Flow中推出全新智能代理和Gemini Omni模型,相关消息在Google I/O大会发布,引发广泛关注。

  • Google在Flow中引入智能代理
  • 发布全新Gemini Omni模型

谷歌发布Gemini 3.5 Flash模型,在Box AI复杂文档任务评估中性能显著提升,较Gemini 3 Flash平均提升12个百分点。各行业测试结果均有所增长,其中医疗和生命科学领域提升超20个百分点。模型即将在Box AI Studio和API中可用,Box MCP服务器也将集成。

  • Gemini 3.5 Flash模型发布,性能较上一代大幅提升
  • 在Box AI复杂文档任务上平均提升12个百分点
  • 医疗行业提升22个百分点,公共部门提升17个百分点

Google DeepMind 在 Google I/O 大会上宣布,其最新模型 Google Flow 与 Gemini Omni 结合,支持批处理编辑、改进角色一致性等功能,旨在提升视频故事创作的电影感。

  • Google Flow 与 Gemini Omni 结合发布
  • 新模型支持批处理编辑和角色一致性改进
  • 在 Google I/O 大会上公布

deepagents v0.6版本发布,主要优化性能,通过模型层控制实现。

  • deepagents v0.6版本发布,侧重性能优化
  • 性能优化首先体现在模型层控制

Google DeepMind宣布扩展其Antigravity生态系统,旨在帮助开发者减少调试工作,提升开发效率。

  • Google DeepMind扩展Antigravity生态系统

NVIDIA AI 在 Nemotron Labs 发布文章,介绍如何在执行前验证代理技能的方法,涉及技术细节。

  • NVIDIA AI 发布关于验证 Agent 技能的技术文章

Memory Store产品发布,为团队和AI代理提供共享公司大脑功能,将分散在Slack、邮件和头脑中的知识转化为实时维基。

  • Memory Store产品正式发布
  • 该产品将团队知识转化为AI代理和队友的共享维基

LangChain的应用AI工程师Palash Shah在社交媒体上介绍了LangSmith Engine的内部工作原理,展示了该引擎的技术细节。

  • Palash Shah讲解LangSmith Engine内部机制

在Google I/O大会上,Google DeepMind发布了Gemini 3.5 Flash模型,该模型已成为其日常研究周期的重要组成部分。

  • Google DeepMind在Google I/O发布Gemini 3.5 Flash模型。

谷歌在Google I/O上发布Gemini 3.5 Flash,具有前沿性能,适用于代理和编码任务。该模型今日全球推出,速度是其他前沿模型的4倍。

  • 谷歌推出Gemini 3.5 Flash模型,专注于代理和编码性能
  • 模型今日全球上线,速度是其他前沿模型的4倍

OpenAI宣布新增AI生成图像识别方法,除C2PA内容凭证外,还集成SynthID水印,并推出公开验证工具,用户可检查图像是否由OpenAI产品生成。

  • OpenAI新增SynthID水印用于识别AI图像
  • 提供公开验证工具检查图像是否由OpenAI生成
  • 现有C2PA内容凭证基础上增加新识别方式

谷歌在IO大会上发布Gemini 3.5系列模型,首发版本为3.5 Flash,针对编码和智能体工作流进行优化。该模型在Terminal-Bench和MCP Atlas等基准测试中得分超过3.1 Pro,运行速度比其他前沿模型快4倍,在Google Antigravity中优化后速度提升至12倍。

  • 发布Gemini 3.5系列,首发3.5 Flash
  • 3.5 Flash在智能体和编码基准测试中得分超3.1 Pro
  • 3.5 Flash在Antigravity中优化后速度提升12倍

Blink.new发布了全球首款AI Chrome扩展构建器,用户可将任何网站上的手动操作步骤转化为AI扩展,目前处于推广阶段。

  • Blink.new推出世界首个AI Chrome扩展构建器

谷歌顶级客户每日处理超过10亿个tokens,若转向使用Gemini 3.5 Flash模型,每年可节省高达10亿美元的成本。

  • 谷歌顶级客户每日处理超10亿tokens

Google使用Gemini 3.5 Flash模型在12小时内构建了一个完整操作系统,成本不到1000美元。该信息来自个人推特,尚未得到官方确认。

  • Google用Gemini 3.5 Flash在12小时内构建操作系统
  • 构建成本不到1000美元

Google DeepMind宣布推出Gemini 3.5系列模型,首批发布3.5 Flash版本,号称最强代理和编码模型,结合前沿智能与实际行动能力。

  • Google DeepMind发布Gemini 3.5模型系列
  • 首个版本为3.5 Flash,面向代理和编码优化

Google发布多模态AI模型Gemini Omni,据Demis称,目标是实现任意输入输出。该模型在多模态AI领域具有里程碑意义。

  • Google发布多模态AI模型Gemini Omni
  • Gemini Omni目标实现任意输入输出
  • 该消息源自DeepMind CEO Demis

Leadbay AI 宣布获得 430 万美元融资,客户包括 Corgi、Deel、L'Oréal,并获客户正面评价。

  • Leadbay AI 获得 430 万美元融资
  • 客户包括 Corgi、Deel、L'Oréal

Google DeepMind 发布 Gemini Omni 模型,这是首个能从任何输入生成任何输出的模型,首先从视频开始。该模型结合了 Gemini 的智能与生成媒体系统,代表了世界理解、多模态和编辑能力的飞跃。

  • Google DeepMind 发布 Gemini Omni 模型。
  • 该模型可从任何输入生成任何输出,首先支持视频。
  • Gemini Omni 结合了 Gemini 智能与生成媒体系统。

据社交媒体消息,米哈游计划投资130亿美元构建大语言模型(LLM),网友评论该投资可用于游戏生成等领域。

  • 米哈游计划投资130亿美元构建大语言模型

SemiAnalysis报告指出,AMD MI355在GLM5架构上用于单节点FP8推理时,价格比NVIDIA B200低40%,该对比发生在MI355发布14周后。

  • AMD MI355比NVIDIA B200便宜40%(单节点FP8推理)
  • 价格对比基于GLM5架构,时间为MI355发布14周后

MongoDB 宣布 LangGraph.js Long-Term Memory Store 正式可用,该集成提供跨会话长期记忆功能。

  • LangGraph.js Long-Term Memory Store 正式可用
  • 该集成提供跨会话长期记忆

AMD MI355在GLM5架构下单节点FP8推理比NVIDIA B200便宜40%,该信息于GLM5初始发布14周后披露,支持SGLang v0.12的CUDA和ROCm环境。

  • AMD MI355比NVIDIA B200便宜40%
  • 适用于GLM5架构的单节点FP8推理
  • 支持SGLang v0.12的CUDA和ROCm

Google与Blackstone达成50亿美元合作,推动其TPU定制AI加速器突破传统云模式,为企业提供独立于NVIDIA的AI基础设施替代方案。

  • Google与Blackstone达成50亿美元TPU合作
  • 该合作旨在推动Google TPU作为NVIDIA基础设施的企业替代方案

Composer 2.5 成为 Cursor 中最受欢迎的模型,官方宣布为所有用户提供当日10倍使用量。

  • Composer 2.5 成为 Cursor 中最受欢迎的模型
  • 用户当日可享受10倍使用量

Unsloth Studio 推出新功能,支持自动推测解码和 MTP,可将推理速度提升至 2 倍且无精度损失,并针对 Mac、GPU 和 CPU 优化了参数。

  • Unsloth Studio 新增自动推测解码和 MTP 支持
  • 推理速度提升可达 2 倍且无精度损失
  • 已针对 Mac、GPU 和 CPU 优化参数