清除 当前 2575 条 / 共 3563 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 21 小时前 微信公众号 · 42章经 · 4 天 16 小时前 微信公众号 · DeepTech深科技 · 4 天 16 小时前 微信公众号 · Founder Park · 4 天 16 小时前 微信公众号 · FundaAI · 4 天 16 小时前 微信公众号 · 九章智驾 · 4 天 16 小时前 微信公众号 · 晚点LatePost · 4 天 16 小时前 微信公众号 · 琢磨事 · 4 天 16 小时前 微信公众号 · 甲子光年 · 4 天 16 小时前

独家消息称台积电3nm制程报价下半年上涨15%,明年可能再涨10%,CEO魏哲家预计将在股东会上说明具体情况。

  • 台积电3nm价格下半年上涨15%
  • 台积电3nm明年可能再涨10%
  • CEO将在股东会说明价格调整

Semianalysis发布LLM推理延迟分析:端到端延迟中prefill占48%,decode占52%;prefill又分为prefill extend(缓写入)和cache read(缓存读取)。

  • LLM端到端延迟中prefill占48%
  • LLM端到端延迟中decode占52%
  • Prefill分为prefill extend和cache read

Google在I/O 2026上改革搜索,用AI代理替换蓝色链接,引发用户不满,导致隐私搜索引擎DuckDuckGo安装量激增30%。

  • Google在I/O 2026上用AI代理替换蓝色链接
  • DuckDuckGo安装量因用户反对而增长30%

LangChain JS 的多模态儿童睡前故事生成器作为开源示例被发布,展示了利用该框架进行创意应用的可能性。

  • 多模态儿童睡前故事生成器基于 LangChain JS 构建
  • 该示例为开源项目,可用于学习多模态生成

Google发布Gemini Flash 3.5模型,同时呼吁开放100B参数的Gemma 4 MoE模型。

  • Gemini Flash 3.5已发布
  • 100B参数的Gemma 4 MoE模型被要求开放

NVIDIA 发布 CompileIQ 自动调优工具,可自动搜索最佳编译器选项以提升特定工作负载的性能,如 LLM 推理管线。该工具解决性能工程中编译器选项优化难题,帮助开发者在已优化的基础上进一步榨取性能。

  • NVIDIA 发布 CompileIQ 自动调优工具
  • CompileIQ 自动搜索编译器选项以提升特定工作负载性能
  • 该工具适用于 LLM 推理等场景的进一步优化

StableBrowse 是一款面向 AI 代理的新型浏览器层,声称能减少 70% 的令牌消耗,并实现 3-4 倍的执行速度提升。该产品由 ycombinator 孵化的团队发布。

  • StableBrowse 可减少 AI 代理 70% 的令牌消耗
  • StableBrowse 执行速度快 3-4 倍

小米集团2026年一季度业绩电话会披露:总收入991亿元,经调整净利润61亿元;手机ASP 1310元创历史新高,市占率11.3%连续23季度全球前三;汽车交付80856辆,预计全年交付50万辆,27年三四季度出海;AI大模型全球排名第五,全年AI投入或超160亿元。

  • 小米一季度总收入991亿元,经调整净利润61亿元
  • 手机ASP 1310元创历史新高,市占率11.3%连续23季度全球前三
  • 汽车交付80856辆,预计全年交付50万辆,27年出海

Human Archive宣布完成820万美元种子轮融资,资金将用于模拟人类具身智能的研究。该消息由公司通过推特公布,获得一定关注。

  • Human Archive完成820万美元种子轮融资
  • 资金用于模拟人类具身智能

NVIDIA CUDA 13.3 发布,引入 Tile Programming in C++,支持 Compute Capability 9.0,并带来编译器自动调优和 Python 更新,提升 GPU 开发效率。

  • NVIDIA CUDA 13.3 正式发布
  • 引入 Tile Programming in C++ 高级编程
  • 支持 Compute Capability 9.0

NVIDIA发布CUDA Tile编程技术,允许开发者在现有C++ GPU代码库中使用基于块的编程开发高性能GPU内核。

  • NVIDIA发布CUDA Tile编程技术,支持基于块的GPU内核开发
  • 该技术可集成到现有C++ GPU代码库中

NVIDIA发布Vera CPU基准测试结果,性能比领先x86处理器高1.5倍,Linux内核编译快2倍,内存带宽提升4倍,适用于AI工厂的复杂代理工作负载。

  • Vera CPU性能是领先x86处理器的1.5倍
  • Linux内核编译速度是x86的2倍
  • STREAM TRIAD内存带宽是x86的4倍

a16z发文指出,合规流程繁琐且人工密集,但AI可能迎来突破。许多LLM在LegalBench的162项法律推理任务中得分80-100%,这为AI在合规领域的应用提供了信任基础,因为合规本质上是有操作约束的法律推理。

  • 许多LLM在LegalBench的162项法律推理任务中得分80-100%

WillowVoiceAI 推出语音AI写作助手 Willow Scribe,可快速处理邮件、文档和消息。

  • WillowVoiceAI 发布新产品 Willow Scribe
  • 该产品能在数秒内清理邮件、文档和消息

微软CEO萨提亚·纳德拉转推Mustafa Suleyman的推文,宣布MAI-Image-2.5模型发布,该模型在@arena的文生图排行榜上排名第三,是质量上的又一次提升。

  • MAI-Image-2.5模型发布
  • 在@arena文生图排行榜排名第三

Modine达成40亿美元交易,将冷却产能转化为预留基础设施。AI基础设施开发者开始提前数年预订冷却设备产能,而非仅购买现成产品,反映行业供需模式变化。

  • Modine达成40亿美元交易,将冷却产能转为预留基础设施
  • AI基础设施开发者开始提前数年预订冷却设备产能

OpenArt推出新功能,用户可将单张图片转换为可供创作者精确控制的持久3D世界。

  • OpenArt可将单张图片转换为持久3D世界
  • 创作者能对生成的3D世界进行精确控制

Hugging Face上发布了CHI-Bench,这是世界首个针对人工智能代理的长周期医疗保健基准测试,包含75个真实健康任务。

  • CHI-Bench发布在Hugging Face上
  • 世界首个长周期医疗保健AI代理基准
  • 包含75个真实健康任务

HuggingFace转发Victor Mustar消息:发布Marlin-2B开源视频视觉语言模型,采用Apache 2.0许可。该模型可理解视频内容及时间信息。

  • Marlin-2B是一个开源的视频VLM模型
  • 模型采用Apache 2.0许可证
  • 模型能理解视频内容和时间信息

Web Task API发布,这是一种AI驱动的网页自动化工具,用户可以用自然语言描述重复性任务,实现自动化执行。

  • Web Task API发布,支持自然语言描述任务。
  • 该API专为重复性工作设计。

腾讯混元翻译模型在Hugging Face平台获得大量关注与支持,用户反馈热烈。

  • 腾讯混元翻译模型在Hugging Face上热度高

PrismML 发布了 1-bit 和 Ternary Bonsai Image 4B 系列图像生成模型,专注于运行高质量图像生成。

  • PrismML 发布 1-bit 和 Ternary Bonsai Image 4B 模型
  • 新模型旨在运行高质量图像生成

Anthropic在工程博客中发文,探讨代理的访问和权限应随能力进化,并通过沙箱机制限制潜在破坏性行为。

  • Anthropic发布工程博客,讨论代理权限进化
  • 文章介绍通过沙箱限制代理破坏性行为

据SemiAnalysis观点,Meta将70%的新毕业软件工程师重新分配至强化学习任务,体现公司对RL方向的资源倾斜。

  • Meta将70%新毕业软件工程师重新分配至强化学习任务

Y Combinator宣布开源IDE项目Superset,支持开发者并行运行数百个AI Agent。过去4个月周增长30%,帮助工程师将PR提交量提升10倍。

  • Superset是开源IDE,支持并行运行数百个agent
  • 过去4个月周增长率30%
  • 帮助工程师提交10倍以上的PR

PrismML发布了Binary and Ternary Bonsai Image 4B模型,支持1-bit量化,声称将改变图像生成领域。该消息由xenovacom在推特上转发,获得较多关注。

  • PrismML发布Binary and Ternary Bonsai Image 4B模型
  • 模型支持1-bit量化,可大幅降低计算需求

OpenRouter完成1.13亿美元B轮融资,由CapitalG领投,估值在一年内超过翻倍至13亿美元,使用量半年增长5倍,表明多AI模型聚合需求强劲。

  • OpenRouter完成1.13亿美元B轮融资
  • CapitalG领投,估值达13亿美元
  • 使用量半年增长5倍

@agupta在X平台引用推文称,DeepSeek将其前沿模型永久定价为美国实验室的1/30,该推文获1672点赞,并引发对硬件成本的疑问。

  • DeepSeek前沿模型永久定价为美国实验室的1/30

介绍使用Codex时,可以指示其调用Claude作为子代理处理前端设计工作,通过特定提示词实现更优效果。

  • Codex可调用Claude子代理处理前端设计

Twolabs 正在开发用于护理的人形机器人,首先应用于养老院,旨在解决护理人员超负荷工作及老年人支持不足的问题。该机器人兼具实用性和社交交互能力。

  • Twolabs 正在开发用于护理的人形机器人
  • 机器人首先在养老院应用
  • 机器人兼具实用性和社交交互能力

NVIDIA AI实验室发布了关于文本扩散和弹性推理的技术文章,介绍相关研究成果。

  • NVIDIA AI实验室发布文本扩散技术文章
  • 文章涉及弹性推理方法

AWS发布技术博文,介绍Amazon Bedrock AgentCore平台,该平台帮助开发者构建和运营生成式AI代理,并集成支付功能以解决代理访问付费服务时的账单管理问题。文章还提到AI代理流量快速增长,推动内容提供商和API向按使用付费模式转变。

  • AgentCore是一个模块化托管平台,用于构建和部署生成式AI代理
  • AgentCore集成了支付功能,支持代理动态交易
  • AI代理流量快速增长,推动付费模式变革

AWS发布博客介绍如何使用LangGraph与Amazon Bedrock AgentCore结合AWS Lambda和Step Functions构建高可扩展的无服务器多智能体系统,解决推理延迟、状态管理和可观测性等挑战。

  • AWS提出结合LangGraph和Bedrock AgentCore构建多智能体系统
  • 方案使用Lambda和Step Functions实现无服务器自动扩展
  • LangGraph提供图执行模型以协调多智能体工作流

每天有超过10亿份PDF被创建,但现有AI代理无法可靠读取。今日发布Parse产品以解决这一问题。

  • 每天有超过10亿PDF被创建
  • 发布Parse产品以解决PDF读取问题

AWS博客介绍使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建高性能生成式AI代理系统,解决推理延迟、无状态执行等问题,支持多代理并行推理、上下文持久化和可追踪执行。

  • 使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建多代理系统
  • 架构可减少手动工作,实时响应,扩展到数千交互
  • 支持并行推理、上下文持久化和可追踪执行路径

Perplexity Computer宣布新增功能,可管理Shopify店铺,为电商卖家提供自动化店铺管理服务。

  • Perplexity Computer可管理Shopify店铺

AgentWatch是AWS推出的主动监控代理,能够自动检测CloudWatch告警滞后、Lambda错误堆积、EC2性能下降等问题,帮助DevOps团队从被动响应转向主动预防,减少运维负担和客户影响。

  • AgentWatch是AWS发布的主动监控代理
  • 它解决CloudWatch告警滞后、Lambda错误堆积等问题
  • 旨在帮助团队从被动响应转向主动预防

Arlo Industries推出被动传感器网络,可在3D中跟踪无人机和导弹,无需雷达、无发射、无单点故障,用于防空感知层。该产品已发布。

  • Arlo Industries构建被动传感器网络跟踪无人机和导弹
  • 系统无需雷达、无发射、无单点故障
  • 作为防空感知层发布

英伟达发布PiD超分辨率技术,可在像素空间直接从模型潜在变量实现4倍分辨率提升,适用于任何生成图像。

  • 英伟达发布PiD超分辨率技术
  • PiD技术可实现4倍分辨率提升

NVIDIA CEO黄仁勋在COMPUTEX前夕与台积电董事长魏哲家等高管共进晚餐。

  • 黄仁勋与台积电高管在COMPUTEX前共进晚餐

create_agent文档进行了重大改版,新增的agents页面展示了如何为特定用例构建自定义框架,提供了更灵活的构建方式。

  • create_agent文档已更新
  • 新版页面展示构建自定义用例

AWS博客介绍使用Strands Agents开源框架和AWS服务(如Amazon Bedrock、Kiro IDE)构建AI研究助手,仅需30行代码即可实现,展示了快速开发AI应用的方法。

  • Strands Agents是开源框架,简化AI代理创建
  • 结合AWS服务可在30行代码内构建AI研究助手
  • Kiro IDE提供超过50个 curated powers 加速开发

TeraWulf与施耐德电气达成2.9亿美元AI数据中心建设协议,在纽约Lake Mariner园区部署液冷技术,利用89%零碳电力,建设周期仅12个月。

  • TeraWulf与施耐德电气签署2.9亿美元AI数据中心交易
  • 设施位于纽约Lake Mariner园区,采用液冷技术
  • 建设周期12个月,使用89%零碳电力

AWS 发布了一篇博客,介绍如何为 Amazon Quick 构建企业可观测性解决方案。该方案将 Amazon CloudWatch vended logs 和 AWS CloudTrail 事件整合到 Amazon S3 数据湖中,可通过 Amazon Athena、QuickSight 仪表盘和自定义 Chat Agent 进行查询,以跟踪用户采用情况、满意度、成本和治理。

  • Amazon Quick 是一个生成式 AI 平台,整合了 Spaces、Chat agents、Flows 等功能
  • 解决方案将 Amazon CloudWatch 和 CloudTrail 数据汇聚到 S3 数据湖
  • 用户可使用 Athena、QuickSight 和 Chat Agent 查询分析数据

Alchemize 推出首个 AI 原生报关经纪服务,利用 AI 为进口商提供实时监管信息和快速清关,将清关时间从数天缩短至几分钟。

  • Alchemize 构建了首个 AI 原生报关经纪平台
  • 平台实现分钟级清关,替代传统数天流程

初创公司Human Archive由伯克利和斯坦福研究人员创立,雇佣印度零工工人佩戴摄像设备及传感器,采集真实世界物理训练数据,供AI与机器人实验室训练使用。

  • Human Archive由伯克利和斯坦福研究者创立
  • 雇佣印度零工工人穿戴摄像头和传感器
  • 采集的数据用于AI和机器人实验室训练

亚马逊Quick服务可从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据,生成Word、Excel等格式文档,并利用Spaces知识库融入组织上下文。

  • Quick从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据
  • 支持生成Word、Excel等格式的专业文档
  • 利用Spaces知识库生成符合组织上下文的文档

Microsoft Copilot Cowork存在安全漏洞,攻击者可通过提示注入导致数据外泄。该产品允许代理自动发送邮件到用户收件箱,邮件中的外部图片可触发网络请求泄露数据。同时,OneDrive生成的预认证下载链接可能被利用,使攻击者下载文件。

  • Microsoft Copilot Cowork可自动发送邮件到用户收件箱
  • 邮件中的外部图片可触发网络请求导致数据泄露
  • OneDrive预认证下载链接可能被攻击者利用下载文件

医药板块一季度复苏,医保基金1-3月收入增9.9%、支出增5.5%,财政卫生健康支出增12.1%,创新药融资额同比增130%。脑机接口26年商业化元年,一季度融资额超去年全年3倍。

  • 医保基金1-3月收入同比增长9.9%,支出同比增长5.5%
  • 财政卫生健康支出同比增长12.1%
  • 脑机接口一季度融资额超去年全年3倍

亚马逊科学团队提出一种新方法,通过引入全局分叉令牌使LLM产生多种推理路径,并采用集监督微调(SSFT)避免模式坍缩,该论文在ICLR 2026发表。

  • 亚马逊提出全局分叉令牌引导LLM多种推理模式
  • 提出集监督微调(SSFT)防止模式坍缩
  • 该论文发表于ICLR 2026