当前 3573 条 / 共 3589 条
筛选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 10 小时前 微信公众号 · 42章经 · 5 天 5 小时前 微信公众号 · DeepTech深科技 · 5 天 5 小时前 微信公众号 · Founder Park · 5 天 5 小时前 微信公众号 · FundaAI · 5 天 5 小时前 微信公众号 · 九章智驾 · 5 天 5 小时前 微信公众号 · 晚点LatePost · 5 天 5 小时前 微信公众号 · 琢磨事 · 5 天 5 小时前 微信公众号 · 甲子光年 · 5 天 5 小时前

Vercel 创始人宣布开源一个用于深度安全审查的智能体编排工具 deepspec。该工具内部使用后,已在多个大型开源项目中发现关键漏洞。它针对 Vercel Sandbox 优化,可并行调度数千个智能体扫描代码库,将数月的工作缩短至几分钟。作者邀请用户尝试,并为开源项目提供赞助支持。

  • 开源深度安全审查工具 deepspec 发布
  • 工具可并行数千个智能体扫描代码库
  • 工具优化用于 Vercel Sandbox 环境

a16z数据显示,软件贷款的平均出价已降至面值的约90美分,反映出该资产类别的估值变化。

  • 软件贷款平均出价降至面值90美分

Appfigures数据显示,推出视觉模型的应用下载量增长是仅升级聊天机器人的6.5倍,但大多数应用未能将下载高峰转化为收入。

  • 视觉模型推出带来6.5倍下载增长
  • 多数应用未将下载峰值转化为收入

a16z发布推文指出,美国货币市场基金余额达到历史最高水平,并附有相关图表链接。

  • 美国货币市场基金余额创历史新高

Shopify CEO Tobi Lütke 在采访中透露,公司超过50%的代码由AI生成,许多最佳工程师今年没有手动提交代码。内部开发了名为River的工具,在Slack中运行,承担了大量工程工作。

  • Shopify超过50%代码由AI生成
  • 最佳工程师今年未手动提交代码
  • 内部工具River负责大量工程工作

推文介绍nanowhale,一个由代理完全预训练的小型DeepSeek模型,灵感来自Karpathy的nanochat。

  • nanowhale是一个小型DeepSeek模型
  • 该模型由代理完全预训练

Twitter用户@swyx转推介绍Chrome扩展Inputr,该扩展可自动检测并修复网页中的图片上传框尺寸要求。

  • Inputr是一款Chrome扩展,可修复任意网页图片上传框的尺寸要求。

Amazon QuickSight 推出 Dataset Q&A 功能,支持自然语言数据集问答,用户无需构建新仪表板即可秒级获取答案,旨在解决传统 BI 仪表板无法灵活应对临时、多维问题的瓶颈。该功能面向 AWS 技术现场团队等用户,提升数据决策效率。

  • Amazon QuickSight 推出 Dataset Q&A 功能
  • 用户可用自然语言提问并秒级获得答案
  • 该功能无需构建新仪表板或等待 BI 团队

AWS 宣布 Amazon Bedrock AgentCore 推出新功能预览,包括基于生产痕迹的推荐、批量评估和A/B测试,以优化AI agent质量,解决agent性能退化问题。

  • Amazon Bedrock AgentCore 新增推荐功能,可从生产痕迹生成优化建议。
  • 新功能支持批量评估和A/B测试来验证优化建议。
  • AgentCore 旨在提供观测、评估、改进的闭环优化agent质量。

Amazon SageMaker AI推出智能体引导的模型定制工作流程,用户通过自然语言描述用例,AI编码助手自动完成数据准备、技术选择、微调、评估和部署,支持SFT、DPO、RLVR等技术,并生成可编辑的代码工件。

  • Amazon SageMaker AI发布智能体引导的模型定制功能
  • 支持自然语言描述用例,自动化微调全流程
  • 集成LLM-as-a-Judge评估和灵活部署到Bedrock或SageMaker

SemiAnalysis指出常见误解:TPU v8i并非训练芯片,而是推理芯片。v8i配备8组HBM3E 12-Hi显存,共288GB,带宽8.6 TB/s,而v8t为6组216GB、6.5 TB/s。v8i有384MB片上SRAM,v8t为128MB。FP4算力上,v8i为10.1 PFLOPs,v8t为12.6 PFLOPs。

  • TPU v8i配备8组HBM3E 12-Hi,共288GB显存,带宽8.6 TB/s
  • TPU v8t配备6组HBM3E,共216GB显存,带宽6.5 TB/s
  • TPU v8i的FP4算力为10.1 PFLOPs,v8t为12.6 PFLOPs

Anthropic 和 OpenAI 分别推出新举措,帮助企业在其组织内部署 AI 代理。该趋势尚处早期但预计将迅速扩大,涉及升级 IT 系统、调整工作流程以及管理人与代理的关系。

  • Anthropic 和 OpenAI 推出帮助企业部署 AI 代理的新举措
  • AI 代理进入知识工作领域,需升级 IT 系统和流程

Amazon Quick发布新的生成式AI功能,用户可通过自然语言提示从数据集生成包含多工作表、可视化、筛选器和计算字段的仪表板,大幅缩短制作时间。用户可审核编辑交互式计划后一键发布为仪表板。

  • Amazon Quick从自然语言提示生成多工作表仪表板
  • 功能包括自动选择可视化、添加筛选器和计算字段
  • 用户可审核编辑计划后一键发布

Sierra 完成 9.5 亿美元融资,至此公司可用资金超过 10 亿美元。Sierra 表示将利用这笔资金成为 AI 驱动客户体验的全球标准。

  • Sierra 完成 9.5 亿美元融资
  • 公司可用资金超过 10 亿美元
  • 计划成为 AI 客户体验的全球标准

OpenAI声称,马斯克在诉讼中发送短信,称如果OpenAI不和解,Altman和Brockman将成为美国最被憎恨的人。

  • 马斯克短信称OpenAI若不解散,Altman和Brockman将成最被憎恨的人

GStack v1.26.3版本现已与GBrain集成,使得编程代理能够获取比以往更多的上下文信息,提升了其智能性。

  • GStack v1.26.3版本与GBrain集成

Amazon Quick 现支持将 Amazon S3 Tables(Apache Iceberg 表)作为新数据源,用户可直接查询和可视化数据湖中的 Iceberg 表,无需中间层,减少数据移动、提升性能并保持单一真实来源。

  • Amazon Quick 引入 S3 Tables 作为新数据源
  • 用户可直接查询 Apache Iceberg 表,无需中间数据层
  • 新功能旨在减少数据移动,提升性能并保持单一真实来源

Amazon Quick 推出 Dataset Q&A 新功能,用户可直接用自然语言查询整个数据集,无需预配置。该功能将问题转化为 SQL 并快速返回结果,同时保持企业级安全与治理,解决了商业智能中临时查询的瓶颈问题。

  • Amazon Quick 新增 Dataset Q&A 功能
  • 支持自然语言查询完整数据集,无需预配置
  • 系统自动将问题转为 SQL 并确保安全权限

AWS宣布SageMaker AI推理端点支持容量感知实例池,允许用户定义优先级实例类型列表,在创建、扩展时自动fallback到可用实例,无需手动干预,适用于多种端点类型。

  • SageMaker AI推出容量感知实例池功能
  • 用户可定义多个优先级实例类型
  • 端点在创建、扩展时自动选择可用实例

Azure IaaS采用深度防御架构,并在安全设计中贯彻Microsoft的Secure Future Initiative原则,包括安全设计、默认安全和运行安全。文章是Azure IaaS系列博客的第三部分,介绍平台的安全实践。

  • Azure IaaS采用深度防御的多层安全架构
  • Microsoft SFI原则指导Azure IaaS安全设计

Anthropic和OpenAI分别与资产管理公司成立合资企业,旨在更积极地向企业客户营销其AI服务产品。

  • Anthropic与资产管理公司合作推出企业AI服务合资企业
  • OpenAI与资产管理公司合作推出企业AI服务合资企业
2026-05-04T15:53

Redis 作者 Salvatore Sanfilippo 提交了新增 array 数据类型的 PR,包含 ARCOUNT、ARDEL 等十余个新命令,其中 ARGREP 支持服务端 grep 并使用 TRE 正则库。目前该实现位于分支中,已有交互式 playground 供测试。

  • Redis 新增 array 数据类型,已提交 PR
  • 新增 ARCOUNT、ARDEL 等十余个命令
  • ARGREP 命令使用 TRE 库实现服务端 grep

@thorstenball 发推称 GPT-5.5 已在 Amp 上线,本人上周主要使用该模型,认为它兼具 Opus 的互动性和更少触发、更全面的优点。

  • GPT-5.5 已在 Amp 上线
  • @thorstenball 上周主要使用 GPT-5.5

AI数据中心热潮正在重塑美国电力供应链。电力设备需求增长推动供应增长,超大规模数据中心建设加速,但基础设施挑战持续存在。

  • 数据中心电力设备需求增长推动供应增长
  • 超大规模数据中心建设加速
  • 基础设施挑战持续存在

Centra公司在内华达州里诺市的数据中心项目已封顶,该项目于去年11月破土动工。

  • Centra里诺数据中心封顶
  • 项目于去年11月开工
2026-05-04T15:07

亚马逊在负责任AI方面投入大量资源,建立了覆盖预训练、后训练、评估和第三方监控的RAI流程,开发了超过70个内部和外部RAI工具,发表了500多篇研究论文,并提供了数万小时的RAI培训。

  • 亚马逊建立覆盖预训练、后训练、评估和第三方监控的RAI流程
  • 亚马逊开发了超过70个内部和外部RAI工具
  • 亚马逊发表了500多篇RAI相关研究论文

Stripe的设计经理Owen Williams构建了内部AI原型工具Protodash,该工具基于Cursor规则、React组件和MCP集成,使设计师和产品经理能快速将设计系统转化为可点击的原型,从而加速从备忘录到可演示原型的流程,意外收获是产品经理成为主要用户。

  • Stripe设计经理Owen Williams开发了内部AI原型工具Protodash
  • Protodash基于Cursor规则、React组件和MCP集成
  • 该工具让设计师和PM在几分钟内制作生产质量原型

Expanse 推出新平台,利用空闲 GPU 容量,支持云和本地 HPC 环境,提供作业提交、优化和调试功能。

  • Expanse 推出释放浪费 GPU 容量的平台。
  • 平台支持云和本地 HPC 环境。
  • 提供作业提交、优化和调试功能。

北卡罗来纳州提议AI基础设施法案,将电力、水和电网扩建成本转嫁给大型数据中心,挑战现有激励模式,重塑选址策略。

  • 北卡罗来纳州拟立法将基础设施成本转嫁给大型数据中心
  • 法案涉及电力、水和电网扩建费用
  • 旨在挑战长期激励模式并影响选址策略

Redis宣布推出新的数组数据类型,支持通过索引访问和文本grep搜索机制,该消息由@simonw在Twitter上发布,获得较多关注。

  • Redis发布新的数组数据类型
  • 新类型支持索引访问和文本grep搜索

Pollen Robotics的Reachy Mini无线版机器人已在新加坡上市。此消息源自推特转发,显示产品在新加坡市场正式推出。

  • Reachy Mini无线版在新加坡上市。
  • Pollen Robotics推出Reachy Mini无线版机器人。

Shopify CEO Tobi Lütke在播客中透露,AI现已生成Shopify超过50%的代码,且比例持续增长;许多顶级工程师自2023年12月以来未手动编写代码,而是转向AI代理的引导。他还讨论了AI被用作裁员替罪羊等话题。

  • Shopify超过50%的代码由AI生成,比例持续增长。
  • 许多顶级工程师自2023年12月未手动编写代码。

哈佛研究显示,Beth Israel医院用o1和真实医生进行76例急诊分诊测试,o1准确率67%,医生为50-55%。研究指出当前缺乏AI医疗问责框架。

  • o1在76个急诊分诊案例中准确率67%
  • 医生准确率为50-55%

第三方开发了一个Huggingface模型可视化工具,用户只需输入模型URL即可探索任意粒度的模型结构。该工具由@andrew_n_carr在社交媒体上推荐,获得大量关注。

  • 有人开发了Huggingface模型可视化工具
  • 工具可通过URL探索任意粒度模型

专家调研显示AppLovin 1Q26电商广告占比达32%,CTV首次贡献显著;Apple Link-out推动iOS游戏广告市场增长约5.5%,AppLovin及Unity受益。1Q26广告预算同比增长132.8%,超预期。

  • 1Q26 AppLovin电商广告占代理预算约32%
  • Apple Link-out使iOS游戏广告市场增长约5.5%
  • AppLovin 1Q26广告预算同比增长132.8%

本周财报显示谷歌、微软、亚马逊云均提高资本开支,云收入加速增长:GCP增长63%,Azure增长39%,AWS预计下季度加速。DeepSeek V4推动KV缓存从DRAM/HBM大规模迁移至SSD,成为NAND需求的结构性拐点。

  • 谷歌/微软/亚马逊云提高资本开支,云收入加速增长
  • GCP增长63%,Azure增长39%,AWS预期加速
  • DeepSeek V4推动KV缓存从DRAM/HBM迁移至SSD

Pantheon宣布计划在克罗地亚建设大型数据中心园区,自称将成为该国历史上最大投资。该项目属于“表后”数据中心,具体规模和投资金额尚未公布。

  • Pantheon计划在克罗地亚建设大型数据中心园区
  • 该公司声称该项目将是克罗地亚史上最大投资

多国气象模型预计下半年将出现中等偏强厄尔尼诺,历史上1950年以来共发生21次厄尔尼诺,超强事件会导致棕榈油、白糖、橡胶等农产品减产涨价。内容属于研报系列,包含投资建议。

  • 多国气象模型预计下半年将出现中等偏强厄尔尼诺
  • 历史上1950年以来共发生21次厄尔尼诺
  • 超强厄尔尼诺会导致棕榈油、白糖、橡胶等农产品减产涨价

哈佛大学研究显示,OpenAI的o1-preview模型在76个真实急诊病例中,诊断准确率高于两名主治医生。该模型仅使用原始电子健康记录文本,在分诊阶段准确率达67.1%,医生为63.2%。研究发表于《Science》。

  • 哈佛研究对比OpenAI o1-preview与两名医生在76个急诊病例中的诊断准确率
  • AI模型在分诊阶段准确率67.1%,高于医生的63.2%
  • 研究仅使用原始电子健康记录文本,未使用结构化数据

cover_image

AI时代需要什么样的团队

Original 李智勇 李智勇 琢磨事

极端值几乎百分百确定就是“无人公司”。

但在许许多多领域显然并不能一步到达“无人公司”,这时候就需要新的组织模式来适配AI这边高速增长是生产力。

那这种新模式是什么呢?

如果我们重新审视“人与技术”的协作关系,未来的团队一定是极简的:

一个人类角色加上一个AI,去覆盖一个完整的业务职能。

正如缝隙理论

  • AI时代需要什么样的团队
微信公众号 · 琢磨事 微信公众号 琢磨事 AI 半导体 投资研究

推文推荐Granite模型(新)和Gemma-E4B模型,适用于8-16GB显存硬件,附有链接。

  • 推文推荐Granite模型(新)和Gemma-E4B模型
  • 模型适用于8-16GB显存硬件

OpenAI重构了其WebRTC技术栈,以支持低延迟、全球规模的实时语音AI,并实现无缝的对话轮换。

  • OpenAI重构WebRTC栈以支持实时语音AI
  • 新架构实现低延迟和全球规模
  • 对话轮换无缝衔接

据报告,OpenAI未达到收入和用户目标,内部对数据中心支出承诺存在担忧。公司正在重组Stargate项目并筹备IPO。

  • OpenAI未达到收入和用户目标
  • 内部对数据中心支出承诺存在担忧
  • 公司正在重组Stargate项目并筹备IPO

2026年4月第二波AI模型架构发布,包括蚂蚁Ant Ling 2.6 1T、Minimax M2.7、小米MiMo V2.5、Poolside Laguna XS.2、腾讯Hy3-preview、IBM Granite 4.1等。

  • 蚂蚁发布Ant Ling 2.6 1T模型
  • Minimax发布M2.7模型
  • 小米、腾讯、IBM等发布新模型

Clement Delangue宣布在机器学习内部工具中新增Yolo模式,并提示用户自担风险。该信息源自个人社交媒体,细节有限。

  • ML Intern新增Yolo模式
2026-05-03T15:13

Anthropic的研究发现,大多数情况下Claude不会表现出谄媚行为,但在灵性和关系领域,谄媚比例分别高达38%和25%。

  • 仅9%的对话包含谄媚行为
  • 灵性话题谄媚比例38%
  • 关系话题谄媚比例25%

UiPath CMO Michael Atalla 在访谈中表示,公司 IPO 五年来已从任务自动化转向编排AI代理、机器人与人类工作协同。他指出许多AI项目因缺乏护栏而失败,并认为AI引发的就业焦虑真实存在但需细致看待。

  • UiPath 从自动化任务转向编排AI代理与人类协作。
  • 许多AI项目因缺乏护栏而无法推进。
  • AI引发的就业焦虑真实存在但有细微差别。

聚丙烯管道系统正被应用于高密度数据中心环境,旨在提升冷却系统运行效率并促进废热回收利用。相关企业aquatherm已推出针对性管道解决方案,以满足数据中心日益增长的散热与温控需求。该技术路径有助于优化数据中心整体能耗管理。

  • 聚丙烯管道系统应用于高密度数据中心以提升冷却效率。
  • 该系统旨在促进数据中心废热回收利用。
  • aquatherm推出针对性方案满足数据中心散热需求。

Replit庆祝成立10周年,宣布Agent功能将于5月2日起对所有用户免费开放,并推出App Monitoring监控功能。

  • Replit宣布10周年庆祝活动
  • Agent功能在5月2日免费开放
  • 推出App Monitoring with Agent

在AIE Europe大会上,Vibe-kanban创始人现场宣布关闭该项目,项目仍有3万月活用户,将作为开源项目继续存在。创始人解释关闭原因:未做企业销售和代币转售。

  • Vibe-kanban在AIE Europe现场被关闭
  • 项目仍有3万月活用户
  • 创始人称未向企业销售和转售代币