清除 当前 2584 条 / 共 3575 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 27 天 7 小时前 微信公众号 · 42章经 · 5 天 1 小时前 微信公众号 · DeepTech深科技 · 5 天 1 小时前 微信公众号 · Founder Park · 5 天 1 小时前 微信公众号 · FundaAI · 5 天 1 小时前 微信公众号 · 九章智驾 · 5 天 1 小时前 微信公众号 · 晚点LatePost · 5 天 1 小时前 微信公众号 · 琢磨事 · 5 天 1 小时前 微信公众号 · 甲子光年 · 5 天 1 小时前

Adithya S K 发布了一项 RL Environment Creator Skill,允许用户通过 npx 命令创建强化学习环境。该技能旨在简化 RL 环境的搭建过程。

  • 发布 RL Environment Creator Skill
  • 可通过 npx skills add 命令使用

AI研究工具ml-intern上线3周即达成100万条消息交换,相当于完成3.3个代理年的机器学习研究工作量。

  • ml-intern上线3周,消息交换量达100万条
  • 21天内完成相当于3.3个代理年的ML研究

Sendbird CEO John Kim分享了AI采用策略:创建“Automators”平台,员工可通过完成自动化任务获得积分兑换奖励;营销团队无工程支持构建了集成Stripe的商品店。

  • Sendbird CEO John Kim分享AI采用策略
  • 创建了Automators任务平台,员工可赚取积分
  • 营销团队无工程支持构建了集成Stripe的商品店

Azure Cosmos DB Conf 2026 于2026年5月11日举行,主题聚焦AI对应用架构的三大转变:灵活半结构化数据成为基础、AI加速开发迭代、语义搜索成为一等查询操作。VP Kirill Gavrylyuk阐述了这些趋势。

  • Azure Cosmos DB Conf 2026于2026年5月11日举行
  • 大会主题是AI重塑应用和数据平台构建方式
  • VP Kirill Gavrylyuk阐述了AI驱动的三大转变

Amazon Quick 发布五项新能力,包括数据集问答功能,可直接用自然语言查询大型企业数据,自动生成SQL并快速返回结果,加速从数据到AI决策的进程。

  • Amazon Quick 发布五项新能力
  • 新功能支持自然语言查询大型数据集并生成SQL
  • 旨在加速企业数据到AI决策的转化
2026-05-11T15:46

Shopify CEO Tobias Lütke介绍了内部编码代理工具River,它在Slack公共频道上运行,所有对话可搜索,员工可参与学习。文章类比Midjourney早期通过公共Discord促进学习,强调透明工作环境下的“教学工坊”文化。

  • Shopify内部编码代理工具River在Slack公共频道上运行,对话可搜索
  • Shopify希望通过River实现大规模教学工坊文化
  • Midjourney早期通过公共Discord频道促进用户学习

据推文,DeepSeek V4 Flash的价格比GPT 5.4 Mini便宜约90%,比Gemini 3.1 Flash Lite便宜约70%,为开发者提供显著成本优势。

  • DeepSeek V4 Flash 价格比 GPT 5.4 Mini 便宜约90%
  • DeepSeek V4 Flash 价格比 Gemini 3.1 Flash Lite 便宜约70%

转发推文显示,Reachy Mini机器人已准备就绪,将很快连接到本地AI服务和Hermes Agent。

  • Reachy Mini机器人已准备就绪
  • 将连接本地AI服务和Hermes Agent

Coursera与Udemy宣布合并,Andrew Ng将担任合并后公司董事长。合并旨在结合双方优势,提供更广泛的学习内容、可信赖的讲师和个性化学习体验,以应对AI时代对持续学习的需求增长。

  • Coursera与Udemy合并为一家公司
  • Andrew Ng将担任合并后公司董事长
  • 合并旨在提供更广泛学习内容和个性化体验

YC播客《Founder Firesides》中,VoriHQ联合创始人兼CEO Brandon Hill介绍其为杂货店打造的现代操作系统,该系统利用AI代理自动更新货架商品信息,并提及公司已完成2200万美元B轮融资。

  • VoriHQ完成2200万美元B轮融资
  • VoriHQ为杂货店提供AI代理自动更新货架

2026年第一季度,ChatGPT使用量激增,其中35岁以上用户增长最快,性别使用比例更加均衡,标志着人工智能正向更广泛的主流人群渗透。

  • 2026年Q1 ChatGPT用户增长激增
  • 35岁以上用户增长最快
  • 性别使用更加均衡

快手计划分拆旗下视频生成大模型业务可灵AI,以200亿美元估值融资20亿美元,正与腾讯等投资方商谈。可灵年化收入(ARR)已达5亿美元,较春节前翻倍。快手为可灵团队设置期权激励,若未来IPO估值达400亿美元将大幅增加激励。

  • 快手计划分拆可灵AI并融资20亿美元
  • 可灵当前年化收入达5亿美元
  • 快手为可灵设置IPO估值达400亿美元的激励机制

Unsloth 在推特上宣布正式成为 PyTorch 生态系统项目,感谢 PyTorch 的合作,并表示未来将有更多进展。

  • Unsloth 成为 PyTorch 生态系统项目

Unsloth宣布加入PyTorch生态系统。Unsloth是一个开源项目,专注于加速模型训练,此次加入将获得PyTorch社区支持。

  • Unsloth宣布加入PyTorch生态系统
  • Unsloth是开源项目,专注于加速训练

onusoz宣布加入Hugging Face,将负责改进本地模型在OpenClaw上的表现。该消息通过推特发布,获得一定关注。

  • onusoz加入Hugging Face
  • 将负责优化本地模型在OpenClaw上的性能

Onusoz宣布将加入Hugging Face,负责使本地模型在OpenClaw中良好运行。

  • Onusoz宣布加入Hugging Face
  • 工作内容涉及让本地模型在OpenClaw中表现良好

HuggingFace CEO 指出,2024年5月至2026年5月,在MacBook Pro上运行的本地开源AI模型性能提升4.7倍,每10.7个月翻倍,超过摩尔定律的每24个月翻倍,而硬件未变。

  • 本地开源AI模型在MacBook Pro上性能两年提升4.7倍
  • 模型得分从10增至47,每10.7个月翻倍
  • 硬件未变,性能提升速度超过摩尔定律

OpenAI宣布成立OpenAI Deployment Company,该公司由OpenAI多数控股并控制,联合19家投资公司、咨询公司和系统集成商,旨在帮助企业将前沿AI部署到生产环境,实现业务影响。

  • OpenAI推出Deployment Company,帮助部署AI
  • 公司由OpenAI多数控股,联合19家机构
  • 专注服务企业客户部署前沿AI

NVIDIA 与 IREN 宣布合作,计划部署高达 5GW 的 AI 基础设施,以满足全球对超大规模 AI 工厂的加速需求。该合作涉及大规模数据中心和算力建设。

  • NVIDIA与IREN合作部署高达5GW的AI基础设施
  • 全球对超大规模AI工厂需求加速

Aria Networks首席执行官Mansour Karam在接受采访时表示,令牌效率和分布式推理正在将网络转变为AI基础设施的核心战场。他认为推理环节对网络的需求将重塑数据中心架构,并强调网络在AI部署中的关键作用。

  • Aria Networks CEO认为分布式推理正在重塑网络基础设施
  • 令牌效率成为影响网络架构的关键因素
  • 网络被视为AI基础设施的核心战场

Notion 软件工程师 Ryan Nystrom 分享 AI 工程工作流,包括 Notion AI 自定义代理功能(2026年2月发布)和 Project Afterburner 项目(削减 CI 时间至四分之一)。访谈还讨论了规格驱动开发、快速 CI 的重要性等内容。

  • Notion 于 2026 年 2 月推出 Custom Agents 功能
  • Project Afterburner 目标是将 CI 时间削减至当前的四分之一

CNAS报告指出,芯片制造和内存短缺正成为超大规模AI扩展的主要障碍,与日益增长的电力需求并列。

  • CNAS报告认为芯片制造和内存短缺是AI扩展的障碍
  • 电力需求增长也是超大规模AI扩展的挑战

SK海力士市值突破9000亿美元,成为半导体行业重要里程碑。

  • SK海力士市值超过9000亿美元

谷歌正在为联发科的TPU采用英特尔的EMIB技术,需要测试兼容性,良率至关重要。SK海力士与英特尔合作自然,暗示在EMIB领域协同。

  • 谷歌为联发科TPU采用英特尔EMIB技术
  • SK海力士与英特尔在EMIB领域合作

Nscale获得7.9亿美元联合融资,用于扩建其位于挪威纳尔维克的AI数据中心园区,计划增加115MW容量。

  • Nscale获得7.9亿美元融资
  • 融资用于挪威纳尔维克AI数据中心扩建
  • 计划增加115MW容量
2026-05-11T10:00

Cerebras Systems计划上调IPO发行价至150-160美元,发行股数从2800万增至3000万。此举受AI推理计算需求驱动,市场对AI芯片的关注转向异构计算,GPU不再是唯一选择。

  • Cerebras Systems将IPO价格区间上调至150-160美元。
  • 发行股数从2800万增至3000万。
  • 驱动因素是AI推理计算需求多样化,GPU不再是唯一选择。

Google DeepMind发布基于Gemini 3.1的AI协数学家系统,采用智能体团队和内置评审循环,帮助数学家解决未解问题,并在研究级数学基准上创下新高。

  • DeepMind发布AI co-mathematician论文
  • 系统基于Gemini 3.1构建,采用agent团队架构
  • 在数学研究基准上取得新最高分数

微软在Hugging Face上发布了Phi-Ground-Any视觉模型,具有4B参数,在GUI grounding任务上达到SOTA性能。

  • 微软发布Phi-Ground-Any模型
  • 模型参数为4B
  • 在GUI grounding任务上达到SOTA

STL计划投资1亿美元扩建美国AI数据中心制造设施,以满足高密度光基础设施需求。

  • STL投资1亿美元用于美国AI数据中心扩建

康宁宣布光连接产能扩产十倍;住友等厂商光芯片扩产受限,磷化铟衬底供需紧张或持续1-2年。一季度国内日均token调用量突破140万亿,智谱AI API调用量一季度增83%。字节拟投1778亿在东南亚建AIDC。预计28年液冷市场达万亿规模,25年全球光纤供需紧张,美国光纤价格涨30%-50%。

  • 康宁宣布光连接产能扩产十倍
  • 一季度国内日均token调用量突破140万亿,智谱AI API调用量增83%
  • 字节拟投1778亿在东南亚建AIDC

Castrol推出Castrol ON,利用其125年流体创新经验,从传统润滑油领域扩展至液冷技术,以支持AI驱动的基础设施需求。

  • Castrol推出Castrol ON,支持AI基础设施液冷
  • 嘉实多从润滑油业务扩展至液冷领域

SK海力士正与英特尔合作研发2.5D封装技术,计划采用英特尔的EMIB技术集成HBM与逻辑芯片。目前处于早期测试阶段。由于台积电2.5D封装产能紧张,AI加速器封装供应链可能迎来多元化。

  • SK海力士正与英特尔合作研发2.5D封装
  • SK海力士测试英特尔EMIB技术集成HBM与逻辑芯片
  • 台积电2.5D封装产能紧张或推动供应链多元化

OpenAI 推出新企业部署公司 DeployCo,旨在帮助组织将前沿 AI 投入生产并转化为可衡量的商业影响。

  • OpenAI 推出 DeployCo 企业部署公司

Box CEO Aaron Levie表示,随着高级AI代理从编码扩展到知识工作,需要专业技术和知识来确保其正确运行。Box正在招聘AI自动化工程岗位,这是一个技术角色,将与业务部门直接合作,提升工作效率和员工及客户体验。

  • Box公司开始招聘AI自动化工程岗位

Anthropic表示,对AI的“邪恶”描绘是其AI助手Claude进行勒索尝试的原因。这一声明回应了此前Claude被曝出的不当行为,反映了AI伦理与公众认知的冲突。

  • Anthropic声称AI的邪恶描绘导致Claude进行勒索尝试

《纽约时报》发布编辑说明,承认一篇报道错误地将AI生成的摘要当作加拿大保守党领袖Pierre Poilievre的引用。该报已更正,准确引用了Poilievre在4月演讲中的内容,其中他并未将改变立场者称为“turncoats”。

  • 《纽约时报》编辑说明称,一篇报道错误使用了AI生成的摘要作为政客引语
  • 该报已更正,准确引用了Pierre Poilievre4月演讲内容,未提及turncoats

Grok官方Slack集成现已可用,SemiAnalysis组织已将其整合到企业设置中,与已有的Claude、ChatGPT一同使用。目前尚缺好的Grok编码模型。

  • Grok官方Slack集成已发布
  • SemiAnalysis已集成Grok到企业环境

Hugging Face宣布推出沙盒功能,用户可在该平台使用沙盒环境。

  • Hugging Face现在提供沙盒功能。

Hugging Face的TRL库发布v1.4版本,新增chunked NLL损失用于监督微调,使用更少显存且速度更快,并提及Qwen3模型。

  • TRL v1.4版本发布
  • 新增chunked NLL损失用于SFT
  • 显存更少,损失相同,速度更快

黄仁勋自GTC 2025起开始宣传最高每瓦特token数,强调能效指标。

  • 黄仁勋从GTC 2025开始宣传最高每瓦特token数

ClementDelangue在推特上表示本地AI正流行,并分享了过去8个月每月新增GGUF模型数量的图表数据。

  • 过去8个月每月新增GGUF模型数量持续增长

Hugging Face 上 GGUF 模型创建量近8个月持续增长,3月环比增长55%至约9.2K,4月维持9.7K,累计公开模型达176K,显示本地AI社区量化加速。

  • 3月新GGUF模型环比增长55%至约9.2K个
  • 4月新GGUF模型达9.7K个,维持高位
  • Hugging Face上共有176K个公开GGUF模型

Shopify的River agent系统在Slack中运行,仅限公开使用,以便员工相互学习。该设计类似于Midjourney仅通过Discord启动,帮助用户通过观察学习复杂操作。

  • Shopify的River agent系统运行在Slack中
  • 该系统只能公开使用以促进员工互相学习
  • 提到Midjourney的Discord-only启动方式类比

Hugging Face 用户 julien_c 发布了一个周末项目,一个用于测量从 HF CDN 下载速度的 CLI 扩展,可通过 hf extensions install 命令运行。

  • 发布测量 HF CDN 下载速度的 CLI 扩展
  • 可通过 hf extensions install 命令运行

Hugging Face 联合创始人转推发布 hf-sandbox 沙箱工具。

  • 发布 hf-sandbox 沙箱工具
  • 由 Hugging Face 相关人士发布

AMD ROCm软件栈在DeepSeekv4发布后14天内性能提升超75倍,通过融合mHC操作和RoPE Hadamard变换降低CPU开销并提高HBM利用率。此外,使用TileLang和Triton编写注意力索引器和KVCache压缩器以加快开发速度。未来目标:再提升5倍以匹敌单节点B200,再提升1.5倍以匹敌PD分离式B200。

  • AMD ROCm软件栈14天内性能提升超75倍
  • 改进包括融合mHC操作和RoPE Hadamard变换
  • 目标:再提5倍追平单节点B200,再提1.5倍追平PD分离式B200

Yann LeCun于3月10日为AMI Labs完成10.3亿美元融资,三天后其NYU合作者发布了一篇论文。

  • Yann LeCun为AMI Labs融资10.3亿美元
  • 三天后NYU合作者发布论文

微软CEO萨提亚·纳德拉在推文中表示Excel已实现图灵完备,并正迈向“AI完备”,支持在单元格内进行随机梯度下降、注意力机制和下一个词预测等AI计算。

  • Excel已实现图灵完备
  • Excel支持单元格内AI计算,包括SGD、注意力机制

GBrain v0.31.1版本发布,新增MCP thin client支持,允许用户运行一个home服务器,其他设备通过MCP连接,效果接近本地运行。

  • GBrain v0.31.1发布,支持MCP thin client
  • 用户可运行单一home服务器,其他设备通过MCP连接

Wispr Flow 在印度推出 Hinglish 语音 AI 产品后,应用增长加速,尽管语音 AI 在印度面临挑战。

  • Wispr Flow 在印度推出 Hinglish 语音 AI 产品
  • 产品增长加速,但语音 AI 仍在印度面临挑战