清除 当前 7 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 20 小时前 微信公众号 · 42章经 · 4 天 15 小时前 微信公众号 · DeepTech深科技 · 4 天 15 小时前 微信公众号 · Founder Park · 4 天 15 小时前 微信公众号 · FundaAI · 4 天 15 小时前 微信公众号 · 九章智驾 · 4 天 15 小时前 微信公众号 · 晚点LatePost · 4 天 15 小时前 微信公众号 · 琢磨事 · 4 天 15 小时前 微信公众号 · 甲子光年 · 4 天 15 小时前

Mythos的安全问题已解决,同时Anthropic获得了数百亿规模的推理计算资源。

  • Mythos的安全问题已得到解决。
  • Anthropic获得了数百亿推理计算资源。

MiMo API进行价格下调,最高降幅达99%针对Input (Cache Hit),核心原因是推理效率提升。

  • MiMo API价格下调,最高降幅99%针对Input (Cache Hit)
  • 价格下调核心原因是推理效率提升

推文指出LLM训练依赖快速矩阵乘法,但许多周围操作仍受内存限制。CODA方法对这些内核进行重新参数化优化。

  • LLM训练中许多周围操作是内存受限的内核
  • CODA重新参数化这些内存受限的内核

Nvidia发布Nemotron 3 Super和Ultra模型,参数规模分别为120B和约500B,均预训练在NVFP4格式下,其中Super使用了25T tokens。

  • Nemotron 3 Super参数120B,预训练25T tokens,NVFP4格式。
  • Nemotron 3 Ultra参数约500B,同样预训练于NVFP4。

Anthropic更新政策,重新定义“交互式”为使用其前端,导致通过claude -p或Agent SDK的交互操作消耗积分而非订阅限制。

  • Anthropic重新定义“交互式”为使用其前端。
  • 使用claude -p或Agent SDK消耗积分而非订阅。

Antirez宣布推出DS4,这是一个专为DeepSeek v4 Flash设计的推理引擎。项目进展顺利。

  • DS4是DeepSeek v4 Flash的专用推理引擎
  • 该引擎已正式发布

vLLM项目宣布即日起支持Gemma4的MTP(多令牌预测),提供即用Docker镜像,解码速度可提升至3倍。

  • vLLM支持Gemma4的MTP功能
  • 提供即用Docker镜像
  • 解码速度提升至3倍