清除 当前 22 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 20 小时前 微信公众号 · 42章经 · 4 天 15 小时前 微信公众号 · DeepTech深科技 · 4 天 15 小时前 微信公众号 · Founder Park · 4 天 15 小时前 微信公众号 · FundaAI · 4 天 15 小时前 微信公众号 · 九章智驾 · 4 天 15 小时前 微信公众号 · 晚点LatePost · 4 天 15 小时前 微信公众号 · 琢磨事 · 4 天 15 小时前 微信公众号 · 甲子光年 · 4 天 15 小时前

Perplexity 公司宣布 Opus 4.8 版本对所有 Perplexity Max 用户开放,建议在 Perplexity Computer 中作为编排器使用。

  • Opus 4.8 已向所有 Perplexity Max 用户开放
  • Opus 4.8 被推荐用于 Perplexity Computer 的编排器

@AravSrinivas 在推特宣布开源其团队自研并已部署到生产的tokenizer,声称效率远超Hugging Face和SentencePiece,并强调毫秒级延迟优化的重要性。

  • 开源了生产级tokenizer
  • 声称效率高于Hugging Face和SentencePiece

Perplexity AI宣布开源其重建的Unigram分词器,声称可将CPU利用率降低5-6倍,同时提及小模型相关技术。

  • Perplexity AI开源Unigram分词器
  • 分词器降低CPU利用率5-6倍

Perplexity Computer宣布新增功能,可管理Shopify店铺,为电商卖家提供自动化店铺管理服务。

  • Perplexity Computer可管理Shopify店铺

Perplexity公司开源了其内部用于保障开发者安全的工具Bumblebee。

  • Perplexity开源内部安全工具Bumblebee

知名开源模型和智能体公司MiniMax宣布采用Perplexity的搜索基础设施,以增强其模型与智能体的搜索能力。

  • MiniMax采用Perplexity搜索基础设施
  • MiniMax是一家领先的开源模型和智能体公司

Perplexity AI 宣布已将查询感知压缩技术投入生产,该技术旨在提升搜索速度、清洁度和准确性,以改进搜索体验。

  • Perplexity AI 将查询感知压缩技术投入生产

Perplexity AI 宣布其产品 Perplexity Computer 帮助 Rho 公司每周会议时间减少 90%。该产品可自动检查 Slack、Notion、Jira、Figma 和 Google Docs 等工具。

  • Rho 使用 Perplexity Computer 将每周会议时间减少 90%
  • Perplexity Computer 可检查 Slack、Notion、Jira、Figma 和 Google Docs

Perplexity Computer 新增 Artifacts 页面,侧边栏提供快捷方式,用户可查看和固定应用、文档等。

  • Perplexity Computer 推出 Artifacts 页面
  • 侧边栏新增 Artifacts 快捷方式
  • 用户可查看和固定应用、文档

Perplexity正在构建市场上最安全的可扩展代理运行时沙箱,并发布了博客介绍其安全处理方法,包括代理API密钥安全处理、代理访问内容安全检测、连接器加密传输数据以及计算与存储解耦。

  • Perplexity正在构建安全可扩展的代理运行时沙箱
  • 代理API密钥安全处理、内容安全检测、数据加密传输、计算存储解耦

NVIDIA GB200芯片改变了服务大型MoE模型(如Qwen)时的prefill和decode分离方式,相比Hopper芯片有吞吐量优势,团队已发表量化对比结果。

  • GB200改变了大型MoE模型的prefill和decode分离方式
  • 与Hopper相比,GB200在服务Qwen时吞吐量有提升

Perplexity AI发布新研究,展示在NVIDIA GB200 NVL72 Blackwell机架系统上部署后训练Qwen3 235B模型的成果,涉及硬件与模型推理优化。

  • Perplexity AI发布在NVIDIA GB200 NVL72上的模型部署研究
  • 研究涉及后训练的Qwen3 235B模型
  • 部署基于Blackwell架构的GB200系统

Perplexity AI 发布了构建智能体技能的内部手册,强调开发者需要新的思维方式。

  • Perplexity AI 发布了构建智能体技能的内部手册

Perplexity 确认基于 NVIDIA 平台运行,并使用 CUTLASS Python 栈优化模型,展示了双方在 AI 算力上的合作。

  • Perplexity 运行在 NVIDIA 平台上。
  • Perplexity 使用 CUTLASS Python 栈优化模型。

Perplexity CEO宣布废弃旧版Mac App,推出Personal Computer版本。该版本可控制Mac本地应用和文件,现已对Pro和Max用户开放,并可远程操作Mac mini。

  • 废弃旧版Perplexity Mac App,推出新版Personal Computer
  • 新版可控制Mac本地应用和文件
  • 对Pro和Max用户开放,支持远程操作Mac mini

Perplexity AI 宣布其 Personal Computer 功能在 Mac 应用中向所有用户开放。Personal Computer 是高级版本,具体特性未在消息中详述。该消息通过官方推特发布,获得较高关注度。

  • Perplexity AI 发布 Personal Computer 功能
  • 该功能通过 Mac 应用对所有用户开放

该公司自研推理引擎ROSE,用于处理从嵌入到万亿参数MoE的生产及API流量。ROSE集成了CuTeDSL,以加速内核部署并在Hoppers和Blackwells GPU上实现峰值性能。

  • 公司自研推理引擎ROSE覆盖嵌入到万亿参数MoE的生产和API流量
  • ROSE集成CuTeDSL以加速内核部署
  • ROSE在Hoppers和Blackwells上实现峰值性能

Perplexity AI宣布自研推理引擎ROSE,用于服务从嵌入模型到各种规模的模型,提升运行时优化。

  • Perplexity AI开发了自研推理引擎ROSE。
  • ROSE用于服务从嵌入模型到多种规模的模型。

一家公司宣布在其API中引入实时授权金融数据,开发者可通过工具调用获取带验证的实时数据,提升金融查询准确性。

  • 在API中引入实时授权金融数据
  • 开发者可通过工具调用获取实时数据

Perplexity AI 宣布其 Finance Search 功能现已在 Perplexity Agent API 中可用,开发者可通过单次工具调用获取授权的金融数据。

  • Perplexity AI 的 Finance Search 在 Agent API 上线
  • 开发者可一次调用获取授权金融数据

Perplexity和Computer宣布新增Deep and Wide Research功能,允许在New England Journal of Medicine等权威医学来源上进行研究。

  • Perplexity和Computer新增Deep and Wide Research功能,支持权威医学来源研究。

Perplexity宣布其计算机产品引入许可数据,用于专业金融研究和分析,并提供35个代表分析师日常工作的工作流。

  • Perplexity Computer引入许可数据用于专业金融研究
  • 提供35个代表分析师日常工作的工作流