Perplexity 公司宣布 Opus 4.8 版本对所有 Perplexity Max 用户开放,建议在 Perplexity Computer 中作为编排器使用。
@AravSrinivas 在推特宣布开源其团队自研并已部署到生产的tokenizer,声称效率远超Hugging Face和SentencePiece,并强调毫秒级延迟优化的重要性。
Perplexity AI宣布开源其重建的Unigram分词器,声称可将CPU利用率降低5-6倍,同时提及小模型相关技术。
Perplexity Computer宣布新增功能,可管理Shopify店铺,为电商卖家提供自动化店铺管理服务。
Perplexity公司开源了其内部用于保障开发者安全的工具Bumblebee。
知名开源模型和智能体公司MiniMax宣布采用Perplexity的搜索基础设施,以增强其模型与智能体的搜索能力。
Perplexity AI 宣布已将查询感知压缩技术投入生产,该技术旨在提升搜索速度、清洁度和准确性,以改进搜索体验。
Perplexity AI 宣布其产品 Perplexity Computer 帮助 Rho 公司每周会议时间减少 90%。该产品可自动检查 Slack、Notion、Jira、Figma 和 Google Docs 等工具。
Perplexity Computer 新增 Artifacts 页面,侧边栏提供快捷方式,用户可查看和固定应用、文档等。
Perplexity正在构建市场上最安全的可扩展代理运行时沙箱,并发布了博客介绍其安全处理方法,包括代理API密钥安全处理、代理访问内容安全检测、连接器加密传输数据以及计算与存储解耦。
NVIDIA GB200芯片改变了服务大型MoE模型(如Qwen)时的prefill和decode分离方式,相比Hopper芯片有吞吐量优势,团队已发表量化对比结果。
Perplexity AI发布新研究,展示在NVIDIA GB200 NVL72 Blackwell机架系统上部署后训练Qwen3 235B模型的成果,涉及硬件与模型推理优化。
Perplexity AI 发布了构建智能体技能的内部手册,强调开发者需要新的思维方式。
Perplexity 确认基于 NVIDIA 平台运行,并使用 CUTLASS Python 栈优化模型,展示了双方在 AI 算力上的合作。
Perplexity CEO宣布废弃旧版Mac App,推出Personal Computer版本。该版本可控制Mac本地应用和文件,现已对Pro和Max用户开放,并可远程操作Mac mini。
Perplexity AI 宣布其 Personal Computer 功能在 Mac 应用中向所有用户开放。Personal Computer 是高级版本,具体特性未在消息中详述。该消息通过官方推特发布,获得较高关注度。
该公司自研推理引擎ROSE,用于处理从嵌入到万亿参数MoE的生产及API流量。ROSE集成了CuTeDSL,以加速内核部署并在Hoppers和Blackwells GPU上实现峰值性能。
Perplexity AI宣布自研推理引擎ROSE,用于服务从嵌入模型到各种规模的模型,提升运行时优化。
一家公司宣布在其API中引入实时授权金融数据,开发者可通过工具调用获取带验证的实时数据,提升金融查询准确性。
Perplexity AI 宣布其 Finance Search 功能现已在 Perplexity Agent API 中可用,开发者可通过单次工具调用获取授权的金融数据。
Perplexity和Computer宣布新增Deep and Wide Research功能,允许在New England Journal of Medicine等权威医学来源上进行研究。
Perplexity宣布其计算机产品引入许可数据,用于专业金融研究和分析,并提供35个代表分析师日常工作的工作流。