清除 当前 7 条 / 共 3560 条
筛选已选
筛选
数据源
投研/平台
官方/公司
资讯/RSS
Twitter/X
微信公众号
时间
信息等级
标签
异常/暂停数据源 9
AI 基建 · 26 天 19 小时前 微信公众号 · 42章经 · 4 天 14 小时前 微信公众号 · DeepTech深科技 · 4 天 14 小时前 微信公众号 · Founder Park · 4 天 14 小时前 微信公众号 · FundaAI · 4 天 14 小时前 微信公众号 · 九章智驾 · 4 天 14 小时前 微信公众号 · 晚点LatePost · 4 天 14 小时前 微信公众号 · 琢磨事 · 4 天 14 小时前 微信公众号 · 甲子光年 · 4 天 14 小时前

Opus 4.8版本发布,针对企业文档的复杂知识工作者任务进行测试。新版本在报告起草、法律NDA审查、金融数据分析等任务上表现优于Opus 4.7,具体性能提升数据包括工业品报告87% vs 77%,消费品评估90% vs 84%等。

  • Opus 4.8版本发布并开始测试
  • 在报告起草、NDA审查等任务上优于4.7
  • 工业品报告得分87%对比4.7的77%

作者指出AI从廉价聊天工具转向高成本AI代理,上下文窗口更大,推理成本高一个数量级。AI能力持续提升,高端用例继续使用前沿模型,低端任务转向低成本模型。成本分层扩大,企业需管理AI成本。

  • AI从廉价聊天工具转向具有大上下文窗口和更高推理成本的AI代理
  • 高端用例继续使用前沿模型,低端任务转向低成本模型
  • AI推理成本分层扩大,企业需管理成本

@levie 在推特分享与多家财富500强企业CIO晚餐后的观察,指出Token成本将成为企业应用AI的主导话题。CIO们尝试多种成本管理策略,但尚未找到完美方案。

  • Token成本成为企业AI应用中的主导话题
  • 众多CIO尝试多种成本管理策略但无完美方案

谷歌发布Gemini 3.5 Flash模型,在Box AI复杂文档任务评估中性能显著提升,较Gemini 3 Flash平均提升12个百分点。各行业测试结果均有所增长,其中医疗和生命科学领域提升超20个百分点。模型即将在Box AI Studio和API中可用,Box MCP服务器也将集成。

  • Gemini 3.5 Flash模型发布,性能较上一代大幅提升
  • 在Box AI复杂文档任务上平均提升12个百分点
  • 医疗行业提升22个百分点,公共部门提升17个百分点

Claude推出面向法律行业的最新插件和技能,包括与Box的集成,允许企业合同和文档以无头方式在Claude中安全处理。这标志着AI在行业特定工作流中的应用进展。

  • Claude推出法律行业插件和技能,包括Box集成。
  • 企业合同和文档可在Claude中以无头方式安全处理。

Box CEO Aaron Levie表示,随着高级AI代理从编码扩展到知识工作,需要专业技术和知识来确保其正确运行。Box正在招聘AI自动化工程岗位,这是一个技术角色,将与业务部门直接合作,提升工作效率和员工及客户体验。

  • Box公司开始招聘AI自动化工程岗位

Anthropic 和 OpenAI 分别推出新举措,帮助企业在其组织内部署 AI 代理。该趋势尚处早期但预计将迅速扩大,涉及升级 IT 系统、调整工作流程以及管理人与代理的关系。

  • Anthropic 和 OpenAI 推出帮助企业部署 AI 代理的新举措
  • AI 代理进入知识工作领域,需升级 IT 系统和流程