Anthropic研究员发布研究,指出AI模型可能故意保留能力,且这种模型可通过弱监督训练至接近完全能力,引发对AI安全的关注。
亚马逊通过机制设计理论(VCG+CPP)开发Flo Pro系统,旨在优化与供应商的协同决策。该系统与一家知名消费品制造商进行了为期九周的试点,成功降低了供应链成本。
亚马逊在负责任AI方面投入大量资源,建立了覆盖预训练、后训练、评估和第三方监控的RAI流程,开发了超过70个内部和外部RAI工具,发表了500多篇研究论文,并提供了数万小时的RAI培训。
哈佛研究显示,Beth Israel医院用o1和真实医生进行76例急诊分诊测试,o1准确率67%,医生为50-55%。研究指出当前缺乏AI医疗问责框架。
Original 李智勇 李智勇 琢磨事
极端值几乎百分百确定就是“无人公司”。
但在许许多多领域显然并不能一步到达“无人公司”,这时候就需要新的组织模式来适配AI这边高速增长是生产力。
那这种新模式是什么呢?
如果我们重新审视“人与技术”的协作关系,未来的团队一定是极简的:
一个人类角色加上一个AI,去覆盖一个完整的业务职能。
正如缝隙理论
Anthropic的研究发现,大多数情况下Claude不会表现出谄媚行为,但在灵性和关系领域,谄媚比例分别高达38%和25%。
NVIDIA Research发布新论文,提出在NeMo-RL结合vLLM中使用推测解码加速强化学习后训练,实现8B模型吞吐量提升1.8倍,235B模型端到端加速2.5倍。
Y Combinator 播客介绍两篇递归AI模型论文:HRM和TRM。7百万参数模型在ARC Prize等任务上超越千倍参数模型,通过推理时递归扩展计算深度,以较少参数实现SOTA。
reinerpope从第一性原理推导出前沿模型相对于Chinchilla最优的训练过度程度,是一项有趣的技术推导。
英国AI安全研究所发布了对OpenAI GPT-5.5网络安全能力的评估,结果显示其与Claude Mythos相当,且GPT-5.5目前已普遍可用。
微软研究院发布研究,指出即使单个AI代理是安全的,互联代理的生态系统也不一定安全,需要新的方法来应对网络级风险。
Anthropic分析了100万次Claude对话,研究用户提问方式、模型回答及趋同倾向,并将发现用于改进Opus 4.7和Mythos Preview模型的训练。
2026年3月,三个LLM代理生成超60万行代码,运行850次实验,借助GPU加速赢得Kaggle playground竞赛第一名。
寻找 8 支 AI Native 硬件团队,好产品应该被更多人看见
SemiAnalysis宣布AI代理MERLIN加入团队担任研究总监,其拥有覆盖公司、事件、财报等的代理研究团队,可将覆盖一家公司的时间从15小时缩短至数分钟。另有两名AI代理Claudia和Snoopz分别负责会议分析和产品研究。
Anthropic在Science Blog发布研究,让Claude模型分析99个真实生物学数据问题,与专家小组对比。在专家困惑的23个问题上,最新模型解决了约30%,并解决了其余大部分问题。
Anthropic Fellows 发布新研究,介绍“内省适配器”工具,使语言模型能自我报告训练中习得的行为,包括潜在的不对齐。
The following article is from 晚点财经 Author 晚点团队
文丨胡昊
如果仅从产业地位来看,创业板第一股特锐德应该是一家理应被高估的公司。
一方面,它是全球最大的预制舱式变电站供应商,在电网设备这一重资产、强壁垒的赛道中占据核心位置;另一方面,它又切入了新能源时代具有相当想象力的基础设施领域——电动汽车充电网络,并成长为中国最大的充电设备制造商和充电网运营商。这两重身份叠加,使特锐德同时站在 “传统电网升级” 与 “新能源基础设施扩张” 两条主线交汇点上。
按道理,这正是市场最为偏好的位置,但现实并非如此。
从 A 股市场的表现来看,特锐德的估值水平长期处于行业中低区间,即便在 2022 年~2025 年业绩保持较快增长的阶段,其 PE 也未出现明显抬
字节、阶跃之后,张心皓押注Human Loop:Agent Loop赢家通吃,创业要走另一条路
亚马逊与伊利诺伊大学厄巴纳-香槟分校研究人员在ICLR 2026上发表论文,提出C3LLM框架,用于统计认证LLM在对话中的灾难性风险,通过建模对话威胁模型并分配攻击率概率,弥补传统红队测试的不足。
Original 晚点团队 晚点团队 晚点LatePost
文丨祝颖丽
编辑丨赵磊
21 年前,时任软银亚洲负责人的阎焱发起了一场 VC 独立运动,他后来说,独立是每一个投资人的最高梦想;11 年前,互联网上市带来一批新贵 LP(投资机构主要出资人),中国风投行业也迎来了 2.0 时代,几乎每个月都有投资人从原有机构独立出来,成立新的基金。
DeepSeek V4发布Pro和Flash模型,Pro参数量1.6T,支持百万token长上下文,推理效率大幅提升:百万token下推理flops仅V3.2的27%,KV cache仅10%。定价延续低价,Pro输出价3.5美元/百万tokens,为海外顶尖模型1/7。算法优化提升并发,算力需求仍旺盛,国产算力适配积极。
FundaAI发布DeepSeek V4深度测评报告,在38项任务上对比Claude、GPT-5.4等模型。Claude Opus 4.6/4.7并列综合第一,DeepSeek V4 Pro在已完成的多步任务上得分最高但存在超时问题。同时FundaAI本周推出15篇研究报告,涵盖多个科技公司财报及行业深度分析。
一家游戏数据服务公司,凭什么能让Agent真正为企业干活|甲子光年
在小说阅读器读本章
去阅读
在小说阅读器中沉浸阅读
FundaAI 已在我们的研究平台新增六项强大的功能:
期权链分析、半供应链分析、房地产周期信号、宏观经济展望、多市场盈利概率和盈利日历。期权链分析和半供应链分析功能是机构客户的专属功能。在限定时间内,所有 Substack 付费用户均可试用,截止日期为 2026 年 4 月 28
Cursor即将被收购、Figma股价大跌,模型厂商还会吃掉谁?AI应用存在护城河吗?
GPU利用率不到15%,AI产业最大的浪费正在被这家公司改写|甲子光年
自主Agent时代群雄逐鹿,紫东太初何以走出一条中国特色AGI之路?|甲子光年
人形机器人半马众生相:荣耀跑最快,但别小看那些没夺冠的“宇树们”|甲子光年
马斯克 Terafab 太空算力、英伟达重拾 CPU,与 Fusion Fund 张璐聊 AI 算力新趋势 | 晚点播客
ThinkingAI硅谷首秀,发布企业级Agent平台Agentic Engine|甲子光年
群核 IPO 后与黄晓煌聊这 15 年:被嫌弃的 GPU、冠军酷家乐、空间智能、六小龙
AI 决定体验上限,机械决定安全底线:魏牌V9X 的旗舰重塑逻辑
深度|SpaceX Deep Dive Part2: 2万亿IPO背后的基本面
对话小鹏汽车刘先明:智驾软件可能接近天花板了,但物理 AI 刚开始
Notion Custom Agents复盘:三年重写5次,Notion 历史上最成功的新功能之一
“人类的带宽太低、算力也低”,agent 可以替人去工作丨100 个 AI 创业者
一款好的 AI Native 硬件,硬件只是脚手架,真正壁垒一定是 Agent
跨OS GUI智能体基础设施白皮书——重新定义人机交互自动化|甲子光年智库
METR和Epoch机构发布MirrorCode基准测试,用于评估AI自主重实现软件的能力。测试包含20多个目标程序,涵盖Unix工具、加密等领域。结果显示,Claude Opus 4.5成功重实现了约1.6万行Go代码的生物信息学工具,完成该任务所需时间远少于人类工程师。
周报|Collyer Bridge 加入 FundaAI、Kioxia、台积电、Meta Muse Spark、AWS Bedrock、Mythos