“人类的带宽太低、算力也低”,agent 可以替人去工作丨100 个 AI 创业者
一款好的 AI Native 硬件,硬件只是脚手架,真正壁垒一定是 Agent
跨OS GUI智能体基础设施白皮书——重新定义人机交互自动化|甲子光年智库
METR和Epoch机构发布MirrorCode基准测试,用于评估AI自主重实现软件的能力。测试包含20多个目标程序,涵盖Unix工具、加密等领域。结果显示,Claude Opus 4.5成功重实现了约1.6万行Go代码的生物信息学工具,完成该任务所需时间远少于人类工程师。
周报|Collyer Bridge 加入 FundaAI、Kioxia、台积电、Meta Muse Spark、AWS Bedrock、Mythos
Original 李智勇 李智勇 琢磨事
在小说阅读器读本章
去阅读
在小说阅读器中沉浸阅读
我先说个短评:
这两本书的内容很有价值,但范围说小了。最终的驾驭要按智能优先原则彻底追溯到本体论、追溯到数据治理、追溯到风险权责和权限的对应,
可全面覆盖这些内容的书、课不多,感兴趣可以关注下面这个:
但这下面两本写的内容已经很关键了,并且如果你相信我之前说的分形结构,其实是可以根据它推演出很多结论的。
[我建立了一个AI本体论的“宇宙”](https://mp.weixin.qq.com/s?__biz=MzA5OTAzMzk2Ng==&mid=2649515472&idx=1&sn=10c47529f1edb2758e9ab78d409c4f81&scene=21#w
拼交付、主动找活干,3 月我们推荐这 18 款 Agent 产品
具身季报 26Q1:宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手丨晚点播客
国际半导体产业协会(SEMI)联合麦肯锡公司发起2026年半导体供应链年度调查。该调查旨在收集行业数据以建立供应链性能基准,帮助参与者对比同业表现、识别潜在风险与趋势,并支持数据驱动决策。调查采用匿名形式,截止日期为5月8日。
曹操出行2025年收入同比增长37.7%,Q4实现单季盈利,成为行业第二家可持续盈利网约车公司。定制车车队达5万辆自持加3万辆外销,计划2026年拓展至30个以上新城,2026-2031年收入CAGR目标20%-25%。Robotaxi获杭州无人测试牌照,2027年计划投放15-20万成本定制车,国际化在阿布扎比、香港推进测试。
对话港大黄超、任旭滨:龙虾热潮、nanobot、CLI与AI开源方法论|甲子光年
亚马逊宣布其AWS团队构建了名为RuleForge的智能AI系统,能够直接从漏洞利用代码示例生成检测规则。2025年国家漏洞数据库发布了超过48000个新CVE。RuleForge相比手动创建规则实现了336%的生产力优势,并保持了生产安全系统所需的精确度。该系统与MadPot蜜罐系统和Sonaris检测系统协同工作,大幅缩短了漏洞披露到防御的窗口期。
惠科在成都投建OLED面板生产线,已进入内部装修和设备安装阶段,标志着其从LCD向OLED转型的关键一步。该产线建成后将提升惠科在显示面板领域的竞争力,应对LCD市场衰退。
两位95后打造“伴身智能”硬件,获商汤国香、奇绩创坛千万元级投资|甲子光年
美国国家标准与技术研究院(NIST)于2024年发布FIPS-203标准,指定ML-KEM作为后量子密码学密钥封装机制。亚马逊自动化推理组、AWS Cryptography与开源社区合作,创建了开源、形式化验证且优化的ML-KEM实现,以保护客户免受“现在存储、以后解密”攻击。
把方法论装进 AI:从这场 Skill 黑客松里,我们找到了 6 个值得参考的样本
Y Combinator 宣布 Harshita Arora 加入担任 General Partner,她拥有金融科技和基础设施经验,以及创始人视角。
Chance AI发布了世界首款视觉Agent产品,专为Z世代用户打造,核心功能为拍照即交互,标志着视觉智能代理技术的商业化探索。
AI 季报 26Q1:OpenClaw、OpenAI 与 Anthropic 的三重对阵、自进化丨晚点播客
商汤集团发布2025年业绩,总收入50.15亿元,同比增长32.9%,创近三年最快增速。净亏损同比收窄58.6%至17.82亿元,经调整净亏损收窄54.3%至19.56亿元。2025下半年EBITDA为3.764亿元,上市后首次转正。现金周转周期缩短。
独家专访Feeling AI创始人戴勃:我想让世界模型更有“活人感”|甲子光年
受AI大模型需求激增及资本开支扩大影响,算力供应链出现紧缺。H100一年期租赁合约价格自2025年10月至2026年3月上涨约40%,按需GPU算力已全面售罄,DRAM、光纤及数据中心托管等上下游环节价格同步攀升。
团队开源智能体机器人框架CaP-X,包含感知、控制、可视化工具,并发布CaP-Gym和CaP-Bench基准,CaP-RL使7B模型成功率从20%提升至72%,程序可迁移至真实机器人。
看看 Claude Code 怎么做 Harness,这才是 Agent 工程化的真正难点
SemiAnalysis发布英伟达Blackwell数据中心GPU微架构深度分析,首次公开针对PTX与SASS指令的实测性能数据。研究聚焦AI工作负载下的异步内存拷贝等配置,验证了硬件吞吐与延迟上限,并已开源相关微基准测试代码库。
七日对齐: Analyst Minds, Agent Minds
三大模态模型全部登顶后,昆仑万维正式披露了 2026 年 AGI 战略
访谈 MuleRun 陈宇森:Claude Code 带来 Agent 创作新范式、未来的软件是日抛式的
ChatGPT 让所有人变成了超级个体,却没让你的公司成为超级组织
深度机智和他们的另一条路:用人类第一视角数据训练基座模型|甲子光年