据UBS报告,Kioxia的NAND wafer成本为2000美元,仅为三星的一半,其横向扩展架构是成本优势关键。报告还涉及HBF及NAND闪存市场展望。
作者体验了索尼AI的Project Ace高速自主乒乓球机器人系统,该系统曾击败精英人类运动员,但作者成功赢得一分。
富士康预计今年出货最多1万台CPO交换机托盘,2027年出货量预计翻倍以上。
作者@garrytan 发推称GBrain在LongMemEval评估中达到SOTA水平,并日常在OpenClaw中使用GBrain处理300k markdown文件知识库,通过修复失败用例持续改进。
SemiAnalysis发推称,在Cerebras上运行深度编码模型需24个系统(2400万美元资本支出)仅支持256并发用户,而同等资金下标准GB300机架能提供更多内存带宽。
Datasette 1.0a31 发布,新增执行写查询和保存存储查询的功能。用户需拥有相应权限,可对数据库执行插入、更新、删除操作,并保存查询供其他用户使用。博客文章已详细介绍新特性。
招聘平台Litmus正式上线,获得Y Combinator支持。
OpenAI推出Rosalind Biodefense,向审核开发者及美国政府合作伙伴提供GPT-Rosalind访问,用于推进生物防御、公共卫生和大流行防备。
NVIDIA 发布了 Nemotron 3 Nano Omni,一个高效的开源多模态模型,统一处理视频、音频、图像和文本。
VikParuchuri 宣布发布 Surya OCR 2 模型,拥有 6.5 亿参数,在 olmocr 基准测试中得分 83.3%,在内部 91 语言基准测试中得分 87%,在其他多项基准测试中表现领先。
Gradio推文宣布一场名为Build Small的黑客马拉松,要求参赛模型参数不超过32B并能在笔记本电脑上运行,赞助商包括OpenAI、NVIDIA和OpenBMB。
AnthropicAI完成9650亿美元H轮融资,并发布Opus 4.8模型及Dynamic Workflows/ultracode工具。
Anthropic完成H轮融资,估值9650亿美元,筹集650亿美元,并报告470亿美元收入运行率。同时发布Opus 4.8模型,修复多项问题并达到经济相关基准最优。Claude Code推出动态工作流功能,支持大规模代码重写。
阶跃星辰发布Step 3.7 Flash模型,该模型专注于代理效率,并在ClawEval-1.1和SimpleVQA Search基准测试中取得第一名。
Axios引用Anthropic自报数据,其收入从300亿美元增长至470亿美元,JimVandeHei表示未见过如此快速的有机收入增长。
Anthropic在H轮融资公告中披露,其年度经常性收入已超过470亿美元,较今年2月G轮时的140亿美元大幅增长。该公司此前在4月与Google和Broadcom的合作公告中曾披露收入超过300亿美元,显示了其快速的收入增长。
SemiAnalysis发布深度报告,预计到2030年800VDC供电技术将推动约39GW的新增数据中心容量,并分析了该技术的渗透率、市场机会及挑战。
企业AI搜索初创公司Glean年收入超过3亿美元,同比增长三倍,尽管面临科技巨头进入该领域的竞争。
据传闻,英伟达计划投资200亿新台币(约6.2亿美元)入股中国台湾ABF基板供应商景硕科技,以加强先进封装供应链布局。
NVIDIA宣布Step 3.7 Flash模型正式发布,该模型为198B参数MoE架构,11B活跃参数,支持256K上下文以及原生图像和视频处理。即日起可通过NVIDIA NIM推理微服务和NeMo框架在GPU加速端点部署。
StepFun 发布 Step 3.7 Flash 多模态 AI 模型,拥有 198B 参数,可在 NVIDIA GPU 上运行,支持图像、文档、视频和语言的实时感知与推理,专为企业级生产环境设计。
Mythos的安全问题已解决,同时Anthropic获得了数百亿规模的推理计算资源。
Opus 4.8版本发布,用户反馈模型在单次生成时表现良好,但随后出现幻觉(三次),引发讨论。
Google 免费 AI Agents 课程回归,为期 5 天,涵盖搭建代理、工具集成、记忆、安全及部署等内容,由 Google 工程师授课,上次课程有 150 万学习者。
OpenAI发布第三方AI评估指导,涵盖模型能力、安全措施和有效性评估,为前沿系统提供评估框架。
4月工业企业利润同比增幅扩大,显示经济复苏态势;日本半导体设备出货额同比增幅扩大,反映全球半导体需求回暖。
Anthropic 发布 Claude Opus 4.8 模型,被视为前代产品的微小但切实的改进。模型在诚实性方面显著提升,错误率降低约四倍,主要通过不确定时拒绝回答而非强行给出错误答案。定价与 Opus 4.5/4.6/4.7 相同,快速模式价格减半。
llm-anthropic 0.25.1 版本发布,新增 Claude Opus 4.8 模型,支持 fast mode 选项(需组织启用),并将各模型默认 max_tokens 改为模型最大输出而非 8192。
三星电子投资Anthropic,参与其650亿美元H轮融资,估值达9650亿美元。三星、SK海力士、美光作为战略投资者参与。行业分析认为三星有望为Anthropic代工逻辑芯片,推动其代工业务复苏。
Visa对Replit进行未披露投资,双方将探索如何让Replit开发者使用Visa智能商务服务,合作涉及支付领域。
NVIDIA的GLM5.1-NVFP4模型被发现在Hugging Face平台上,该模型由NVIDIA AI官方发布,表明技术进展。
CentralComs 为住宅物业管理公司开发 AI 代理,自动化维护协调、租赁工作流和后台流程,旨在提升管理效率,使团队在相同规模下运营更顺畅并增加收入。
YC S24批次在演示日1年8个月后已产生3家独角兽。
Replit Canvas 发布,支持生成图像、视频、音频并混音,用户可绘图并使其变为现实,通过点击编辑、拖放移动对象,还可邀请朋友协作创作营销、网站或艺术内容。
Azercell与AWS合作,在Amazon SageMaker AI上训练阿塞拜疆语大语言模型。通过内核级优化,训练吞吐量提升23%,峰值GPU内存降低58%;自定义分词器使每词token数提升2倍,有效增加上下文窗口中的阿塞拜疆文本量。
Claude Opus 4.8 在 Design Arena 上线,基于 Opus 4.7 改进,提升了判断准确性、透明度和生成长度。
国金证券发布算电融合专题,指出1192号文支持绿电直连输配电价优惠,电力企业可联合参与数据中心建设重构商业模式,3月公用事业成交额占比约1.5%启动行情,当前行情正从区域向全国扩散。
银河军工指出,钽电容2025年全年涨约30%,2026年目标再涨30%,2027年预计至少涨10%。核心驱动为AI服务器等需求年增10%-20%,但头部厂商无扩产计划,供给紧张。基美全球市占率达70%。车规MLCC 2025年涨13%左右,2026年预计涨约20%。
Anthropic发布了Claude Opus 4.8模型,测试显示其在原型构建和一次性功能上表现优异,但在处理现有代码库的最后10%和边缘情况时存在困难,并伴有幻觉问题。新模型还支持动态工作流、并行子代理和努力控制功能。
澳大利亚一项研究发现,采用AI的公司反而在招聘更多岗位,且对技能要求更广泛,对比未采用AI的公司,其招聘需求更大。
AWS、Cloudflare等云服务商正在重新设计云基础设施,以适应AI代理从实验转向生产带来的机器生成互联网流量增长,而非人类用户流量。
Vercel CEO宣布其CLI已重构为自更新二进制,零外部依赖,旨在更好地支持代理进入云基础设施。通过与OpenClaw、Claude Code、Codex等工具集成,新客户持续涌入。
Aleph Prover 形式化了 OpenAI 对 Paul Erdős 平面单位问题的反驳,并发布了形式化内容。这是一个数学问题的 AI 形式化验证进展。
Y Combinator在Mountain View举办了首次YC Paper Club活动,邀请AI研究者和创始人讨论最新AI研究及其生产化。活动包括多位演讲者介绍各自的论文,如投机性解码、扩散-MPC等。
AWS发布一篇技术博客,介绍如何构建基于Flask的MLflow代理服务,通过REST API代理实现HTTPS方式安全访问Amazon SageMaker MLflow,支持IAM认证和URL预签名,帮助企业在云转型中集成现有系统。
Val Town发布了Claude插件,包含MCP服务器和技能,能增量加载所需知识,改进了之前的MCP服务器。
美国司法部对特朗普强奸案中的女性展开调查,同时白宫被指控操控一笔6.2亿美元的资金。这两起事件由加州州长纽森在推特上披露,引发广泛关注。
Opus 4.8版本发布,针对企业文档的复杂知识工作者任务进行测试。新版本在报告起草、法律NDA审查、金融数据分析等任务上表现优于Opus 4.7,具体性能提升数据包括工业品报告87% vs 77%,消费品评估90% vs 84%等。
Yann LeCun转发招募信息,经过一年努力,现在可以轻松参与JEPA和World Models的研究工作。
Meta AI团队宣布启动ATLAS项目,这是迄今最大规模的自动化形式化验证努力之一。该项目旨在通过自动化技术提升形式化验证的效率与规模,推动AI在数学与软件验证领域的应用。