Stainless 宣布加入 Anthropic,该公司最初致力于让软件变得更好。
Y Combinator发布InsForge产品,该工具可将编程代理转化为后端工程师,管理后端服务器、数据库、LLM网关、前端部署等基础设施,专为编码代理工作流设计。
Perplexity AI基于pplx-embed-0.6b继续训练了一个小型ColBERT模型,相关推文获得79点赞和16转发。
加州陪审团一致裁定,埃隆·马斯克针对OpenAI联合创始人萨姆·奥尔特曼的诉讼因超过诉讼时效而败诉,马斯克主张的受虐待指控未获支持。
法律行业软件公司Aderant利用Amazon Quick的AI能力,统一了六个知识系统的搜索,并自动化文档流程,实现了搜索时间加快90%、文档处理加速75%,提升了云运营团队的效率。
LangChain发布SmithDB,一个专为Agent可观测性和评估工作负载构建的数据层,支持日益复杂的查询。
LangChain 于上周发布了 Deep Agents v0.6 版本,并表示这是迄今为止最大的一次发布。
deepagents发布0.6版本,包含多项改进。该版本由Sydney撰写介绍文章。
人工智能公司Anthropic宣布收购Stainless API,后者是一家SDK和MCP服务器平台,自Anthropic API早期以来一直为其提供SDK支持。
NextEra与Dominion以670亿美元合并,创建美国最大受监管公用事业平台,瞄准AI数据中心电力需求增长。
微软研究团队公布最新研究进展,涵盖云效率优化、智能体成本削减、3D远程医疗随机试验,并开放非洲包容性AI语言项目申请。
Nebius与LangChain宣布合作,将Nebius Token Factory集成到LangChain的Deep Agents中。
ParasmaAI宣布获知名孵化器Y Combinator S26批次录取。创始人披露该项目当前处于极早期阶段,尚无成型产品、无营收、无联合创始人,且团队非美国本土背景。该动态在社交平台引发关注,体现了早期创投机构对非传统背景项目的筛选与孵化情况。
亚马逊AWS宣布Atlassian Confluence Cloud与Quick平台集成,用户可通过自然语言查询和管理Confluence文档,减少上下文切换。集成支持知识库创建、语义搜索及操作执行,并连接Amazon S3、JIRA等系统。文章详细介绍了设置步骤。
知名开源AI推理引擎llama.cpp新增对Qwen3.6系列模型的多标记预测(MTP)支持,被认为对本地AI生态具有里程碑意义。
Amazon Bedrock AgentCore推出自定义代码评估器功能,允许用户通过AWS Lambda函数进行确定性质量检查,满足金融等专业领域的特定需求,如实时股价验证、JSON模式校验和PII过滤。该功能可应用于开发CI/CD管道和在线评估场景。
Transload 公司利用已安装的安防摄像头,在货物运动过程中测量尺寸,解决托运人经常误报尺寸导致物流公司损失的问题。该技术无需新增设备。
亚马逊宣布其智能助手Alexa+推出新功能,可根据需求生成定制AI播客,将Alexa扩展为个性化AI内容平台。
Tether公司在iPhone 16上成功微调了一个130亿参数的AI模型,无需数据中心和企业级GPU,实现了完全隐私保护。这一技术突破展示了在移动设备上运行大模型的可行性。
Anthropic研究PM Alex Albert分享了构建下一代Claude模型的五个要点:模型与外部工具紧密耦合设计、Claude自我审查记忆的‘梦境’机制、基于真实用户问题生成评估、设有研究Claude意识的团队,以及写作文化为模型提供上下文。
UnslothAI发布Qwen3.6通过MTP GGUFs实现本地运行加速,速度提升约1.4-2.2倍,仅需18GB RAM。
播客节目采访The Fourth Law创始人Yaroslav Azhnyuk,探讨乌克兰战争中无人机技术的演变,包括FPV无人机、AI引导、光纤与AI对比、五级自主性,以及中国制造业优势导致的西方差距。
安全公司SentinelOne发现一款名为fast16.sys的古老计算机病毒,该病毒能篡改高精度计算软件,通过内存补丁改变计算结果,并以自传播机制扩散。研究发现其包含复杂的浮点运算代码,疑似用于武器程序。
推特用户ngxson宣布Qwen3.6-27B模型在WebGPU上实现100%运行,但速度并非最佳。该演示展示了AI模型在浏览器端推理的可行性。
开发者正在将SAM模型移植到Apple silicon,并在MLX上实现1.25倍推理速度提升。
用户ErikKaum在huggingface上发布了其首个kernel MaxSim,旨在优化延迟交互检索(ColBERT/PyLate)的瓶颈问题。
2026年国内医院上线AI项目数量快速增长,但行业面临“科室各自采购”模式导致的数据孤岛、算力浪费等问题。华为对南方医院24个科室调研,总结超100项AI需求,推动从分散工具转向统一底座,实现算力、数据、模型和应用统一。
豆包成为中国唯一日活过亿的AI产品,但近期正降低对用户规模的关注。字节计划五一开启付费订阅,引发用户质疑其能力。过去两年字节仅花17亿元投流豆包,远低于腾讯元宝的222亿。豆包延续字节方法论,但AI行业变化迅速,聊天机器人作为入口的信念动摇。
Erik Kaum在HuggingFace上发布了首个kernel MaxSim,旨在解决延迟交互检索(ColBERT/PyLate)中材料化瓶颈问题。
OpenAI和Anthropic于5月初分别成立企业服务公司,均采用Palantir推广的FDE模式。Anthropic与黑石、高盛合资成立估值15亿美元的企业服务公司;OpenAI筹建The Development Company,计划融资40亿美元,估值100亿美元。FDE岗位数量从2025年4月的643个飙升到2026年4月的5330个,同比增长729%。
韩国初创公司LetinAR正在开发用于AI眼镜的微型光学元件,其透镜仅有指甲盖大小,有望成为AI眼镜时代的光学基础。
OpenAI与Dell达成合作,将AI编码工具Codex引入混合云和本地环境,帮助企业安全部署AI编码代理,实现数据和工作流程的集成。
瑞银预测2026年TPU出货总量413万块,其中博通368万块、联发科45万块;2027年出货987万块,博通676万块、联发科311万块。
Colt DCS任命Fumi Takei领导日本业务,以扩大该国AI就绪数据中心容量并推进战略。
空心光纤(Hollow-core fiber)承诺更快的速度和能效,但高成本和有限收益可能阻碍其在数据中心的广泛应用。
艺术家SHL0MS将一幅真实的莫奈画作伪装成AI生成图片发布到X平台,引发大量网友批评该“AI图像”质量低劣。实验揭示了艺术界对AI的强烈偏见,引发关于技术与创作关系的讨论。
Cognizant以6亿美元收购Astreya,旨在增强其AI基础设施和数据中心服务能力,顺应超大规模云服务商投资增长趋势。
普华永道发布报告,追踪数据中心对脱碳的影响。报告指出,随着AI增长和数据中心能源需求变化,企业继续投资可持续性,脱碳策略正在被重塑。
TrendForce最新研究指出,高端MLCC因AI芯片需求强劲而供需趋紧,消费级MLCC供应也承压,部分分销商开始预防性补库,供应商提价。ODM与供应商的谈判显示,MLCC整体价格平均跌幅降至近三年最低,预示定价周期进入可能反弹的关键阶段。
行业调查显示,用于代理AI的CPU专用服务器通常采用双插槽配置,其DDR5内存容量相比1-2插槽通用服务器提升2至4倍。
Sam Altman在推文中表示,ChatGPT Images 2.0在印度已创建超过10亿张图片,显示了该产品在印度市场的广泛应用。
台积电CPO方案COUPE on Substrate计划2026年下半年量产。AI GPU基板面积和层数大幅增加,使ABF材料消耗比常规CPU扩大5-10倍。高端ABF基板供需预计长期紧张。
GBrain宣布将ZeroEntropy作为默认的嵌入和重排序选项,推荐使用以替代OpenAI和Voyage AI。
Garry Tan 开源了他的整个 Claude 代码设置,包含 23 个斜杠命令和 7 个角色,一条安装命令即可使用。该项目在两个月内获得了 97k 星。
Y Combinator首席执行官Garry Tan发布开源AI记忆系统GBrain,采用8层结构增强代理记忆,区别于传统RAG方法。该系统可集成到OpenClaw和Hermes等AI代理中,提升对用户个人信息的理解和记忆能力。
苹果将在新版Siri中强调隐私,可能加入自动删除聊天记录功能。
谷歌宣布将Google AI Ultra订阅用户的访问权限扩展到全球,并推出基于Street View的新功能,使用户能够模拟真实世界地点。
Google DeepMind发布Gemini Omni,这是其在AI领域的新产品/模型。
LangSmith Engine推出持续自我改进循环功能,为每个智能体提供始终在线的追踪和自优化能力,推动AI代理开发效率提升。
来源:twitter
发布时间:2026-05-17T17:15:04+00:00
This week, the company has been trying out all types of different AI tools including Devin, Mistral, Grok, Perplexity, Cerebras Public API, etc in addition to the typical Claude & ChatGPT/Codex tools. Most of them we will probably churn from very rapidly as it has negative value add, but one tool that has been shocking better than Claude is @AravSrinivas '