独家消息称台积电3nm制程报价下半年上涨15%,明年可能再涨10%,CEO魏哲家预计将在股东会上说明具体情况。
Semianalysis发布LLM推理延迟分析:端到端延迟中prefill占48%,decode占52%;prefill又分为prefill extend(缓写入)和cache read(缓存读取)。
Google在I/O 2026上改革搜索,用AI代理替换蓝色链接,引发用户不满,导致隐私搜索引擎DuckDuckGo安装量激增30%。
LangChain JS 的多模态儿童睡前故事生成器作为开源示例被发布,展示了利用该框架进行创意应用的可能性。
Google发布Gemini Flash 3.5模型,同时呼吁开放100B参数的Gemma 4 MoE模型。
NVIDIA 发布 CompileIQ 自动调优工具,可自动搜索最佳编译器选项以提升特定工作负载的性能,如 LLM 推理管线。该工具解决性能工程中编译器选项优化难题,帮助开发者在已优化的基础上进一步榨取性能。
StableBrowse 是一款面向 AI 代理的新型浏览器层,声称能减少 70% 的令牌消耗,并实现 3-4 倍的执行速度提升。该产品由 ycombinator 孵化的团队发布。
小米集团2026年一季度业绩电话会披露:总收入991亿元,经调整净利润61亿元;手机ASP 1310元创历史新高,市占率11.3%连续23季度全球前三;汽车交付80856辆,预计全年交付50万辆,27年三四季度出海;AI大模型全球排名第五,全年AI投入或超160亿元。
Human Archive宣布完成820万美元种子轮融资,资金将用于模拟人类具身智能的研究。该消息由公司通过推特公布,获得一定关注。
NVIDIA CUDA 13.3 发布,引入 Tile Programming in C++,支持 Compute Capability 9.0,并带来编译器自动调优和 Python 更新,提升 GPU 开发效率。
NVIDIA发布CUDA Tile编程技术,允许开发者在现有C++ GPU代码库中使用基于块的编程开发高性能GPU内核。
NVIDIA发布Vera CPU基准测试结果,性能比领先x86处理器高1.5倍,Linux内核编译快2倍,内存带宽提升4倍,适用于AI工厂的复杂代理工作负载。
a16z发文指出,合规流程繁琐且人工密集,但AI可能迎来突破。许多LLM在LegalBench的162项法律推理任务中得分80-100%,这为AI在合规领域的应用提供了信任基础,因为合规本质上是有操作约束的法律推理。
WillowVoiceAI 推出语音AI写作助手 Willow Scribe,可快速处理邮件、文档和消息。
微软CEO萨提亚·纳德拉转推Mustafa Suleyman的推文,宣布MAI-Image-2.5模型发布,该模型在@arena的文生图排行榜上排名第三,是质量上的又一次提升。
Modine达成40亿美元交易,将冷却产能转化为预留基础设施。AI基础设施开发者开始提前数年预订冷却设备产能,而非仅购买现成产品,反映行业供需模式变化。
OpenArt推出新功能,用户可将单张图片转换为可供创作者精确控制的持久3D世界。
Hugging Face上发布了CHI-Bench,这是世界首个针对人工智能代理的长周期医疗保健基准测试,包含75个真实健康任务。
HuggingFace转发Victor Mustar消息:发布Marlin-2B开源视频视觉语言模型,采用Apache 2.0许可。该模型可理解视频内容及时间信息。
Web Task API发布,这是一种AI驱动的网页自动化工具,用户可以用自然语言描述重复性任务,实现自动化执行。
腾讯混元翻译模型在Hugging Face平台获得大量关注与支持,用户反馈热烈。
PrismML 发布了 1-bit 和 Ternary Bonsai Image 4B 系列图像生成模型,专注于运行高质量图像生成。
Anthropic在工程博客中发文,探讨代理的访问和权限应随能力进化,并通过沙箱机制限制潜在破坏性行为。
据SemiAnalysis观点,Meta将70%的新毕业软件工程师重新分配至强化学习任务,体现公司对RL方向的资源倾斜。
Y Combinator宣布开源IDE项目Superset,支持开发者并行运行数百个AI Agent。过去4个月周增长30%,帮助工程师将PR提交量提升10倍。
PrismML发布了Binary and Ternary Bonsai Image 4B模型,支持1-bit量化,声称将改变图像生成领域。该消息由xenovacom在推特上转发,获得较多关注。
OpenRouter完成1.13亿美元B轮融资,由CapitalG领投,估值在一年内超过翻倍至13亿美元,使用量半年增长5倍,表明多AI模型聚合需求强劲。
@agupta在X平台引用推文称,DeepSeek将其前沿模型永久定价为美国实验室的1/30,该推文获1672点赞,并引发对硬件成本的疑问。
介绍使用Codex时,可以指示其调用Claude作为子代理处理前端设计工作,通过特定提示词实现更优效果。
Twolabs 正在开发用于护理的人形机器人,首先应用于养老院,旨在解决护理人员超负荷工作及老年人支持不足的问题。该机器人兼具实用性和社交交互能力。
NVIDIA AI实验室发布了关于文本扩散和弹性推理的技术文章,介绍相关研究成果。
AWS发布技术博文,介绍Amazon Bedrock AgentCore平台,该平台帮助开发者构建和运营生成式AI代理,并集成支付功能以解决代理访问付费服务时的账单管理问题。文章还提到AI代理流量快速增长,推动内容提供商和API向按使用付费模式转变。
AWS发布博客介绍如何使用LangGraph与Amazon Bedrock AgentCore结合AWS Lambda和Step Functions构建高可扩展的无服务器多智能体系统,解决推理延迟、状态管理和可观测性等挑战。
每天有超过10亿份PDF被创建,但现有AI代理无法可靠读取。今日发布Parse产品以解决这一问题。
AWS博客介绍使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore构建高性能生成式AI代理系统,解决推理延迟、无状态执行等问题,支持多代理并行推理、上下文持久化和可追踪执行。
Perplexity Computer宣布新增功能,可管理Shopify店铺,为电商卖家提供自动化店铺管理服务。
AgentWatch是AWS推出的主动监控代理,能够自动检测CloudWatch告警滞后、Lambda错误堆积、EC2性能下降等问题,帮助DevOps团队从被动响应转向主动预防,减少运维负担和客户影响。
Arlo Industries推出被动传感器网络,可在3D中跟踪无人机和导弹,无需雷达、无发射、无单点故障,用于防空感知层。该产品已发布。
英伟达发布PiD超分辨率技术,可在像素空间直接从模型潜在变量实现4倍分辨率提升,适用于任何生成图像。
NVIDIA CEO黄仁勋在COMPUTEX前夕与台积电董事长魏哲家等高管共进晚餐。
create_agent文档进行了重大改版,新增的agents页面展示了如何为特定用例构建自定义框架,提供了更灵活的构建方式。
AWS博客介绍使用Strands Agents开源框架和AWS服务(如Amazon Bedrock、Kiro IDE)构建AI研究助手,仅需30行代码即可实现,展示了快速开发AI应用的方法。
TeraWulf与施耐德电气达成2.9亿美元AI数据中心建设协议,在纽约Lake Mariner园区部署液冷技术,利用89%零碳电力,建设周期仅12个月。
AWS 发布了一篇博客,介绍如何为 Amazon Quick 构建企业可观测性解决方案。该方案将 Amazon CloudWatch vended logs 和 AWS CloudTrail 事件整合到 Amazon S3 数据湖中,可通过 Amazon Athena、QuickSight 仪表盘和自定义 Chat Agent 进行查询,以跟踪用户采用情况、满意度、成本和治理。
Alchemize 推出首个 AI 原生报关经纪服务,利用 AI 为进口商提供实时监管信息和快速清关,将清关时间从数天缩短至几分钟。
初创公司Human Archive由伯克利和斯坦福研究人员创立,雇佣印度零工工人佩戴摄像设备及传感器,采集真实世界物理训练数据,供AI与机器人实验室训练使用。
亚马逊Quick服务可从Quick Sight、S3、Redshift、RDS等数据源拉取实时数据,生成Word、Excel等格式文档,并利用Spaces知识库融入组织上下文。
Microsoft Copilot Cowork存在安全漏洞,攻击者可通过提示注入导致数据外泄。该产品允许代理自动发送邮件到用户收件箱,邮件中的外部图片可触发网络请求泄露数据。同时,OneDrive生成的预认证下载链接可能被利用,使攻击者下载文件。
医药板块一季度复苏,医保基金1-3月收入增9.9%、支出增5.5%,财政卫生健康支出增12.1%,创新药融资额同比增130%。脑机接口26年商业化元年,一季度融资额超去年全年3倍。
亚马逊科学团队提出一种新方法,通过引入全局分叉令牌使LLM产生多种推理路径,并采用集监督微调(SSFT)避免模式坍缩,该论文在ICLR 2026发表。