每日AI资讯0903：未来科技浪潮，人工智能重塑数字世界

今日AI界风起云涌：清华与东北大学联手推出UltraRAG 2.0，以50行代码简化RAG系统构建；Perplexity对Chrome的收购意向撼动浏览器市场格局。腾讯连发两款开源神器，单图生成3D世界的HunyuanWorld-Voyager与开箱即用的Youtu-Agent框架。谷歌、即梦AI、通义实验室、微软等巨头也纷纷亮剑，从网页内容理解、多模型服务到智能体开发框架，技术革新正以前所未有的速度，重塑我们的数字生活与开发范式。

清华联手东北大学发布UltraRAG 2.0：50行代码定义RAG新范式

清华大学与东北大学等机构联合发布了UltraRAG 2.0框架，它基于创新的模型上下文协议（MCP）架构，允许开发者通过简单的YAML文件来配置和构建复杂的检索增强生成（RAG）系统。该框架支持串行、循环、条件分支等多种逻辑，极大地降低了高性能RAG应用的开发门槛，让复杂的AI系统搭建变得前所未有的简单。

插图：代码流与神经网络的抽象结合

图源备注：图片由AI生成

AI浏览器战争升级 Perplexity欲收购Chrome

AI搜索公司Perplexity对谷歌Chrome浏览器提出高达345亿美元的收购报价，此举震惊业界，标志着AI对传统浏览器市场的颠覆性冲击正式拉开序幕。与此同时，Anthropic公司也推出了针对Chrome的Claude扩展，AI与浏览器的深度融合已成大势所趋，一场围绕下一代智能浏览体验的战争已然爆发。

插图：两个科技巨头的Logo在浏览器窗口中对峙

图源备注：图片由AI生成

腾讯再亮王牌 HunyuanWorld-Voyager实现单图生成3D世界

腾讯AI研究团队开源了其最新的研究成果HunyuanWorld-Voyager。这一模型堪称“神器”，仅需一张普通的2D图像，就能即时生成与之完全一致的3D点云世界。凭借其卓越的原生3D重建能力，在相机控制、内容对齐和3D一致性上表现出色，成功登顶WorldScore全球排行榜，为3D重建和图生3D领域带来了革命性突破。

![插图：一张风景照片悬浮在空中，下方延展出一个完整的、可供探索的3D立体世界]

图源备注：图片由AI生成

人人都是开发者腾讯优图开源Youtu-Agent智能体框架

腾讯优图实验室正式开源Youtu-Agent智能体框架，主打“开箱即用”的便捷理念。开发者无需进行复杂的模型训练，只需从GitHub上获取代码，通过编写简单的YAML配置文件来定义智能体的具体行为，便能迅速搭建并运行个性化的智能体应用，极大地降低了技术门槛。

插图：一个即插即用的模块化机器人，用户可以轻松更换代表不同功能的模块

图源备注：图片由AI生成

谷歌Gemini API添新翼 AI可“阅读”并理解整个网页

谷歌为其Gemini API增加了一项名为URL Context的全新功能。这项技术使得AI不再局限于抓取网页摘要或部分信息，而是能够像人类一样深入、完整地理解和解析整个网页的内容。这一重大进展意味着开发者可以构建出更精准、更智能的应用，实现对网络信息的深度利用。

插图：一个AI大脑正在扫描一个网页，网页中的文字和图片转化为结构化的数据流

图源备注：图片由AI生成

即梦AI模型全面开放API 提供一站式图像视频生成服务

即梦AI与火山引擎达成合作，将其旗下包括文生图、图生图、视频生成、数字人等在内的一系列先进AI模型，通过API的形式向企业级用户和开发者全面开放。此举旨在提供一个一站式的图像与视频生成解决方案，开发者可以轻松接入并利用这些经过市场验证的强大功能，创造高质量的视觉内容。

插图：一条API数据流从一个服务器流向多个不同的终端设备，每个设备上都显示着由AI生成的不同风格的图像和视频

图源备注：图片由AI生成

Cherry Studio携手硅基流动免费开放Qwen38B模型

为了提升用户体验，AI桌面客户端Cherry Studio宣布与硅基流动达成深度合作，向所有用户免费提供通义千问Qwen38B模型。该模型以其出色的推理能力、指令遵循和多语言支持而广受好评。此次合作将进一步丰富Cherry Studio的多模型生态，让跨平台用户能更便捷地享受到顶级AI模型的强大功能。

插图：一个樱桃形状的工作室Logo与一个芯片Logo握手，背景是流畅运行在不同操作系统上的AI界面

图源备注：图片由AI生成

通义实验室发布AgentScope 1.0 打造一站式智能体开发平台

通义实验室正式推出新一代开源智能体开发框架AgentScope 1.0。该框架以开发者为核心，致力于解决多智能体从开发、构建到运行和管理的全生命周期难题。通过其三层技术架构（核心框架、Runtime和Studio），AgentScope 1.0为开发者提供了灵活且强大的解决方案，让构建安全、高效的智能体应用变得更加简单。

插图：一个开发者在一个可视化的工作台上拖拽不同的智能体模块，构建出一个复杂的多智能体协作系统

图源备注：图片由AI生成

微软Copilot能力升级免费用户也可多文件推理

微软宣布对其AI助手Copilot进行重要更新，免费向所有网页版和Windows 11版用户开放多文件分析功能。现在，用户可以一次性上传最多三个文件，让Copilot进行跨文档的理解和推理。这一此前仅限付费用户的功能将极大提升Copilot的实用性，例如可以同时分析简历和招聘启事，为求职者提供精准建议。

插图：三份不同的文档被一只机械手同时送入一个Copilot大脑中进行分析和比较