传媒互联网行业·：国内外大模型加速迭代关注AI多模态应用及AIAGENT进展-动态资讯-北京联索科技有限公司

动态资讯

传媒互联网行业·：国内外大模型加速迭代关注AI多模态应用及AIAGENT进展

2025-08-07 18:27:19 新浪网 [查看原文]

事件：近期，国内外大模型加速迭代，国内方面（1）7 月28 日智谱发布其最新一代旗舰模型GLM-4.5；（2）7 月28 日阿里开源视频生成模型通义万相Wan2.2，为业界首个使用MoE 架构的视频生成模型。海外方面8 月6 日多家公司宣布（1）谷歌DeepMind 宣布推出第三代通用的世界模型Genie 3；（2）Anthropic 发布新模型Claude Opus 4.1，编程能力以及复杂多步骤问题处理能力显著提升；（3）OpenAI 发布了两款开源模型GPT-OSS-120B 和GPT-OSS-20B，时隔六年再度发布开源模型。

国内外大模型加速迭代，有望加速AI 应用生态繁荣。近期，我国国内外大模型加速迭代，其中：

国内方面（1）7 月28 日智谱发布其最新一代旗舰模型GLM-4.5，定位为融合推理、编码和智能体能力的智能体基座模型，在涵盖推理、编程、智能体等场景的12 项基准测试中，GLM4.5 的综合性能取得了全球开源模型SOTA；（2）7 月28 日阿里开源视频生成模型通义万相Wan2.2，其中文生视频模型和图生视频模型为业界首个使用MoE 架构的视频生成模型，总参数量为27B，激活参数14B，在同参数规模下可节省约50%的计算资源消耗，在复杂运动生成、人物交互、美学表达等维度上取得了显著提升。

海外方面（1）谷歌DeepMind 宣布推出第三代通用的世界模型Genie 3，相较传统视频生成模型，Genie 3 可以进行实时交互，且具备较强“记忆力”以及环境一致性，上述突破有望加速模型向应用层的转变，或将率先应用于游戏、自动驾驶等多个领域；（2）Anthropic 发布新模型Claude Opus 4.1，在编程能力方面实现了实质性突破，SWE-Bench Verified 上该模型得分达到74.5%，且升级后的Opus 模型在处理复杂多步骤问题时更加高效，定位为更有效的AI Agent；（3）OpenAI 时隔六年再度发布了两款开放权重语言模型GPT-OSS-120B 和GPT-OSS-20B，支持低/中/高的3 种推理强度，同时开放了推理链，GPT-OSS-20B 可在16GB 内存的设备上运行，GPT-OSS-120B需要约80GB 内存，适合包括Mac 电脑在内的个人设备。

我们认为全球基础大模型能力持续升级，成本下探以及效果提升有望持续推动多模态AI 应用及AI Agent 生态繁荣，基于AI 的数字互动有望成为下一个传媒互联网产业的热门赛道。

应用层面：建议重点关注AI多模态应用以及AI Agent 商业化落地进展。

2025 年作为AI 多模态应用以及AI Agent 商业化元年，建议持续关注其商业化进展。其中AI 多模态应用方面，我国文生图、文生视频等应用均维持全球领先地位，例如图片生成领域的美图，C 端产品美图秀秀、美颜相机以及B端产品美图设计室等共同发力；视频生成领域的快手近期发布“灵动画布”1.0 版本，且25Q3 将推出面向专业团队的“工作室会员”，未来有望融入Agent能力，打造AI 创意工作台，我们预计全年可灵收入有望突破10 亿人民币，二者均在海外市场实现了快速增长。AI Agent 方面，随AI 多模态能力提升以及MCP、A2A 等标准协议推出持续赋能生态，我国AI Agent 商业化落地持续推进，例如（1）金蝶国际：苍穹Agent 平台2.0，同时开发了金钥财报（财报分析智能体）、ChatBI（企业问数智能体）、招聘智能体、差旅智能体以及企业知识智能体；（2）迈富时：推出AI-Agentforce 智能体中台，打造出企业级、生产级的智能体一站式开发与运营平台，该产品整合了从设计、部署到运维的全生命周期能力，已将该“底座+中台”能力应用至医药、汽车、零售、金融、制造、泛娱乐等多个行业，结合各行业Know-How，构建“AI Agent智能体中台+行业场景+智能工具”的定制化产品矩阵。

相关标的：（1）云计算：阿里巴巴-W、百度集团-SW；（2）AI 多模态应用：

腾讯控股、美图公司、快手-W、阜博集团、赤子城科技、巨人网络、恺英网络；（3）AI Agent：金蝶国际、迈富时、焦点科技。

风险提示：AI 技术进展不及预期，应用落地不及预期，AI Agent 落地不及预期，AI 商业化进程不及预期。

本栏目中的所有页面均系自动生成，自动分类排列，采用联索网络信息采集、网页信息提取、语义计算等智能搜索技术。内容源于公开的媒体报道，包括但不限于新闻网站、电子报刊、行业门户、客户网站等。使用本栏目前必读