事件:近期,国内外大模型加速迭代,国内方面(1)7 月28 日智谱发布其最新一代旗舰模型GLM-4.5;(2)7 月28 日阿里开源视频生成模型通义万相Wan2.2,为业界首个使用MoE 架构的视频生成模型。海外方面8 月6 日多家公司宣布(1)谷歌DeepMind 宣布推出第三代通用的世界模型Genie 3;(2)Anthropic 发布新模型Claude Opus 4.1,编程能力以及复杂多步骤问题处理能力显著提升;(3)OpenAI 发布了两款开源模型GPT-OSS-120B 和GPT-OSS-20B,时隔六年再度发布开源模型。
国内外大模型加速迭代,有望加速AI 应用生态繁荣。近期,我国国内外大模型加速迭代,其中:
国内方面(1)7 月28 日智谱发布其最新一代旗舰模型GLM-4.5,定位为融合推理、编码和智能体能力的智能体基座模型,在涵盖推理、编程、智能体等场景的12 项基准测试中,GLM4.5 的综合性能取得了全球开源模型SOTA;(2)7 月28 日阿里开源视频生成模型通义万相Wan2.2,其中文生视频模型和图生视频模型为业界首个使用MoE 架构的视频生成模型,总参数量为27B,激活参数14B,在同参数规模下可节省约50%的计算资源消耗,在复杂运动生成、人物交互、美学表达等维度上取得了显著提升。
海外方面(1)谷歌DeepMind 宣布推出第三代通用的世界模型Genie 3,相较传统视频生成模型,Genie 3 可以进行实时交互,且具备较强“记忆力”以及环境一致性,上述突破有望加速模型向应用层的转变,或将率先应用于游戏、自动驾驶等多个领域;(2)Anthropic 发布新模型Claude Opus 4.1,在编程能力方面实现了实质性突破,SWE-Bench Verified 上该模型得分达到74.5%,且升级后的Opus 模型在处理复杂多步骤问题时更加高效,定位为更有效的AI Agent;(3)OpenAI 时隔六年再度发布了两款开放权重语言模型GPT-OSS-120B 和GPT-OSS-20B,支持低/中/高的3 种推理强度,同时开放了推理链,GPT-OSS-20B 可在16GB 内存的设备上运行,GPT-OSS-120B需要约80GB 内存,适合包括Mac 电脑在内的个人设备。
我们认为全球基础大模型能力持续升级,成本下探以及效果提升有望持续推动多模态AI 应用及AI Agent 生态繁荣,基于AI 的数字互动有望成为下一个传媒互联网产业的热门赛道。
应用层面:建议重点关注AI多模态应用以及AI Agent 商业化落地进展。
2025 年作为AI 多模态应用以及AI Agent 商业化元年,建议持续关注其商业化进展。其中AI 多模态应用方面,我国文生图、文生视频等应用均维持全球领先地位,例如图片生成领域的美图,C 端产品美图秀秀、美颜相机以及B端产品美图设计室等共同发力;视频生成领域的快手近期发布“灵动画布”1.0 版本,且25Q3 将推出面向专业团队的“工作室会员”,未来有望融入Agent能力,打造AI 创意工作台,我们预计全年可灵收入有望突破10 亿人民币,二者均在海外市场实现了快速增长。AI Agent 方面,随AI 多模态能力提升以及MCP、A2A 等标准协议推出持续赋能生态,我国AI Agent 商业化落地持续推进,例如(1)金蝶国际:苍穹Agent 平台2.0,同时开发了金钥财报(财报分析智能体)、ChatBI(企业问数智能体)、招聘智能体、差旅智能体以及企业知识智能体;(2)迈富时:推出AI-Agentforce 智能体中台,打造出企业级、生产级的智能体一站式开发与运营平台,该产品整合了从设计、部署到运维的全生命周期能力,已将该“底座+中台”能力应用至医药、汽车、零售、金融、制造、泛娱乐等多个行业,结合各行业Know-How,构建“AI Agent智能体中台+行业场景+智能工具”的定制化产品矩阵。
相关标的:(1)云计算:阿里巴巴-W、百度集团-SW;(2)AI 多模态应用:
腾讯控股、美图公司、快手-W、阜博集团、赤子城科技、巨人网络、恺英网络;(3)AI Agent:金蝶国际、迈富时、焦点科技。
风险提示:AI 技术进展不及预期,应用落地不及预期,AI Agent 落地不及预期,AI 商业化进程不及预期。