产品详情

通义万相是由阿里云通义实验室研发的多模态AI创作平台，历经多次重大迭代：2025年8月开源Wan2.2-S2V音频驱动视频生成模型，2026年1月正式发布Wan2.6系列模型，涵盖文生图、文生视频、图生视频、参考生视频、图像生成与编辑五大核心能力。2026年3月，阿里云对Wan2.6系列模型进行价格调整，进一步降低视频生成成本；同时通义万相首尾帧生视频14B模型开源，成为业界首个百亿参数规模的开源首尾帧视频模型。平台核心优势在于国内首个支持角色扮演的视频模型、15秒长视频连贯叙事、智能分镜调度及高质量声音合成，广泛应用于短剧创作、电商营销、广告制作、动漫漫剧等专业影视级场景。

产品功能

多模态视频生成能力（Wan2.6系列）：支持文生视频（文本生成视频）、图生视频（图像生成视频）、参考生视频（基于参考视频的角色形象和音色生成多镜头视频）三大核心模式，单次视频时长可达15秒，实现更完整叙事结构。
角色扮演与智能分镜：国内首个支持角色扮演功能的视频模型，可指定人物或物体作为主角，复刻外观与音色，生成单人表演或多人合拍视频；同时支持智能分镜调度，用户输入简单提示词，AI自动拆解为多镜头组合并保持主体、场景、情绪一致性。
音画同步与音频驱动：支持生成视频时自动匹配高质量背景音效和音乐，多人对话场景稳定生成，人声表达真实自然；音频驱动功能可根据用户输入的文本和音频，生成与声音精准同步的视频内容。
图像生成与编辑：支持多图融合与创意重组，智能融合产品、场景、色调等元素；商用级主体一致性保持，严格锁定角色、风格或元素；图文混排智能生成，实现图+文案一键转化。
文生图高度可控：对艺术风格的精准把控，肌理、色彩与笔触细节丰富；支持镜头和光线精准控制，可指定视角、近远景及光影细节；真实人像质感表现优异。
首尾帧视频生成：根据用户指定的开始和结束图片，生成能衔接首尾画面的720p高清视频，满足延时摄影、变身等定制化需求，业界首个百亿参数开源模型。
开发者与API生态：通过阿里云百炼平台提供API调用服务，支持企业级集成与自动化工作流；已适配网心算力云等第三方平台，打通“模型能力+高端算力”服务闭环。

产品价格

通义万相采用“免费体验+API按量计费+企业定制”的混合定价模式。个人用户可通过通义万相官网直接免费体验基础功能。企业和开发者通过阿里云百炼平台调用API服务，采用资源包预付费或后付费模式，2026年3月起对Wan2.6系列模型进行价格调整，视频生成成本进一步降低。具体计费标准根据模型规格（如文生视频、图生视频、参考生视频）、生成时长、分辨率等因素综合计算，用户可在阿里云百炼平台查看详细定价文档。企业级用户支持私有化部署、专属模型定制及技术服务包，需联系阿里云官方获取定制化报价。

通义万相

产品详情

产品功能

产品价格

同类工具

即梦AI

有言

LibLibAI

白日梦

蝉镜

海螺视频

腾讯混元AI视频

魔珐星云

AdsTurbo AI

雾象

评论