
限免
产品详情
通义万相是由阿里云通义实验室研发的多模态AI创作平台,历经多次重大迭代:2025年8月开源Wan2.2-S2V音频驱动视频生成模型,2026年1月正式发布Wan2.6系列模型,涵盖文生图、文生视频、图生视频、参考生视频、图像生成与编辑五大核心能力。2026年3月,阿里云对Wan2.6系列模型进行价格调整,进一步降低视频生成成本;同时通义万相首尾帧生视频14B模型开源,成为业界首个百亿参数规模的开源首尾帧视频模型。平台核心优势在于国内首个支持角色扮演的视频模型、15秒长视频连贯叙事、智能分镜调度及高质量声音合成,广泛应用于短剧创作、电商营销、广告制作、动漫漫剧等专业影视级场景。
产品功能
- 多模态视频生成能力(Wan2.6系列):支持文生视频(文本生成视频)、图生视频(图像生成视频)、参考生视频(基于参考视频的角色形象和音色生成多镜头视频)三大核心模式,单次视频时长可达15秒,实现更完整叙事结构。
- 角色扮演与智能分镜:国内首个支持角色扮演功能的视频模型,可指定人物或物体作为主角,复刻外观与音色,生成单人表演或多人合拍视频;同时支持智能分镜调度,用户输入简单提示词,AI自动拆解为多镜头组合并保持主体、场景、情绪一致性。
- 音画同步与音频驱动:支持生成视频时自动匹配高质量背景音效和音乐,多人对话场景稳定生成,人声表达真实自然;音频驱动功能可根据用户输入的文本和音频,生成与声音精准同步的视频内容。
- 图像生成与编辑:支持多图融合与创意重组,智能融合产品、场景、色调等元素;商用级主体一致性保持,严格锁定角色、风格或元素;图文混排智能生成,实现图+文案一键转化。
- 文生图高度可控:对艺术风格的精准把控,肌理、色彩与笔触细节丰富;支持镜头和光线精准控制,可指定视角、近远景及光影细节;真实人像质感表现优异。
- 首尾帧视频生成:根据用户指定的开始和结束图片,生成能衔接首尾画面的720p高清视频,满足延时摄影、变身等定制化需求,业界首个百亿参数开源模型。
- 开发者与API生态:通过阿里云百炼平台提供API调用服务,支持企业级集成与自动化工作流;已适配网心算力云等第三方平台,打通“模型能力+高端算力”服务闭环。
产品价格
通义万相采用“免费体验+API按量计费+企业定制”的混合定价模式。个人用户可通过通义万相官网直接免费体验基础功能。企业和开发者通过阿里云百炼平台调用API服务,采用资源包预付费或后付费模式,2026年3月起对Wan2.6系列模型进行价格调整,视频生成成本进一步降低。具体计费标准根据模型规格(如文生视频、图生视频、参考生视频)、生成时长、分辨率等因素综合计算,用户可在阿里云百炼平台查看详细定价文档。企业级用户支持私有化部署、专属模型定制及技术服务包,需联系阿里云官方获取定制化报价。
同类工具
评论
加载中…









