数币财富链,致力于帮助投资者在数字货币市场中实现财富增长。
首页 / 最新快讯

盘前机会前瞻|阿里宣布视频大模型万相2.1开源!这几家公司在文生视频和AI短视频领域已服务众多客户有望受益(附概念股) · 证券

2月25日,从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型。今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升。在视频生成方面,万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能,登上VBench榜单第一。

【机会前瞻】

2月25日,阿里巴巴集团宣布将旗下文生视频模型“万相2.1”全面开源。作为全球首个支持中英双语、首个实现无限长1080P视频编解码的开源模型,万相2.1的开放不仅打破了专业视频创作的技术壁垒,更可能重构全球AIGC产业的竞争格局。

万相2.1采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,全球开发者可在Github、HuggingFace和魔搭社区下载体验。其中1.3B版本仅需8.2GB显存就可以生成高质量视频,适用于二次模型开发和学术研究。

今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升。在视频VAE方面,万相2.1设计了创新的视频编解码方案,通过将视频拆分成若干块并缓存中间特征的方式,代替直接对长视频的E2E编解码过程,实现显存使用与原始视频长度无关,支持无限长1080P视频的高效编解码。万相2.1在视频生成领域的权威评测集VBench上以总分84.7%的成绩登顶,在运动幅度、多对象生成、空间关系等16个评分维度中的多个关键能力上拿下最高分。

万相团队的实验结果显示,在运动质量、视觉质量、风格和多目标等14个主要维度和26个子维度测试中,万相均达到了业界领先表现,并且斩获5项第一。尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。

自2023年8月起,阿里云相继开源Qwen系列大语言模型,覆盖从0.5B到110B的全尺寸参数,形成全球最大的开源模型家族,衍生模型数量已突破10万。此次万相2.1的开源延续了这一战略。

版权说明:
1.版权归本网站或原作者所有;
2.未经本网或原作者允许不得转载本文内容,否则将视为侵权;
3.转载或者引用本文内容请注明来源及原作者;
4.对于不遵守此声明或者其他违法使用本文内容者,本人依法保留追究权等。
搜索
关注我们
关注我们
微信
关注我们
微博
数币财富链,致力于帮助投资者在数字货币市场中实现财富增长。我们提供专业的市场分析、投资策略建议以及最新的区块链金融资讯。无论您是初入币圈的新手还是资深投资者,数币财富链都是您通往财富自由的可靠选择。加入我们,开启数字货币投资之旅!

数币财富链. 鲁ICP备2024111624号