国产视频生成大模型与Sora“正面刚” 国内外差距正缩小

PRODUCT

产品中心

热线电话：

400-123-2588

联系人：张生
传真：+86-123-4657
手机：136523411251
邮箱：houdejixie.com
地址：广东省广州市天河区某某工业园88号

立即咨询

当前位置： JN江南·(中国)体育官方网站 > 产品中心

国产视频生成大模型与Sora“正面刚” 国内外差距正缩小

发布时间：2024-10-07 丨浏览次数：

　　今年以来国产大模型快速更新迭代，文生视频赛道迎来强有力的中国选手。9月24日，豆包大模型发布两款视频生成大模型，加速丰富大模型商业应用场景，而5天前的2024云栖大会上，阿里通义率先发布的全新AI视频生成大模型，更率先面向公众免费开放使用。记者留意到，此前快手、Vidu等国内厂商也推出相关视频生成模型内测。

　　业内研报指出，自今年2月OpenAI发布Sora后，国产大模型仅用半年时间实现赶超，国内外视频生成模型之间的差距已明显缩小，视频大模型因具备广阔商用潜力，下游应用正积极储能。

　　只需简单的文字或图片描绘，一条达到影视级的声画并茂的视频就能自动生成……这在半年前只有国外OpenAI可以做到，如今国内AI视频生成领域正迎来一系列令人瞩目的突破。字节演示的豆包生成视频大模型显示，其根据提示词生成的视频不仅细节丰满，而且镜头电影质感十足；阿里云则一次性放出了文生视频和图生视频两个创作入口，通义万相AI能够一键生成最长5秒、每秒30帧、720P分辨率的音画同步视频。

　　业内指出，相对于大语言模型、视觉大模型等，视频生成大模型是相对最难的。火山引擎总裁谭待表示，“（AI视频生成）需要大模型能理解复杂指令，包括对多镜头语言的运用，实现多个主体的交互视频，保持风格的一致性等。”

　　今年2月，OpenAI发布全新的文生视频模型Sora，率先开启了AI视频生成的ChatGPT时刻；3月26日，字节跳动旗下剪映Dreamina开放内测；4月27日，首个自研视频大模型Vidu发布；6月6日，快手可灵AI正式开放内测……9月，阿里通义、豆包大模型相继发布影视级的视频生成大模型。仅过了半年，国内涌现出多款对标Sora的AI视频大模型。

　　德邦证券发表研报称，Sora视频大模型发布至今，加速引爆视频赛道，国内外已有十多家公司发布或更新视频生成模型，抢占用户或为未来主线。

　　相比热门的国外视频生成模型，国产视频生成模型正快速拉近差距，而且具有明显特点。浙商证券计算机首席分析师刘雯蜀指出，在中文语境下，国内模型文生视频表现优于国外。阿里云CTO周靖人表示：比起国外的Sora、Gen-3 Alpha，通义万相的AI视频模型对中式元素针对性优化了概念理解和生成能力，“更懂中国话，更懂中国风”。

　　如今诸多大模型技术已经应用到自动驾驶、游戏、金融、内容营销等各行各业，但视频生成大模型则处于刚起步阶段。

　　在业内人士看来，抖音、阿里、快手等“大厂”率先出手布局视频生成大模型的动作表明，视频生成技术在人工智能领域正日益受到重视，并且正在快速进步，未来可能会对影视制作、广告设计等多个领域产生深远影响。“尤其是在微短剧市场率先开启商业化应用。”

　　阿里通义方面的模型研发负责人告诉记者，视频模型的训练使用了多种风格的视频数据，因此可生成科技感、电影色、卡通风格和素描等类型丰富的视频，“未来将进一步实现2K超清效果，可应用于短视频、电影制作等场景。”

　　事实上，如今已有越来越多的影视制作公司和平台开启探索“AI+微短剧”的融合路径。今年7月，国内首部AIGC原创奇幻微短剧《山海奇镜之劈波斩浪》正式上线，全剧实现了画面完全由快手的AI视频大模型制作生成。同月，抖音联合博纳影业也推出了全国首部AIGC连续性科幻短剧集《三星堆：未来启示录》。集团影视制作副总经理曲吉小江认为，在中国网络短剧市场爆发式增长时期，江南体育官网AIGC（生成式）技术的应用为行业发展打开了新的增长空间。

　　德邦研报亦指出，未来随着用户习惯的培育以及算力基础设施的完善，视频大模型或在办公、广告、电影、等多领域具有广阔的前景。

　　国家数据局局长刘烈宏此前公开介绍，中国10亿参数规模以上的大模型数量已超100个，行业大模型深度赋能电子信息、医疗、交通等领域，形成上百种应用模式，赋能千行百业。视频生成大模型的前景更值得期待。据东吴证券研报测算，若以AI渗透率为15%计算，中国AI视频生成的潜在行业空间达3178亿元。

　　不过，国内多个投资机构依然对文生视频、图生视频等大模型持保守和谨慎态度。业内人士提示，视频生成技术虽然在加速迭代，但产业规模待进一步深挖，包括技术和成本等多个现实问题不容忽视。

　　技术上，视频生成大模型需要依赖于先进的算法和强大的计算能力，还必须解决包括一致性、连贯性、物理合理性以及逻辑合理性在内的多种复杂问题；在商业落地上，需要更为成熟的应用场景，目前仍然局限在影视制作、社交平台上。

　　最后则是成本问题，目前文生图和图生视频功能只能生成分镜头，再由后期剪辑团队人工剪辑而成。带来的价值也不如外界预期的那么大。业内认为，只有解决了成本，才能更好实现技术创新与普及。“只有大的使用量，才能打磨出好模型，也能大幅降低模型推理的单位成本。”中国电子商务专家服务中心副主任、互联网专家和观察家郭涛表示。

江南体育官网

关于江南体育

产品中心

新闻资讯

成功案例

江南体育合作加盟

人才招聘

联系江南体育

客户留言

热门关键词：

友情链接：