1.美团公司视频

美团,你是跨界上瘾了是吧!(doge)没错,最新开源SOTA视频模型,又是来自这家“送外卖”的公司。模型名为LongCat-Video,参数13.6B,支持文生/图生视频,视频时长可达数分钟。

美团视频生成模型来了!一出手就是开源SOTA(插图

2.美团视频怎么制作

从官方释出的demo来看,模型生成的视频不仅更加真实自然,而且懂物理的能力又双叒增强了。无论是空中滑板:

美团视频生成模型来了!一出手就是开源SOTA(插图1

3.美团商品视频

还是一秒特效变身:

美团视频生成模型来了!一出手就是开源SOTA(插图2

4.美团视频是什么意思

抑或是第一视角下,全程需要保持画面一致的骑车视频(时长整整有4分多种):

美团视频生成模型来了!一出手就是开源SOTA(插图3

5.美团美食视频

仔细看,视频的AI味儿浓度确实降低不少而且从测评成绩来看,其表现也相当亮眼——文生视频能力在开源模型中处于顶尖水平,整体质量优于PixVerse-V5和Wan2.2-T2V-A14B,部分核心维度甚至可与谷歌最新、最强闭源模型Veo3媲美。

美团视频生成模型来了!一出手就是开源SOTA(插图4美团视频生成模型来了!一出手就是开源SOTA(插图5

6.美团商家首页视频制作

而且由于采用的是允许商用的MIT协议,连Hugging Face高级主管也用三连问来表示惊叹。中国团队竟然发布了一个MIT协议的基础视频模型???

美团视频生成模型来了!一出手就是开源SOTA(插图6

7.美团视频海报怎么做

以及其长视频生成能力(稳定输出5分钟)也被视为,“我们离视频AI的终极形态又更进一步”。

美团视频生成模型来了!一出手就是开源SOTA(插图7

8.美团外卖产品视频

so,一家外卖公司出品的视频模型究竟如何?来看更多案例文生/图生视频开源SOTA,还能像制作连续剧一样生成长视频!整体而言,美团这次发布并开源的LongCat-Video具备以下功能:文生视频:可生成720p、30fps高清视频,语义理解与视觉呈现能力达开源SOTA级别;。

9.美团运营视频

图生视频:能够保留参考图像的主体属性、背景关系与整体风格等;视频延长:核心差异化能力,可基于多帧条件帧续接视频内容文生视频方面,从官方提供的案例来看,这个模型尤为强调对真实世界的理解能力一眼看去,主页上一溜的足球、体操、跳舞等视频:。

美团视频生成模型来了!一出手就是开源SOTA(插图8

10.美团短视频叫什么

仅以其中的“水上芭蕾”来看,模型面临的挑战不可谓不艰难——既需要具备高度的细节捕捉能力,还需要能够处理复杂的光影效果、环境模拟和动态场景而LongCat-Video几乎都考虑到了,整体完成度be like:。

图生视频方面,这不双十一到了,所以各大商家也能拿来做一些更实用的宣传视频了:

美团视频生成模型来了!一出手就是开源SOTA(插图9

当然,由于提供了原始参考图,所以图生视频上通常我们更看重模型是否能保持前后一致而当给了LongCat-Video一张机器人正在工作的图片后,它直接立马生成了机器人“居家办公”的日常vlog一会儿拿桌上的小熊、一会儿拿水杯、甚至下班关电脑……不同动作下,桌面及周围的环境均未发生“异变”,扛住了一致性挑战。

美团视频生成模型来了!一出手就是开源SOTA(插图10

当搞定了一致性这个“老大难”后,LongCat-Video的玩法也就更多了白天当壁画,晚上出来打游戏可还行(谁说不是真·破壁呢?)还能制作动画大电影:此外,LongCat-Video最核心的能力还在于视频延长

,它能像制作连续剧一样生成分钟级长视频一个视频搞定后,只需接着续写提示词,最终就能生成一个完整情节或片段比如下面这个接近半分钟的视频,就是通过以下提示词一步步实现的(中译版):1、厨房明亮通风,白色橱柜和木质台面交相辉映。

一块新鲜出炉的面包放在砧板上,旁边放着一个玻璃杯和一盒牛奶一位身着碎花围裙的女士站在木质台面旁,熟练地用锋利的刀切着一块金黄色的面包面包放在砧板上,她切的时候,面包屑四处飞溅2、镜头拉远,女人放下手中的刀,伸手去拿牛奶盒,然后将其倒入桌上的玻璃杯中。

3、女人放下牛奶盒。4、女人拿起牛奶杯,抿了一口。

美团视频生成模型来了!一出手就是开源SOTA(插图11

怎么样?是不是有拍电影电视剧的感jio了~敲黑板,由于LongCat-Video本身就经过视频连续任务的预训练,所以它能够制作长达数分钟的视频,而不会出现颜色漂移或质量下降的情况(一般可稳定输出5分钟级别的长视频,且无质量损失)。

美团表示,之所以推出LongCat-Video,核心瞄准的还是世界模型这一前沿领域:作为能够建模物理规律、时空演化与场景逻辑的智能系统,世界模型赋予AI“看见”世界运行本质的能力而视频生成模型有望成为构建世界模型的关键路径。

——通过视频生成任务压缩几何、语义、物理等多种形式的知识,AI得以在数字空间中模拟、推演乃至预演真实世界的运行而为了构建视频模型LongCat-Video,美团这次在技术方面也是进行了一系列创新和突破背后技术原理

LongCat-Video只有13.6B,但集成了文生视频、图生视频和视频续生三大任务于一体。

美团视频生成模型来了!一出手就是开源SOTA(插图12

具体来说,整个模型以Diffusion Transformer

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。