谷歌发布视频模型Voe 2,性能第一,网友实测吊打Sora_腾讯新闻

########################################## \u003cdiv class="rich_media_content"\u003e\u003c!--NO_AD_ERROR_5_2I1--\u003e\u003cp\u003e《AI未来指北》特约作者 郝博阳\u003c/p\u003e\u003cp\u003e编辑 郑可君\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e在OpenAI发布会还在产品雕花的时候,谷歌继续努力更新基础模型。半个月前是3D场景生成基础模型、一周前是大杀四方的Gemini 2,而今天则是视频生成模型。\u003c!--NO_AD_0--\u003e\u003c!--EOP_0--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_0--\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e北京时间12月17日,谷歌发布了其文生视频模型Voe的下一个版本 Voe 2。此次升级距离谷歌在今年5月的 I / O大会上首次宣布Voe已经过去7个月。\u003c!--NO_AD_1--\u003e\u003c!--EOP_1--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_1--\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e但Voe仅在十几天前的12月3日才登上Axtrix,在这之前,用户只能利用VideoFX中的实验工具小规模试用这一视频生成软件。\u003c/p\u003e\u003c!--VIDEO_0--\u003e\u003cp type="desc" style="color: rgb(136, 136, 136); font-size: 13px; line-height: 14px; margin-bottom: 22px; margin-top: 8px; text-align: center"\u003e\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e这一版本主要带来三个核心升级。首先是真实感和保真度大为增加,它支持对长度为8s、清晰度为4K视频的输出,并在细节、真实性和伪影减少方面提升巨大。\u003c!--NO_AD_2--\u003e\u003c!--EOP_2--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_2--\u003e\u003c!--VIDEO_1--\u003e\u003cp type="desc" style="color: rgb(136, 136, 136); font-size: 13px; line-height: 14px; margin-bottom: 22px; margin-top: 8px; text-align: center"\u003e\u003c/p\u003e\u003cp\u003e其次,Veo 以其对物理学的理解及遵循详细指令的能力,能够高度精确地捕捉运动。这正是前几日Sora 频频翻车的点。\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003c!--VIDEO_2--\u003e\u003cp type="desc" style="color: rgb(136, 136, 136); font-size: 13px; line-height: 14px; margin-bottom: 22px; margin-top: 8px; text-align: center"\u003e\u003c/p\u003e\u003cp\u003e第三,Voe 2还提供了更多的相机控制选项,你可以输入诸如“镜头缓慢推进她的面庞”、“摄像机在追逐车辆的过程中趋于稳定”、“极近的特写镜头”来去描述你需要的镜头模式。\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_0--\u003e\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e当然,从目前谷歌给出的范例来看,Voe 2 对物理世界的理解确实达到了相当的高度,尤其是人类乃至昆虫的动作表现,这些动作与世界交互的自然感都很强。比如这只用喙捕猎的\u003c!--SECURE_LINK_BEGIN_0--\u003e火烈鸟\u003c!--SECURE_LINK_END_0--\u003e,它激起的水花就不像Sora前两天演示时那种火山爆发般的夸张。\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_1--\u003e\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e在实际的测试中,Voe也得到了SOTA的水平。谷歌选取了其他包括Sora在内的顶尖模型,在 Meta 发布的基准数据集 MovieGenBench 上比拼了 1003 条提示及其对应视频。\u003c!--NO_AD_3--\u003e\u003c!--EOP_3--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_3--\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e从整体表现上看,Veo占优的情况都接近或超过了50%,不占劣势的情况则能达到70%左右。\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_2--\u003e\u003c/p\u003e\u003cp\u003e比较有趣的是,Sora Turbo在谷歌测试的所有模型中居然是表现最差的,而表现最好的是可灵1.5。\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_3--\u003e\u003c/p\u003e\u003cp\u003e在指令遵循上,Voe表现也达到了SOTA,其他各个模型也和整体表现排名差异不大。\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e在报告中,谷歌承认了自己的模型也有短板。在复杂场景或复杂运动中保持完全的一致性仍然没法被突破。在他们自己给出的范例中,依然会出现凭空出现的人物。在运动中,人也可能依然出现那种不自然的“AI扭曲”。\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_4--\u003e\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e在推特上,已经有一些网友做了测试。表明Voe2的镜头控制和运动能力所言不虚。在提示词为“一个人坐在咖啡馆里喝咖啡的视频。过了一会儿,镜头切换到另一个视角,显示旁边桌的人正在给他们写信。”的情况下,Voe 2可以很好的完成导演叙事的镜头切换,写作的动作也非常自然。\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_5--\u003e\u003c/p\u003e\u003cp\u003e而将同一个提示词给到Sora ,它首先无法实现镜头切换,对于提示词中两个人对坐也未跟随,画面中只有一个人。手部写作动作也有点像是悬空画笔。\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_6--\u003e\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e之后我们还测试了其他的顶尖模型。比如海螺,它无法实现镜头切换,但用变焦实现了部分镜头切换的逻辑,空间和两个人物的关系也符合提示词。\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_7--\u003e\u003c/p\u003e\u003cp\u003e混元的影视氛围感直接拉满,也完成了切镜。但视频中两人的关系交代没有那么清晰。\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_8--\u003e\u003c/p\u003e\u003cp\u003e可灵确实是表现最好的一个,切镜、两人的关系都把握住了。除了审美和细节上不如Voe 2外,其它部分都近乎完美。\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_9--\u003e\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" class="paragraph text-align-type-left"\u003e\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" class="paragraph text-align-type-left"\u003e\u003c/p\u003e\u003cp\u003e在另一个测试中,用同样的提示词\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_10--\u003e\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e这是Voe 2的结果\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_11--\u003e\u003c/p\u003e\u003cp\u003e这是Sora的结果\u003c/p\u003e\u003cp data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_12--\u003e\u003c/p\u003e\u003cp\u003e就算Voe2的输出是有瑕疵的,但Sora这个迟缓、空荡的场景已经输太多了。\u003c/p\u003e\u003cp\u003e至于其他模型,可灵输出的场景感不错,但弄臣的现实非常刻意,从空间关系上看也不太可能,其中还有很多残影。\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_13--\u003e\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" class="paragraph text-align-type-left"\u003e\u003c/p\u003e\u003cp\u003e而海螺则是在提示词遵循上仅次于Voe2,只是没有满足“镜头从女王背后取景”这点。但细节还原就较Voe 2差不少了。\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" data-exeditor-arbitrary-box="image-box"\u003e\u003c!--IMG_14--\u003e\u003c/p\u003e\u003cp style="margin-bottom: 3pt; margin-left: 0pt; margin-top: 3pt; text-align: left" class="paragraph text-align-type-left"\u003e\u003c/p\u003e\u003cp\u003e看了这么半天,谷歌评测中说的Sora最差不无道理。\u003c/p\u003e\u003cp\u003e2025年还没开始,\u003c!--SECURE_LINK_BEGIN_1--\u003eOpenAI\u003c!--SECURE_LINK_END_1--\u003e的王冠看起来就有点不稳了。怪不得连微软CEO最近在采访中都豪言“没有OpenAI,我们也能开发出最一流的模型。”\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e看来,在这场AI战争中,还有的是逆转的好戏。\u003c/p\u003e\u003cp\u003e\u003c/p\u003e\u003cp\u003e不过谷歌这回还是没改画饼的毛病。Voe2 现在依然在内测阶段,只能在VideoFX上排队申请。希望它在25年全量和新产品发布的速度都能提起来。把画饼大师的定位让给OpenAI。毕竟Sora花了9个月才发出来,也和过去的谷歌不相上下了。\u003c!--NO_AD_4--\u003e\u003c!--EOP_4--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_4--\u003e\u003cdiv powered-by="qqnews_ex-editor"\u003e\u003c/div\u003e\u003cstyle\u003e.rich_media_content{--news-tabel-th-night-color: #444444;--news-font-day-color: #333;--news-font-night-color: #d9d9d9;--news-bottom-distance: 22px}.rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.rich_media_content{color:var(--news-font-day-color);font-size:18px}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]) .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}body:not([data-weui-theme=light]) .rich_media_content{color:var(--news-font-night-color)}}.data_color_scheme_dark .rich_media_content p:not([data-exeditor-arbitrary-box=image-box]){letter-spacing:.5px;line-height:30px;margin-bottom:var(--news-bottom-distance);word-wrap:break-word}.data_color_scheme_dark .rich_media_content{color:var(--news-font-night-color)}.data_color_scheme_dark .rich_media_content{font-size:18px}.rich_media_content p[data-exeditor-arbitrary-box=image-box]{margin-bottom:11px}.rich_media_content\u003ediv:not(.qnt-video),.rich_media_content\u003esection{margin-bottom:var(--news-bottom-distance)}.rich_media_content hr{margin-bottom:var(--news-bottom-distance)}.rich_media_content .link_list{margin:0;margin-top:20px;min-height:0!important}.rich_media_content blockquote{background:#f9f9f9;border-left:6px solid #ccc;margin:1.5em 10px;padding:.5em 10px}.rich_media_content blockquote p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content blockquote{background:#323232}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]) .rich_media_content blockquote{background:#323232}}.rich_media_content ol[data-ex-list]{--ol-start: 1;--ol-list-style-type: decimal;list-style-type:none;counter-reset:olCounter calc(var(--ol-start,1) - 1);position:relative}.rich_media_content ol[data-ex-list]\u003eli\u003e:first-child::before{content:counter(olCounter,var(--ol-list-style-type)) '. ';counter-increment:olCounter;font-variant-numeric:tabular-nums;display:inline-block}.rich_media_content ul[data-ex-list]{--ul-list-style-type: circle;list-style-type:none;position:relative}.rich_media_content ul[data-ex-list].nonUnicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.5)}.rich_media_content ul[data-ex-list].unicode-list-style-type\u003eli\u003e:first-child::before{content:var(--ul-list-style-type) ' ';font-variant-numeric:tabular-nums;display:inline-block;transform:scale(0.8)}.rich_media_content ol:not([data-ex-list]){padding-left:revert}.rich_media_content ul:not([data-ex-list]){padding-left:revert}.rich_media_content table{display:table;border-collapse:collapse;margin-bottom:var(--news-bottom-distance)}.rich_media_content table th,.rich_media_content table td{word-wrap:break-word;border:1px solid #ddd;white-space:nowrap;padding:2px 5px}.rich_media_content table th{font-weight:700;background-color:#f0f0f0;text-align:left}.rich_media_content table p{margin-bottom:0!important}.data_color_scheme_dark .rich_media_content table th{background:var(--news-tabel-th-night-color)}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]) .rich_media_content table th{background:var(--news-tabel-th-night-color)}}.rich_media_content .qqnews_image_desc,.rich_media_content p[type=om-image-desc]{line-height:20px!important;text-align:center!important;font-size:14px!important;color:#666!important}.rich_media_content div[data-exeditor-arbitrary-box=wrap]:not([data-exeditor-arbitrary-box-special-style]){max-width:100%}.rich_media_content .qqnews-content{--wmfont: 0;--wmcolor: transparent;font-size:var(--wmfont);color:var(--wmcolor);line-height:var(--wmfont)!important;margin-bottom:var(--wmfont)!important}.rich_media_content .qqnews_sign_emphasis{background:#f7f7f7}.rich_media_content .qqnews_sign_emphasis ol{word-wrap:break-word;border:none;color:#5c5c5c;line-height:28px;list-style:none;margin:14px 0 6px;padding:16px 15px 4px}.rich_media_content .qqnews_sign_emphasis p{margin-bottom:12px!important}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{padding-left:30px}.rich_media_content .qqnews_sign_emphasis ol\u003eli{list-style:none}.rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep:first-child::before{margin-left:-30px;content:counter(olCounter,decimal) ''!important;counter-increment:olCounter!important;font-variant-numeric:tabular-nums!important;background:#37f;border-radius:2px;color:#fff;font-size:15px;font-style:normal;text-align:center;line-height:18px;width:18px;height:18px;margin-right:12px;position:relative;top:-1px}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis{background:#262626}.data_color_scheme_dark .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}@media(prefers-color-scheme:dark){body:not([data-weui-theme=light]) .rich_media_content .qqnews_sign_emphasis{background:#262626}body:not([data-weui-theme=light]) .rich_media_content .qqnews_sign_emphasis ol\u003eli\u003ep{color:#a9a9a9}}.rich_media_content h1,.rich_media_content h2,.rich_media_content h3,.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{margin-bottom:var(--news-bottom-distance);font-weight:700}.rich_media_content h1{font-size:20px}.rich_media_content h2,.rich_media_content h3{font-size:19px}.rich_media_content h4,.rich_media_content h5,.rich_media_content h6{font-size:18px}.rich_media_content li:empty{display:none}.rich_media_content ul,.rich_media_content ol{margin-bottom:var(--news-bottom-distance)}.rich_media_content div\u003ep:only-child{margin-bottom:0!important}.rich_media_content .cms-cke-widget-title-wrap p{margin-bottom:0!important}\u003c/style\u003e\u003c/div\u003e

本文来自作者[骑一]投稿,不代表蔚蓝之海立场,如若转载,请注明出处:https://foryh.cn/wiki/33059.html

(485)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • 骑一
    骑一 2025年01月28日

    我是蔚蓝之海的签约作者“骑一”!

  • 骑一
    骑一 2025年01月28日

    希望本篇文章《谷歌发布视频模型Voe 2,性能第一,网友实测吊打Sora_腾讯新闻》能对你有所帮助!

  • 骑一
    骑一 2025年01月28日

    本站[蔚蓝之海]内容主要涵盖:生活百科,小常识等内容......

  • 骑一
    骑一 2025年01月28日

    本文概览:########################################## \u003cdiv class="rich_media_content"\u003e\u0...

    联系我们

    邮件:蔚蓝之海@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们