就拿网友测试Gen-3和Sora对比的一个demo中,越野车在陡峭的山坡中快速行驶,轮胎尘土飞扬。
还有人表示,Gen-3让我们看到了一个令人兴奋的未来——用不了多久,我们就能看到完全由AI生成的电影了。
【新智元导读】Gen-3 Alpha终于开启测试了!第一时间拿到内测资格的网友们,纷纷放出各种炸裂的demo★■,看得出Gen-3在生成质量完全跃升。不过,模型有时无法理解物理世界的缺陷,依然存在。
还有Sora生成的这张经典的图像——打扮时髦的女人走在东京街道◆■■◆◆★,Gen-3也不输分毫。不过,在表现镜面效果这点上,Gen-3没有完全遵循指令■★★■。
作者表示,其实自己的提示中写错了(长着兔毛的女孩)■◆■★■,不过Gen-3很好地理解她的意图,画出了兔耳朵。
提示四★◆:一位时尚的女性走在东京的一条街道上,街道上到处是温暖的霓虹灯和生动的城市标志◆■★◆。她穿着黑色皮夹克◆■★◆★★、红色连衣裙和黑色靴子,手提一个黑色手提包★■。她戴着太阳镜,涂着红色口红。她走路自信而随意■★◆。街道潮湿且具有反光效果,形成了彩色灯光的镜面效果。街上有许多行人在走动。
提示六:一位年轻的专业产品评论员坐在一台有两个显示屏的电脑前,在一个光线充足的视频工作室里■★★★■◆,周围环绕着各种小工具和科技设备。他手持一台电影摄影机,正在思考下一个要制作的视频内容。他对准了焦距、 背景略微模糊,以达到电影效果。
Gen-3在人物的表现上,更加丰富◆★◆◆。Sora只是男子的头从一边转到另一边,也没有体现出对焦的这个动作。
Gen-3更加真实地体现了加州淘金热,人们沉浸在淘金的喜悦中,而且背景颜色凸显出的历史感更加浓厚◆■■■★■。
本文为澎湃号作者或机构在澎湃新闻上传并发布◆■■◆■★,仅代表该作者或机构观点◆◆◆■,不代表澎湃新闻的观点或立场◆★,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。
旋转这一点Gen-3倒是很好地体现★■◆,不过电视有点「穿模」的感觉■■◆◆。还有雪花屏幕,Gen-3漏掉了。
提示七■◆★★■:摄像机围绕着一大堆老式电视机旋转,这些电视机都在播放不同的节目◆★★★:1950年代的科幻电影、恐怖电影◆★、新闻、雪花屏◆★、1970年代的情景喜剧等◆★■■★,这一场景设置在纽约一个大型博物馆展厅内。
比起上一代,Gen-3 Alpha在细节、一致性和运动表现方面,又有了史诗级改进■■!
不仅如此,这几天比较火的另一个AI视频模型Dream Machine,硬是把体操运动员高空表演★■■◆★,拍成了恐怖片■■◆■。
就外星人形象来说,不得不说Sora更好一些◆■◆■★★,更能让人接受★■■◆,Gen-3生成的外星人就像一个恐怖片一样。
另一位网友用Gen-3做了一个科幻短片,名为《2030——欧罗巴任务》,还为其配上了音乐。
就生成效果来看,Gen-3未来科技感更强,Sora只是着重突出了沉船的外观■◆■■■★。
这种时刻,当然少不了LeCun的嘲讽,他激动地再次重述,「视频生成模型根本不理解基本的物理,更不用说人体了」■★◆■■◆。
不过,不可否认的是★■■,Gen-3 Alpha在理解物理世界上,还是有一定的差距。
提示二:24岁女子眨眼的超特写镜头,站在马拉喀什的魔幻时刻,电影胶片◆◆■◆,70mm拍摄,景深,色彩鲜艳,电影效果
除了开篇所给出的Gen-3不懂物理世界案例之外,网友也收集了一些其他的失败case。
在这个提示下■★◆★◆,Gen-3和Sora真实度各有千秋,Gen-3的瞳孔中貌似更能看出马拉喀什这座魔幻之城。
提示一◆◆:一名潜水员发现了一艘隐藏的来自未来的沉船,船上有生化海洋生物和先进的外星科技。
开放2天后,Gen-3 Alpha的实测demo已经铺屏全网◆◆◆■,接下来,让我们一睹为快■■。
「不过,真正理解物理的学习系统将不是生成式的。所有的鸟类和哺乳动物,比任何视频生成系统更了解物理学。然而■◆★,他们都无法生成详细的视频」。