Sora模型厉害在哪里?

积加ERP

首先Sora模型是一个文生视频产品,也就是说,你说一句话,AI就会根据你的描述,生成一段视频。无论多天马行空的想法,AI 都可以给你表达出来。 其次,在去年很多顶级人工智能峰会上,…

首先Sora模型是一个文生视频产品,也就是说,你说一句话,AI就会根据你的描述,生成一段视频。无论多天马行空的想法,AI 都可以给你表达出来。

其次,在去年很多顶级人工智能峰会上,国内外不少专家和专业人士都预测,2024年是AI视频的爆发之年。那么你肯定要问了,如果大家都看好今年AI视频会爆发,那为什么面对OpenAI的新产品,大家还这么震惊呢?

那是因为OpenAI现在呈现出来的一大批视频,质量非常高,远远超出了之前所有的AI视频产品。在这之前,全球最火的两家AI视频公司是Runway和Pika,单单是Runway的上一轮融资,就拿了1亿多美金。但是这两家公司的创始人在对外预测2024年的时候,都说有一个核心目标是希望能生成15秒的流畅视频。因为2023年大部分文字生成的AI视频长度都在4-6秒,所以他们都把能生成15秒视频作为一个里程碑。

而这次,Sora直接可以生成60秒的视频,这意味着什么?如果你是篮球迷的话,肯定记得NBA史上最经典的大逆转,麦迪35秒拿下了13分。那60秒可以发生多少事情呢?我们假设Runway,Pika,OpenAI 都是小学二年级同班同学,当Runway和Pika正在努力尝试把一个句子写成300字的记叙文时,坐在角落的一个不起眼的小男孩OpenAI,走上来提前交卷,并且交了一篇1500字的高质量议论文……

曾经被学霸暴击过的我们,现在能体会到为什么行业哀嚎一片了吧?

至于视频质量,我就不用我贫瘠的文字来描述了。我在文稿里放了一个链接,汇总了一些Sora生成的视频,你可以去看一下视频质量有多高。你可以重点关注两个视频,一个是一个时尚美女走在东京的街头,不但完美呈现了指令里的穿着,例如“黑色皮夹克,红色长裙,黑色皮靴,黑色提包”,并且镜头从远景到中景到脸部特写,整个视频时长59秒,非常流畅。另一个视频是在咖啡杯里,两艘海盗船在作战。要知道现实社会是不可能有一大批在咖啡里的海战视频供AI训练的。所以人工智能既要模拟两艘17世纪的海盗船进行海战,又要理解如何在咖啡中掀起惊涛骇浪的物理准则。

说完Sora有多牛之后,作为AI学习圈的同学们,咱们要做的永远不是站在马路边为别人叫好,而是要问自己一个问题:“我该怎么办?”

有人说这个模型的发布对整个AI视频行业是一次暴击。但我不这么认为,因为AI视频公司,全世界也没有太多。而这次的Sora模型,我所看到的,反而是这么几个行业会产生颠覆级的变化,影响不会比AI设计软件Midjourney造成设计师大批失业小。

第一个是传统影视行业。今天我找到年前给AI学习圈同学作过分享的陈坤导演,问他怎么看OpenAI新产品Sora对影视行业的影响。做了20年影视导演的他,跟我说的第一句话是“要变天了”。第二句话是“我直到今天才庆幸自己是个导演”。

第二句话让我很好奇。然后他给我展开讲了讲,因为现在的影视行业,分工极其精细,很多工种和里面的从业者都是阶段式配合,只有导演是需要从前期跟到后期的,然后去不停协调各个工种,从舞美、化妆、道具到灯光、摄像、摄影,从演员、编剧、剧务到动画特效,可以说一个环节掉链子,整个戏就可能功亏一篑。而如果AI视频按照现在的发展速度,至少很多简单的镜头、群演、灯光布景等,都可以用AI去完成了。

我又追问他,AI视频对传统影视流程中最利好的工种是什么,他说是导演和后期。因为这两个工种,脑子里的目标一直是全局最后的作品,而不仅仅是一场戏里的灯光或者布景。如果有清晰的目标,就可以完美借助AI的力量,知道哪些镜头需要人类演员完成,哪些镜头直接用AI生成就好了。这样的话,别人一部电影可能需要拍一年、花费几千万,而现在借助AI的能力,制作一部电影的时间和资金,都能变成以前的十分之一。

在我看来,还会有一个趋势,那就是拍一部影视作品的门槛会急剧降低。今年爆火的《年会不能停》的主演大鹏,很多年前和我是搜狐的同事,他很有想法,一直有一个电影导演梦。他花了差不多20年的时间,终于拍出了一部获得认可的电影。如果AI视频技术进一步发展,那么脑海里有一个好故事的年轻人,完全有可能低成本创作出一部好电影。我说的是创作出,而不仅仅是“拍出”。

第二个是广告行业。因为以现在AI视频的发展,很多我们看到的广告片,确实可以直接被颠覆掉。这其中最首当其冲的就是汽车广告。大部分的汽车广告,都是一辆车在路上行驶的画面,不同之处就是有些车行驶在崇山峻岭,有些车行驶在沙漠里,有些车在爬坡,有些车在过河。但是这种一分钟左右的视频,传统广告公司报价基本在百万级别,从一大波人开去深山,从跟车摄像到无人机,所以那个拍摄费用虽然看起来高,但主要是花在了辛苦费上,而不是创意上。

而这次OpenAI更新的示例中,有一个视频就是一辆老式SUV行驶在盘山公路上, 土路扬起的灰尘在温暖的阳光下清晰可见,路两边的丘陵上种满了红杉树。单单这一个片段,如果用传统的拍摄方式,不知道要耗费多少钱,更主要的是,我看到的不少汽车广告,还不如这个AI视频的细节好。

当然,不仅仅是汽车广告,还有美食广告、很多高档酒店的介绍、旅游景点的推荐视频,这种并不需要复杂情节的广告作品,都会受到剧烈冲击。

我说的冲击可不仅仅是说进入门槛变低,导致竞争激烈。我曾经听过一个得到用户的案例,就是他竞标一个汽车广告,传统广告大公司的报价是80-100万,而他报价30万,拿出来的水平也跟大公司不相上下,所以他拿下了这个标的。那么同样的情况,如果我报价三千呢?对于现在的广告公司来说,就不仅仅是降本增效、压缩成本的问题了,而意味着从组织模式到商业模式,都会得到重构。

第三个是短视频行业。无论是国内的抖音、快手、B站、小红书,还是国外的TikTok,现在全球在短视频上的内容消费量都非常高。Sora现在能生成60秒的视频,那么就意味着这项技术只要成熟了,短视频的产量会迎来一次大爆发。不管你是要做一只蚊子从地球飞到火星,还是做出潜水艇在人类血管里航行的科幻画面,都仅仅需要一句指令而已。AI会对现在的短视频行业带来一场风暴,如果从业者缺少创意或者没有特色, 将很难应对这股浪潮。

第四个是大学教育。虽然大学教育不算一个行业,但它涉及的范围更广、影响更深。举个例子,仅仅是“影视摄影与制作”这个专业,在全国就有87所高校开设。而开设“多媒体设计”“数字媒体艺术”“动画设计”等相似专业的就更多了。而有可能这里面的很多师弟师妹,学了四年的3D人物设计,等他们毕业的时候,未必比一个会指挥AI的小学生作品更好。

我自己身上就发生过这样的事情,我大学有一门课叫做《黑白电视机原理与维修》,学了一年,拿了99分。但是等出了学校才发现,你身边根本没有一台黑白电视机让你维修。

前面说了这几个大行业或者领域会面临颠覆,我们这个栏目关注的永远是你我这样的个体,就是在这个变局下,我们自己该怎么办?我从自己的视角出发给几条不成熟的建议。

1.拥抱变化,让自己成为身边最懂AI的人。

拥抱变化,在我看来,这不是一句鸡汤,而是面对变革浪潮来临时的态度。我经常举纽约灯夫的例子,就是恐慌的灯夫永远也无法阻挡电的普及。所以第一批的灯夫,其实都果断的转行,有的去卖灯具,有的去做变电站,有的去做各种电器,后来才有了微波炉、洗衣机、电视机。从电的出现到纽约市最后两个灯夫下岗,中间持续了差不多30年。

作为个体,我们去寻找AI里的机会,别盯着现在AI的不足去吐槽。比如,你挑出现在AI视频里再多的风险、再多的毛病,都不如你试着借助AI用你家宠物的照片生成一个短视频。哪怕漏洞百出,你也能在不停地改变指令的过程中,变成一个能用好AI的人。

我给大家建议一个小的填空题,就是树立个小目标,句式是这样的:“我要努力成为公司里或者班上或者家里或者朋友圈里最会用AI做什么的人”。比如,我们可以这么说:“我要努力成为朋友圈里最会用AI做旅游游记视频的人”。也许等你做到第20个旅游视频的时候,你就成为AI时代的旅游视频博主了。

2.想象自己是一家一人公司的创始人。

一人公司,顾名思义,就是一个人。你不一定自己真创业,但是你可以想象自己注册了一家公司,这公司只有你一个人。那么你的这个公司可以从事什么领域的业务,就是你要去研究的方向。

别把这个想象得太难或者太高大上,你只要观察自己的工作和生活中,有哪些地方存在痛点或者是自己擅长的,那么就肯定存在机会。如果你工作中经常要用PPT做报告,那么你就可以设想自己注册了一家PPT制作公司,只不过从文案到策划到PPT设计只有你一个人而已。当你把自己做一个PPT的流程按照公司的逻辑拆开之后,你就知道该如何使用AI了。比如让ChatGPT或者文心一言写大纲,让Midjourney画背景图,让PowerPoint直接从大纲生成幻灯片。

当你成为身边最会做PPT的人,这个标签就能给你带来收益。我当年进入一家公司,被人打上的标签是“他能帮你的安卓手机刷机”。而我后来之所以跟罗胖、脱不花一起创业十年,估计跟我第一次去他们创业的小屋,不但画了微信网店的页面设计,还顺手修了饮水机和一台电脑有关。我想我的标签就是“解决问题”。

3.保持好奇心,放大兴趣,关注你的长板,无视你的短板。

我们以前的高中老师经常说“要保证长板的长,但短板也要补上,不能偏科”,这与其说是解决方案,不如说是美好的愿望。短板之所以短,难道是因为我们不想吗?而是不能啊。

AI普及之后,它并不能帮你提升已经达到80分的能力,但是它可以帮你做那些你并不擅长的事情。例如我有画面感和想象力,却毫无画画的能力,我就可以在AI的帮助下一起创作出很好看的画面。

一样的AI工具,你会发现不同人使用出来的威力是截然不同的,这比拼的是人和AI结合的能力。我们往后推演,按照 Sora这种发展,也许今年就可以实现一个功能,就是用指令直接复现电影里的经典镜头。

比如,我就可以写一句“用黑客帝国的子弹时间风格,让罗胖像里面的尼奥一样下腰躲过子弹”。这里面考验的是什么?是要看过黑客帝国这部电影。

印度有位著名导演叫塔西姆·辛,作品非常有创意,拍广告开价也很高。有一回,客户吐槽他说,你就拍一个30秒的广告,要收好几百万美元,说得过去吗?

塔西姆·辛是怎么回答的?他说,你花钱买到的不只是我做导演的这段时间,还有我喝过的每一口酒,品过的每一杯咖啡,吃过的每一餐美食,读过的每一本书,坐过的每一把椅子,谈过的每一次恋爱,去过的每一个地方。你买的是我全部生命的精华转化成的30秒,怎么会不贵?

所以,无论你刷过几百部电影,还是刷过几百部动画剧集,放在以前就是不务正业,放在现在就可能成为你的爆发点,兴趣是最好的学习驱动力。

今天写得比较长,不过在最后还是要补一句,Sora虽然很厉害,但整个人工智能对更多行业的改造还在非常初级的阶段,焦虑的情绪毫无用处,我们一起把AI用起来。

如果你身边恰好有这几个行业的从业者或者是学生,欢迎转发给他们,一起聊聊面对如此强大的AI产品,会对我们的工作生活有什么变化。

为您推荐

联系我们

联系我们

0755-25700009

在线咨询: QQ交谈

邮箱: 917712811@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部