Pika文生模型实现一键生成3秒视频

积加ERP

Pika是一款文字生成视频的AI模型,可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。在2023年11月,Pika开放端口在Discord进行测试,而目前在其官…

Pika是一款文字生成视频的AI模型,可输入文字、上传图片乃至录制视频后再通过AI进一步生成一个新的视频。在2023年11月,Pika开放端口在Discord进行测试,而目前在其官网https://pika.art 已全面开放注册使用。

目前Pika一键最多生成长度为3秒的24帧视频,即基础功能可生成72帧画面。这个量级的素材,也够做一个表情包。

Pika开放注册使用,网址:https://pika.art

目前Pika已经全面开放注册,并且在官方网站上开发了UI界面。

进入Pika的官网,目前支持Discord以及Google账号直接登陆,所有功能可通过官网的接口或Discord的指令免费使用,暂未推出增值收费服务。

Pika官网

2023年11月Pika已经在Discord开放测试,当时获得测试资格的用户可在Discord的Pika官方频道通过运行指令生成视频。

Pika在Discord的官方频道

Pika在Discord上可使指令生成视频,网页版的界面则进一步的简化了操作流程,所有功能都设计了可视化的UI。在输入框内输入你想描述的画面,就可一键输出视频。

文字生成视频
Pika目前可以识别多种动作、颜色和风格,对自然语义的识别表现不俗。

  • prompt:The dragon’s head exudes a majestic and fierce expression, with piercing eyes and flaring nostrils,anime style

生成日漫动画风格视频容错率比较高

在文字输入框的右下侧有三个按钮,从左数起第一个按钮是“Aspect ratio”和“Farmes per second”功能,即纵横比和帧数。

在文字生成视频的过程中,可通过这个功能调整视频的分辨率比例、帧数。可选择的分辨率包括16:9、9:16、1:1、5:2、4:5、4:3,最高可生成24帧的视频。

视频的纵横比和帧数

左数第二个按钮是“Camera control”功能,即模拟运镜。可在生成视频前,想象控制镜头运动和画面的运动强度,可以目的明确地控制整个视频的画面运镜效果。

模拟镜头运镜

最右侧的按钮是“Negative prompt”、“Seed”以及“Consistency with the text”功能。

支持通过输入负面词的方式,来更准确地控制提示词。还可以输入Pika内的视频编号来生成风格内容一致的视频,同时还可以调节画面与提示词的一致性,获取更多连贯内容的素材。

视频内容风格的一致性

图片生视频、视频生视频

在文字输入框的左下方,有一个“Image or video”按钮,点击可上传本地的图片或者视频。

Pika会根据上传的媒体或额外输入的prompt进一步生成视频。

上传本地媒体素材

视频二次编辑

在“My Library”标签页,可以查看自己所生成的视频和进行二次编辑。

点击开自己的视频,右下角的感叹号点看可见自己视频的基本信息,包括帧数、运镜的强度、针对输入文本的一致性以及这个视频的编号。

而视频的左下角提供了快捷功能,包括:

  • Retry(按此前的相同参数重新生成一次视频)
  • Repromote(修改视频的提示词及参数,重新再生成一个视频)

Pika网页版的视频二次生成功能

Pika统一生成的视频只有3秒,在首次生成视频以后如果对视频的基本效果满意,可以直接使用“Add 4s”功能增加4秒。

而“Edit”则包括了Modify region(局部修改)和Expand canvas(扩展画布)两个功能。

点击视频的“Edit”按钮,会直接激活并切换入编辑界面。在文本输入框的正下方显示“Modify region”和“Expand canvas”功能。

点击“Modify region”进入修改页面后,先框选要修改的区域,然后填写提示词,点击生成。

“Modify region”局部修改功能

局部修改后两个视频的差异对比

点击“Expand canvas”进入修改页面后,选择想扩大的比例范围,然后填写提示词,点击生成。

“Expand canvas”扩展画布功能

扩大画布后两个视频的差异对比

此外Pika,“Explore”标签页里也能观赏其他用户创作的视频。

激活视频的播放,在播放窗口提供了一些按钮功能,比如复制视频的完整提示词,分享到社交媒体,下载该视频等。

Explore上其它用户上传的视频

结论:Pika的功能还是个雏形

Pika目前基础生成的视频局限在3秒时长最大24帧的视频,即单一次生成最多72帧画面。

在试用“Add 4s”的功能时,Pika简单粗暴的来了4秒“略略略”的视频,突如其来的笑点。

恶龙略略略

目前Pika是1.0版本,从无到有,功能类别可以称作丰富。网页上使用已经没有了视频制作和输入指令的门槛。

比如新模型的不确定性和与之相对的实用性也未能很好地表现出来。而其生成的素材在二次剪辑的使用中也远远还未达到实用标准。甚至生成的视频“鬼畜”居多。

但相比其它视频剪辑类功能的工具,直接生成视频还未能很好地发挥生产力工具的特性。

为您推荐

联系我们

联系我们

0755-25700009

在线咨询: QQ交谈

邮箱: 917712811@qq.com

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部