文章主题:AI动画制作, Stable Diffusion, 视频拆分, 图生图
(我不想学习)
今天原本并不打算投入学习的状态,然而在参观电玩节之后,我深感惊讶。那里人潮涌动,熙熙攘攘的人群让我感受到了前所未有的热闹氛围。尽管如此,让我失望的是,许多游戏和玩具都显得乏味无比。更让我意外的是,我的妻子八重神子竟然看到了至少十位致力于Cosplay的爱好者。
看来以后这种动漫节啥的还得去上海参加,好多卖东西的展会都是在清库存的感觉,而且可能是因为暑假超级多学生去买。
我现在可能真的有些老去了,对于这些曾经热衷的事物已经不再那么感兴趣了。然而,这并非唯一的原因,很可能是因为我所钟爱的一些东西并不适合在公众场合展示,因为有很多未成年人也会来到这里玩耍。
今天就不说啥废话了,我心好累。
在学完Stable Diffusion之后,本文将为您呈现一篇关于AI动画制作的专业进阶篇。在这里,我们将以一种系统性的方式探讨如何运用先进的技术手段来创作出令人印象深刻的动画作品。
Stable Diffusion 的先前版本仅能生成冷漠的图像,这已经让我按捺不住,渴望让我的妻子们展现出更多的活力与生动。
AI动画是啥?
事实上,在当今互联网时代,关于AI动画的信息非常丰富,随意检索相关关键词就能找到许多视频资源。然而,我们需要深入理解的是,AI动画并非简单的视频剪辑处理,而是一种利用人工智能技术对视频片段进行特殊加工的手段,从而呈现出动画的质感。
除了常见的二次元动画风格以外,AI绘画还可以套一层滤镜一样给视频变化为不同的风格。
https://www.bilibili.com/video/BV1kT411W7Bq/?spm_id_from=autoNext&vd_source=24f33eddf5587fb40e947798abce6715
以另一种形式重新诠释经典作品,已成为人工智能动画的一种常见应用方式。事实上,许多商业广告也开始采用AI绘画技术,以实现一些实拍难以达到的效果,或为视频增添更多独特的风格。这种现象表明,AI在动画领域的应用越来越广泛,其创意和表现力正逐步提升,为我们的视觉体验带来了更多可能性。
目前在市面上有很多可以用于AI动画的软件,大多都可以实现将视频转变为各类画风的视频,但是目前最受欢迎且常用的还是Stable Diffusion。
作为一个免费、开源且功能强大的Stable Diffusion,除了一时半会无法在手机上使用以外,其能实现的效果要强过市面上绝大部分的软件。
不过要学会AI动画的制作最好还是要先学会Stable Diffusion的基本操作、模型原理和插件使用,这里可以先去看看我之前的那些笔记。
如果懒得全部看的话可以先重点看以下几篇文章简单了解下(按顺序):
现在是赛博COS的天下 (AI-Stable Diffusion篇-1)
少年,你要找的是这个二次元的Mikuya还是写实画风的哑巴新娘?(AI-Stable Diffusion篇-4:模型的使用技巧)
让人工智能离我理想中的女神越来越近(AI-Stable Diffusion篇-8:扩展插件)
摆出一样的姿势还不简单啊?(AI-Stable Diffusion篇-10:ControlNet)
其实只是简单会一点也可以做,但是有了扎实的基础后做出来的效果肯定是要更好的。
当然如果是啥也不会看到这篇文章也可以跟着我的步骤尝试一下,毕竟我写到这里也不会,能踩的坑我都会踩一脚、
AI动画的原理
在之前的笔记中都是用Stable Diffusion来生成图片,好像没有找到什么可以用来生成动画的插件或者功能。
但是对于AI来说,无论是动画还是绘画都是生成图像+对图像进行转绘。
动画的原理简单来说就是用一张张静止的图片放到一块连续播放而成,这也是早期的动画制作者都是用定格动画的形式完成。
鹈鹕动画作品-腾讯游戏“乱世王者”定格动画_鹈鹕动画-站酷ZCOOL
这里的每一张图片都是一帧(Frame),而像是打游戏常见的帧率也是由此而命名。
如今大部分的电影都是24帧每秒,这意味着一秒播放24张图片,像是电视、游戏、互联网等的帧率大多都是25/30帧每秒。
对于简单的眼睛感受来说,10帧每秒就会用动起来的感觉,只要大于24帧就能感觉看到的东西都很丝滑。
对于大部分游戏玩家来说30帧勉强能玩60帧体验丝滑也是这个道理,并且游戏掉帧(指帧数突然降低)卡成PPT也是这么来的。
帧数(Frames),为帧生成数量的简称。由于口语习惯,我们通常将帧数与帧率混淆。每一帧都是静止的图像,快速连续地显示帧便形成了运动的假象,因此高的帧率可以得到更流畅、更逼真的动画。
-From 百度百科
在Stable Diffusion中制作AI动画其本质就是把每秒的20-30张画面拆开,在单独重绘每一张画面后回去做成一个完整的视频。
其实一开始就有人尝试用SD制作AI动画,从最开始的图生图再到后面Mov2Mov的出现,而现在又出现了“多帧渲染”、Ebsynth这样的创新工具。
这些都会讲,不过会拆分开来好方便大伙学习自己想要的。
图生图批处理
今天就先讲一个最简单也是最基础的方法,将视频手动拆分成一帧一帧的后批量图生图重绘。
在图生图功能的选项部分有一个批量处理的标签,在这个标签里可以选择一个装有图片的文件夹,然后再设定一个输出图片的文件夹。
下方的两个选项还可以批量导入重绘蒙版和骨骼图,可以在掌握了重绘和ControlNet之后进行一些进阶操作。
如果有过视频剪辑经验例如PermirePro的话,应该会知道PermirePro可以导入一段视频后以JPG/PNG的格式将视频导出为一张张图片。
不过没接触过PR的同学也不用慌,有一位来自国内的大佬开发了一个WebUI扩展(我也会上传到网盘上):
作者演示视频来源:https://www.bilibili.com/video/BV1Fh411G7dw/?spm_id_from=333.337.search-card.all.click&vd_source=f18a24315a35799d8d1912ad50652d90
代码仓库地址:https://github.com/ClockZinc/sd-webui-IS-NET-pro
这个名为IS-NET Pro的扩展可以用于视屏帧拆分、蒙版识别生成(抠像)等,几乎是专精于AI动画的制作。
安装方式可以看我之前安装扩展的方法,或者直接用代码仓库地址下载最简单,在下载完成之后重启WebUI就可以看到有一个isnet_Pro的选项。
左侧的那一块区域就是可以将视频拆分为帧的功能,在上传完自己想要重置的视频后可以看一下该区域的参数
第一行启用输出帧率控制在不勾选的时候会按照视频的默认帧率输出图片,如果不知道视频的默认帧率多少可以鼠标右键点击视频文件-属性-详细信息:
这个视频是每秒30帧,也就意味着每秒播放30张图片,属于一个标准流畅的视频。
下面的启用时间段裁剪
则是用于控制视频中的某一段特定时间,如果上传的视频太长了可以用这个功能裁短。
视频输出地址就是完成视频后那里可以看到重制的视频,然后点击gen_frame(生成)后插件就会把视频拆散为一个个单独的帧。
这些被拆出来的图片就是一会要让AI重画的图片了
不过先别急,在正式制作动画之前需要先做一个小小的风格测试,也就是在被拆成一张一张的图片中挑选一张最具代表性的画面,将这个画面放进图生图后调试模型、提示词、参数生成一张想要的画面。
这里具体的选择什么的就看个人喜好了,但是有几点可以注意。
重绘尺寸最好和视频大小一致
重绘幅度最好0.5左右以免画面混乱
提示词不要给得太固定具体
因为其大批量的处理是针对每一帧的画面进行操作,提示词会用到每一帧的画面。
在这里关于提示词的使用原教程给出了一些建议(模版):
第一行提示词可以用画质标准化的词:(masterpiece:1,2), best quality, masterpiece, hires, original,
第二行提示词描述人物特征: 1girl, brown, long hair, blue dress,
第三行提示词描述背景:white background, simple background,
像是我选择的原视频背景比较简单所以简单形容,如果视频转场什么的幅度较大可以用Dynamic Pose这类提示词增强动态感.
在得到差不多符合自己预期的图片之后,固定随机种子!
然后进点击上方的批量生成,设置好输入和输入的文件夹之后点击生成。
接下来这段时间就可以去洗个澡或者是干点别的,保持电脑运行不要熄屏了什么,因为这个过程会稍微漫长,等待时间取决于设备条件。
在经历了漫长的等待之后(其实也不漫长,我在看宝可梦卡牌半个小时一下子就过去了)可以看到输出的文件夹中已经放好了AI重绘的图片。
生成图片之后还需要一步,那就是把重绘的图片重新拼合成视频,这一步还是可以让isnet_Pro来完成。
其实也就是Isnet_Pro右侧板块的功能:
输入地址就填写刚刚重绘后图片放置的地方,输出地址就找一个能找得到的位置即可。
要注意生成的帧率必须和原视频帧率一致,然后点击gene_video之后看到log info显示done就好啦!
可爱捏
因为我的成品效果不佳+视频太大了无法上传我就找一个大佬做的很棒的演示放在这里:
这个更像是局部重绘了脸部,让脸部偏向动漫效果,当然这个肯定比全部重新画一遍的工作量要小一些。
今天的内容就到这里结束啦!
这几天我优先将AI绘画部分给讲完,然后休息个两三天将我的内容都改一下搬到小红书上面。
毕竟之后想要B站、抖音、公众号、小红书全面发展一波,主要是想看看我一份内容能不能转化为四种平台风格。
我要去逛宝可梦卡牌了,大伙下篇笔记见,拜了个拜!
我的玛俐老婆嘿嘿嘿嘿
1girl, marnie (pokemon), solo, holding poke ball, poke ball, dress, holding, black jacket, jacket, pink dress, black hair, asymmetrical bangs, twintails, bangs, looking at viewer, hair ribbon, ribbon, poke ball (basic), choker, black choker, off shoulder, earrings, long sleeves, jewelry, black nails, looking back, long hair, asymmetrical hair, red ribbon, bare shoulders, strap slip, two-tone background, closed mouth, aqua eyes, from behind, green eyes, open clothes, cowboy shot
Negative prompt: Easy Negative, (worst quality:2), (low quality:2), (normal quality:2), lowers, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), (ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.5), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (more than 2 nipples:1.331), (missing arams:1.331), (extra legs: 1.331), (fused fingers:1.61051) ,(too many fingers:1.61051), (unclear eyes:1.331), lowers, bad hands, missing fingers, extra digit, (futa:1.1), bad hands, missing fingers, (((extra arms and legs))), extra hair, (2girl:2.0),
Steps: 30
Sampler: DPM++ SDE Karras
CFG scale: 7
Seed: 566421218
Size: 512×512
Model hash: e4a30e4607
Model: majicmixRealistic_v6
Denoising strength: 0.7
Hires upscale: 2
Hires upscaler: R-ESRGAN 4x+
Version: v1.3.2
本篇部分素材来源
原教程视频链接:
https://www.bilibili.com/video/BV1Su411b7Nm/?spm_id_from=333.999.top_right_bar_window_history.content.click&vd_source=f18a24315a35799d8d1912ad50652d90
百度网盘资源下载链接:
https://pan.baidu.com/s/10oQRssUMmi8zwAS8JcGpKA
提取码:ajp9
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!