码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • AI算法,又整新活!萌妹子来挑战~


    大家好,我是 Jack。

    好久没出趣味 AI 的教程了,今天安排一期。

    只需要一张图片或者视频,就可以生成相应的二次元“老婆”。

    感受一下:

    放个视频,感受更强烈:

    GANsNRoses展示

    二次元“老婆”,是跟随视频的动作,而改变的。

    之前我写过一阶运动模型的算法教程:

    让图片动起来,特朗普和蒙娜丽莎深情合唱

    功能看起来类似,但是算法实现是不同的。

    真人驱动动漫图片的算法,这种效果比较好:

    二次元的正确打开方式

    这个动画脸控制变换算法,采用的是 GAN,只需要一个输入即可,生成+控制,用这一个算法即可。

    GANsNRoses

    这个算法的名字叫 GANsNRoses,一种风格迁移算法。

    简单来讲,就是一种以人脸图像的内容代码为输入并输出具有多种随机选择风格代码的动漫形象。

    算法实现也并不复杂:

    生成器负责生成动画脸,辨别器负责辨别是否为动画脸。

    生成器分为内容编码器c和样式编码器s。

    样式编码器s,负责整体的风格,比如头发样式,脸的位置,发色等。

    内容编码器c,负责细节的把控,比如头部倾斜角度等。

    想了解更详细,可以直接看论文:

    https://arxiv.org/pdf/2106.06561.pdf

    测试

    目前有三种方式:

    • 网页 Demo

    • Colab

    • 本地搭建

    网页 Demo

    网页 Demo,用起来最简单,上传图片就行。

    https://gradio.app/g/AK391/GANsNRoses

    不过貌似只支持图片的制作。

    测试了龙母的效果,她看了估计会哭晕在厕所。

    Colab

    Colab 运行也很简单,有个梯子就行。

    https://colab.research.google.com/github/mchong6/GANsNRoses/blob/main/inference_colab.ipynb

    省去了部署环境的烦恼,傻瓜式运行即可,图片和视频,都可以测试。

    本地搭建

    主要是搭建环境,这个直接用 Conda 创建虚拟环境,然后安装各种第三方库即可:

    1. conda install --yes -c pytorch pytorch=1.7.1 torchvision cudatoolkit=<CUDA_VERSION>
    2. pip install tqdm gdown kornia scipy opencv-python dlib moviepy lpips aubio ninja

    Conda 使用可以参考这一篇:

    别再折腾开发环境了,一劳永逸的搭建方法

    然后下载模型权重文件,就可以,模型权重文件还是蛮大的,1.6G,从 Google Drive 下载比较慢,建议直接用 Colab 测试。

    总结

    这种算法,其实蛮多的,单从效果来讲,还有很大提升空间的。

    最后,我看B站有个up主,籽岷自己做了鬼畜,新宝岛版:

    GANsNRoses展示2

    目前,这类算法,做个鬼畜其实还行。


    最后再送大家一本,帮助我拿到 BAT 等一线大厂 offer 的数据结构刷题笔记,是一位 Google 大神写的,对于算法薄弱或者需要提高的同学都十分受用:

    谷歌和阿里大佬的Leetcode刷题笔记

    以及我整理的 BAT 算法工程师学习路线,书籍+视频,完整的学习路线和说明,对于想成为算法工程师的,绝对能有所帮助:

    我是如何成为算法工程师的,超详细的学习路线


    我是 Jack,我们下期见。

  • 相关阅读:
    【九章斩题录】Leetcode:判定是否互为字符重排(C/C++)
    Android四大组件之BroadcastReceiver(二)
    【Agent模型1】MemGPT: Towards LLMs as Operating Systems
    WSL2的安装与配置(创建Anaconda虚拟环境、更新软件包、安装PyTorch、VSCode)
    什么是Redis的数据分片?
    yarn 设置淘宝镜像配置
    点餐小程序实战教程01需求分析
    liunx jmter 环境配置
    后端统一处理返回前端日期LocalDateTime格式化去T,Long返回前端损失精度问题
    在anaconda Promat界面import torch通过,在jupyter notebook中报错的问题(仅提供思路理解!)
  • 原文地址:https://blog.csdn.net/c406495762/article/details/118197090
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号