码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【AI】Interesting Applications


    在这里插入图片描述

    文章目录

    • 【LLM】
    • 【盘古】
    • 【3D AI 生成】
    • 【多模态——指哪打哪】
    • 【AlphaDev:汇编版 AlphaZero】
    • 【ChatExcel】
    • 【分割一切视频版】

    【LLM】

    • ChatGPT——OpenAI

    • DALL-E——OpenAI

    • Sora——OpenAI

    • Gen-2——Runway(视频生成 4k)

    • Grok——Twitter(可修改回答,继续交流)

    • HeyGen——诗云科技(让视频中的人物说出任何语言)

    • LLaMA——Meta

    • magnific AI

      AI 锐化,丰富细节,加入光影,使AI生成的图像更真实
      在这里插入图片描述

    • Midjourney——Midjourney

    • Moonvalley——Moonvalley.ai(视频生成)
      在这里插入图片描述

    • vivo 蓝心,AI 大模型助手

    • Generative Fill:比如将 PS中的 Generative Fill 和 AR 结合,了解一下~属于是一键加特技了。
      在这里插入图片描述

    • Pika-Pika labs AI自动对口型

    • HoloTile——迪士尼,魔法地板

    补充:

    视频生成技术发展史

    2017 《video generation from text》

    1)早期 GAN,细节容易失真,输出结果不稳定
    2)后来 Diffusion, 《video diffusion models》模拟物理学的扩散,生成图像的过程更容易控制和优化
    3)Make-A-Video 解决数据不足问题,Tune-A-Video,训练文本生成图片的模型,然后用视频 fine-tune 以获得文本生成视频的能力
    4)Runway

    【盘古】

    2023年7月,华为正式发布盘古大模型3.0,并提出3层模型架构。

    • L0:基础大模型,包括自然语言、视觉、多模态、预测、科学计算;

    • L1:N个行业大模型,比如政务、金融、制造、矿山、气象等;

    • L2:更细化场景的模型,提供“开箱即用”的模型服务

    在这里插入图片描述

    【3D AI 生成】

    3D AI生成出新玩法了:无需数小时,只要45秒,单张图片即可生成 3D模型

    在这里插入图片描述

    Project Page: http://one-2-3-45.com

    Paper: https://arxiv.org/pdf/2306.16928.pdf

    Code: https://github.com/One-2-3-45/One-2-3-45

    Demo:https://huggingface.co/spaces/One-2-3-45/One-2-3-45

    在这里插入图片描述
    在这里插入图片描述

    【多模态——指哪打哪】

    仅靠“口才”就能解决视觉任务!商汤提出Shikra:新一代多模态大模型

    《Shikra: Unleashing Multimodal LLM’s Referential Dialogue Magic》

    https://arxiv.org/pdf/2306.15195.pdf

    https://github.com/shikras/shikra

    基于 CLIP 做的
    在这里插入图片描述

    在这里插入图片描述
    会拼图
    在这里插入图片描述

    会分辨谁是镜子中的人
    在这里插入图片描述
    在这里插入图片描述
    点作为输入也可以

    在这里插入图片描述
    在这里插入图片描述
    Reffering Expression Generation
    在这里插入图片描述
    Referring Expression Compression
    在这里插入图片描述

    在这里插入图片描述

    【AlphaDev:汇编版 AlphaZero】

    谷歌DeepMind打破十年算法封印,AlphaDev惊世登场,颠覆人类算法格局!

    Alpha」家族再添新成员AlphaDev!谷歌大脑DeepMind合体后首发力作,全新AI系统将排序算法提速70%,C++排序库十年来首次更改。AI创造AI的时代要来了?

    在这里插入图片描述
    谷歌 DeepMind 的研究者相信,在这个较低的层级中存在许多可改进的空间,而这些改进在更高级的编程语言中可能很难发现。

    在这里插入图片描述

    AlphaDev:汇编版 AlphaZero

    在这里插入图片描述

    【ChatExcel】

    老罗落泪!北大团队搞出ChatExcel,说人话自动处理表格,免费且不限次使用

    在这里插入图片描述

    【分割一切视频版】

    在这里插入图片描述

    《Tracking Anything with Decoupled Video Segmentation》(ICCV 2023)

    ICCV 2023开源 | 最新跟踪一切!分割一切视频版来了!

    一种解耦的视频分割方法DEVA,用于"跟踪一切"。它使用双向时序传播,有效地将图像分割方法扩展到视频数据中。DEVA最大的创新在于对训练数据的需求非常低,而且可以使用现成的图像分割模型直接扩展到其他视频分割任务上,非常的通用。

  • 相关阅读:
    Vue3配置router路由步骤
    处理json异常问题,由于发送kafka消息是一个字符串,等到消费时json字符串会有多个““引号,故需要先处理json再转对象
    python基础知识
    Mujoco仿真【将urdf文件转化为xml文件】
    对话永洪科技CEO何春涛:专注BI,决胜AI时代丨数据猿专访
    TNS-12531: TNS: 无法分配内存
    lock4j--分布式锁中间件--使用/实例
    璀璨共鉴·抖跃前程——东北珠宝抖音电商“溢彩计划”全面启幕
    react使用Map方法遍历列表不显示的问题
    关于程序员的真相,你知道几个?
  • 原文地址:https://blog.csdn.net/bryant_meng/article/details/133781445
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号