码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 本地/笔记本/纯 cpu 部署、使用类 gpt 大模型


    文章目录

      • 1. 安装 web UI
        • 1.1. 下载代码库
        • 1.2. 创建 conda 环境
        • 1.3. 安装 pytorch
        • 1.4. 安装 pip 库
      • 2. 下载大模型
      • 3. 使用 web UI
        • 3.1. 运行 UI 界面
        • 3.2. 加载模型
        • 3.3. 进行对话

    使用 web UI + 大模型文件,即可在笔记本上部署、使用类 gpt 大模型。

    1. 安装 web UI

    1.1. 下载代码库

    https://github.com/oobabooga/text-generation-webui

    1.2. 创建 conda 环境

    conda create -n textgen python=3.11
    conda activate textgen
    
    • 1
    • 2

    1.3. 安装 pytorch

    文档:https://github.com/oobabooga/text-generation-webui#2-install-pytorch

    SystemGPUCommand
    Linux/WSLNVIDIApip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
    Linux/WSLCPU onlypip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu
    LinuxAMDpip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm5.6
    MacOS + MPSAnypip3 install torch torchvision torchaudio
    WindowsNVIDIApip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
    WindowsCPU onlypip3 install torch torchvision torchaudio

    1.4. 安装 pip 库

    文档:https://github.com/oobabooga/text-generation-webui#3-install-the-web-ui

    pip install -r <requirements file according to table below>
    
    • 1
    GPUCPUrequirements file to use
    NVIDIAhas AVX2requirements.txt
    NVIDIAno AVX2requirements_noavx2.txt
    AMDhas AVX2requirements_amd.txt
    AMDno AVX2requirements_amd_noavx2.txt
    CPU onlyhas AVX2requirements_cpu_only.txt
    CPU onlyno AVX2requirements_cpu_only_noavx2.txt
    AppleIntelrequirements_apple_intel.txt
    AppleApple Siliconrequirements_apple_silicon.txt

    2. 下载大模型

    TheBloke: https://huggingface.co/TheBloke

    TheBloke 是 hugging face 社区的一个用户, ta 提供了许多预量化大模型的下载。

    • 量化:将模型权重中的 float 替换为 int 等数据类型,损失一小部分精度,但减少内存占用、计算开销。

    在这里插入图片描述

    在该用户的 model 库中搜索需要的模型,常用关键词是 7b-gguf。

    • 其中 7b 代表模型的参数量 7 billion(常见参数量有 7b , 13b , 70b),参数量越大,模型精度越高,即对话质量越高。
    • gguf 是一个预量化大模型的格式,支持 cpu 、 gpu 共同加载模型,被广泛使用

    在这里插入图片描述

    在具体模型页面的 Provided files 部分可以看到该模型的不同量化版本、文件大小、预计内存占用、推荐与否。点击具体量化版本的模型即可下载。

    3. 使用 web UI

    3.1. 运行 UI 界面

    打开 conda 命令行窗口,运行以下命令,并保持窗口开启:

    conda activate textgen
    cd text-generation-webui
    python server.py
    
    • 1
    • 2
    • 3

    3.2. 加载模型

    在这里插入图片描述

    打开 127.0.0.1:7860 网页链接,model 页面,按上图进行模型加载即可(大概需要几十秒)。

    具体文档:https://github.com/oobabooga/text-generation-webui/wiki/04-‐-Model-Tab#llamacpp

    3.3. 进行对话

    在这里插入图片描述

    打开 chat 页面,即可进行对话。

    • 在对话框左侧菜单中有 “开始新对话” 等操作
    • 需注意,大部分模型默认语言为英文(可在模型页面查看详情)
    • 本地模型无法联网
  • 相关阅读:
    SpringBoot动态路由利器--router4j
    为什么说FTP越来越不好用了?该如何替代?
    Java中使用 MD5 工具进行对密码进行加密
    计算机网络:408考研|湖科大教书匠|原理参考模型I|学习笔记
    Tomcat部署在Eclipse
    2022年7月国产数据库大事记-墨天轮
    echarts+node+ajax实现时间天气服务器
    算法组件部署方案归纳
    手机自动化测试:5.模拟相关操作:swipe,scroll,drag_and_dropki
    如何使用GitHub托管代码(简易版)
  • 原文地址:https://blog.csdn.net/weixin_43667077/article/details/134528696
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号