Huggingface transformers 里的模型加载的两种方式的写法

Huggingface transformers 里的模型加载的两种方式的写法：

在线方式：


from transformers import AutoModel, AutoTokenizer
import gradio as gr
import mdtex2html
from utils import load_model_on_gpus
 
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).cuda()

离线方式：


from transformers import AutoModel, AutoTokenizer
import gradio as gr
import mdtex2html
from utils import load_model_on_gpus
 
tokenizer = AutoTokenizer.from_pretrained(
    r"E:\\chat-glm\\huggingface_hub_cache\\models--THUDM--chatglm2-6b\\snapshots\\7fabe56db91e085c9c027f56f1c654d137bdba40\\",
    trust_remote_code=True)
model = AutoModel.from_pretrained(
    r"E:\\chat-glm\\huggingface_hub_cache\\models--THUDM--chatglm2-6b\\snapshots\\7fabe56db91e085c9c027f56f1c654d137bdba40\\",
    trust_remote_code=True).cuda()

相关阅读:
Mycat2分库分表
【两周学会FPGA】从0到1学习紫光同创FPGA开发|盘古PGL22G开发板学习之数码管动态显示（五）
第二章：最新版零基础学习 PYTHON 教程（第五节 - Python 输入/输出–如何在Python中打印而不换行？）
别再用String了，教你更优的使用方法Redis存储
【Django | 开发】面试招聘信息网站（用户登录注册&投在线递简历）
刷新单年发射纪录：SpaceX成功发射62次猎鹰9号火箭
VAN LKA、LSKA
【大数据分析】图的连通度（门格尔定理）
下载和安装vscode教程和配置中文插件（超详细）
计算机毕业设计之java+javaweb的学生信息管理系统

原文地址：https://blog.csdn.net/wtl1992/article/details/133785320