码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【开发心得】三步本地化部署llama3大模型


    目录

    第一步:启动ollama

    第二步:启动dify

    第三步:配置模型(截图)


    最近llama3很火,本文追击热点,做一个本地化部署的尝试,结果还成功了!

    当然也是站在别人的肩膀上,文章最后有具体的参考文章,由于他们都是单独讲各自的部署,这里进行了整合。也就是说,如果你想本地化部署llama3大模型,本文是一套完整的部署方案。

    第一步:启动ollama

    ollama是可以本地部署的模型,其他模型,大多需要key才能进行连接。并不能做到本地化部署,而ollama作为轻量级,可本地化部署的模型,就是我们当下最好的选择了。

    安装ollama很简单,只要你安装了docker,一条命令就可以了。

    1. docker pull ollama/ollama
    2. docker run -d -v  $PWD/ollama:/root/.ollama -p 11434:11434 \--name ollama ollama/ollama 
    3. docker exec -it ollama /bin/bash
    4. ollama run llama3

    安装成功并且run以后,就可以看到下面的提示符,说明模型已经部署成功了! 

    需要注意的是:

    如果已启动过,需要删除原有的容器,当你再次重启以后,这个容器是不会自动运行的,需要手动,如下代码。当然也可以采用docker compose的方式,这里就偷懒了。

    1. docker restart ollama
    2. docker exec -it ollama /bin/bash
    3. ollama run llama3

    还有一种方法就是把容器删除,重新启动,浪费时间就不推荐了。

    docker rm 容器名称

    第二步:启动dify

    第一步完成以后,后面就是安装dify框架了,dify的介绍和功能,在下面的参考文章中都有,有兴趣可以去看看,这里就不多说了,直接上代码。

    1. git clone https://github.com/langgenius/dify.git
    2. cd /dify/docker
    3. docker-compose up -d

    当dify安装成功以后,首先要进行管理员配置,傻瓜式操作。

    需要注意的是,当你添加新用户的时候,是采用邀请的方式,并不能直接设定用户的密码,这一点与其他平台有点儿不同。 

    第三步:配置模型(截图)

    最后一步是在dify里配置ollama模型,如下图: 

    如果能够保存成功,就大功告成了!

    需要注意的是,本文采用的是纯CPU模式,如果要上生产,还是要用到GPU的,否则生成回答的时候,会很慢很卡。

     

    参考文章:

    58k+star!ollama快速部署llama3大模型 - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI

    内网穿透的应用-如何使用Docker本地部署Dify LLM结合内网穿透实现公网访问本地开发平台_difydocker部署-CSDN博客

    接入 Ollama 部署的本地模型 | 中文 | Dify

  • 相关阅读:
    前端面试题:1.B/S架构和C/S架构;2定义vue-router的动态路由
    Go 常用标准库之 fmt 介绍与基本使用
    项目:TCP在线云词典
    数学建模笔记-第五讲-相关系数
    11月第1周榜单丨飞瓜数据B站UP主排行榜(哔哩哔哩)发布!
    竞赛 深度学习疲劳检测 驾驶行为检测 - python opencv cnn
    超越所有人的成就,牛顿的光芒也无法掩盖的天才数学巨人
    DelayQueue的源码分析
    华为 HUAWEI 数通路由交换设备 基线安全加固操作
    sql-lib 搭建&31-40关
  • 原文地址:https://blog.csdn.net/hehuii/article/details/139325722
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号