230908-MetaGPT构建专属AI Agent的技术实践-视频笔记 - 码农知识堂

230908-MetaGPT构建专属AI Agent的技术实践-视频笔记
1. LangChain >>> 概念过载
2. MetaGPT：通过AI，完成GPT的自举
3. 原编程应该是一个函数，而不是人去做
4. 3月到5月：目前业界所有开源工程及对应论文60+，写了54篇对应笔记
5. LangChain >>> 9万6000行代码，655个内核，2826个函数，总笔记1万1000字
6. 很多开源项目只是最求概念的完整，而非实用性；MetaGPT希望具体的事情做出来
7. 智能体协议Agent Protocol：Agent之间的交互方式。
8. 当前市场尚未有大一统的Agent Protocal，今年下半年可能会有一个版本，Agent技术加速
9. 问：MetaGPT的规模化、产品化，到底还需要多久？答：需要一个工业化的过程。
  · MetaGPT：1903年莱特兄弟，造出了第一价飞机，能飞十几秒 >>> 飞行理论得到验证。
  · 战斗机、运输机等的发展需要后面一步一步的工业化。
  · 木头飞机什么时候能变成铁皮飞机并能载人>>>18个月>>>500行代码>>>10万行代码，完成项目级的代码自动化
10. MetaGPT参考了很多框架，清楚哪些部分是必须的，哪些部分是非必需的。
11. 目前MetaGPT出于一个初级阶段。
12. 角色1：原编程智能体框架；角色2：纯粹的多智能体框架
13. 智能体商城即将上线：MetaGPT等Agents
14. 既定的200多个任务中有80+已经挂在Roadmap上
15. 实践中有很多不确定性，例如如何做测试：不同的语言模型，其提示词可能完全不同
16. 在输入相同的情况下，稳定输出很难；
17. 提示词的撰写类似SOP，高效的SOP可用于不同的智能体
18. 人类世界，一些头部公司，可能花上百亿美元去购买SOP，用于其信息化系统及重点项目上
19. 开发SOP的过程等同于写代码
20. 软件公司有三个Profolio：代码+SOP+团队，SOP的本质是对团队编程
21. 工具链：训练、微调、推理、部署、减枝、蒸馏、量化等所有技巧：智能体本身是很敏感的
22. Auto-GPT：460美元打水漂>>>缺少SOP和专用模型来解决特定问题
23. 如何解决开发和更多角色互动的一个问题：自动化、智能体环境
24. 当前的开发调试十分困难，例如提示词的调试
25. 大语言模型扮演人类大脑的慢思考；快思考是人类直觉；不同感觉器官需要对应的感觉模块；上述谢谢感官，大语言并没有直接建模；
26. 多模态的建模实际中没有想象中的那么好；哪一种模型能完成完整的智能，需要打一个问号。语言可能是大脑中最重要的，但它并不是唯一的。出了它之外，还有十几个专业的模块。
27. 大脑出了情感外，大部分对于智能体而言，都是必要的。
28. 短期记忆（把今天发生的事都记录下来）+长期记忆（向量检索>>>人的记忆是分层的，并非所有记忆都是等效的：向量检索、图像检索、树状检索等，是否都用？哪种更好？）
29. 视觉大语言模型需要平衡：效果与成本。图像Token消耗巨大；每条600fps推理。
30. 谷歌智能体不能超过5个，强化学习超过5个就没法仿真。在特定的环境下解决特定的问题，实际很难收敛。
31. 强化学习：在一个房间烧水，然后预测体温，100分只得2分。强化学习不能很好理解世界语言。
32. 原来的强化学习从零开始理解世界。现在的Agent在RL中利用世界知识。
33. 问：AGI的L4如何定义？如何达到？答：10w行代码 >>> API交互 >>> Agent实现 Linux 10W代码 >>> 类似人类水平
34. ChatGPT-4 vs 国产框架：Llama2可以跑，但有问题；国产LLM可以跑，单有问题，需要花一定时间，一定工作，来解决相关问题。开源的水位不断变高，大家的水平会逐渐向GPT4看齐。
35. Gpt-3.5 turobo和Gpt-4未来可能会开源。
36. Agent需要成为业务智能体，而非软件Agent。两者如何协同。组织形态：一个群体？一堆100群体？10亿级群体？不同Agent的交易方式，决定了它的业务逻辑。
37. HR是智能体、财务是智能体、业务非智能体。业务需求是很复杂的。例如300页。未来需要将大的需求进行拆解，或通过结构化的方式进行任务分解。不同Agent公司提供的Agent的能力是完全不同。未来会有智能体的交易、定价等。让Agent具备领域专家的机械能力。
38. 人类沟通理解的过程是十分昂贵的，更何况是智能体。将Agent与软件工程进行组合。
39. SOP回顾：两百多年前，亚当斯密提出了人类分工。分工的两个好处：职业路径-训练微调的过程；有SOP，在流水线上讲生产节拍的（不能少、且足够标准）。SOP是人类世界的最高级别的规划。SOP和规划是两码事。
40. SAM Outman需要通过合成数据，顶一些数据。现实世界的数据，基本上已经全部用完了，只能达到现在这个效果。现在来看，ChatGpt4能够提升的上限并不会特别高。大部分提升的点是在策略上，而非模型上。如何提升：SOP、思考策略。
41. 5步工作法：1.让需求不那么蠢；2.减去无用的流程或部分；3. 简化和优化 4. 加快迭代； 5.进化。有些SOP在Agent上效果特别好。有效SOP适应度没有那么高。
42. 好的SOP和灵活度其实是相悖的。
43. 硅谷2000亿美元的投资。MetaAI的应对方式：开源。
44. MetaAI的价值：开源+闭源合作。提供AI落地的所有工作。服务国内的世界500强。
45. MetaGPT做销售、客服服务，整体代码量少，局部修改即可用。
46. MetaGPT+代码大模型 >>> 提高代码开发的效率
47. 先做出实际效果，能够落地，再抓人一起发论文，类似Google。MetaGPT对社区进行招募，集中写论文。MetaGPT在国际上有影响力。已有几十个不同媒体和大V对该工作进行报告。开发者拥有更高认可度。10行有效代码即可。
48. 社区里面每个人都能够参加到AGI的工作之中。
MetaGPT 构建专属 AI Agent 的技术实践——2023全球机器学习技术大会嘉宾访谈
相关阅读:
单目视频估计人体姿态+形状【注意力机制--连续性+相关性】含6数据集及补充材料
 Hibernate多表的关联关系、懒加载
 网络体系结构
 mysq 主从同步错误之 Error_code 1032 handler error HA_ERR_KEY_NOT_FOUND
Codeforces Round #804 (Div. 2)
要不是家里穷，我也不想当码农
 【GIT】常用操作总结
 2021 CCPC桂林G E D【二分、区间贪心、有向最小环】
详解：生产线平衡改善的四大方法与八大步骤！
论Oracle兼容性，我们需要做什么
原文地址：https://blog.csdn.net/qq_33039859/article/details/132758283