基于大模型的单轮文档问答


import os
os.environ['OPENAI_API_KEY']='sk-xxxxx'
# Load docs
from langchain.document_loaders import WebBaseLoader
loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
data = loader.load()
 
# Split
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size = 500, chunk_overlap = 0)
all_splits = text_splitter.split_documents(data)
 
# Store splits
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
if not os.path.exists('VectorStore'):
    vectorstore = Chroma.from_documents(documents=all_splits, embedding=OpenAIEmbeddings(),
                                        persist_directory="VectorStore")
    vectorstore.persist()
else:
    vectorstore = Chroma(persist_directory='VectorStore', embedding_function=OpenAIEmbeddings())
 
# RAG prompt
from langchain import hub
prompt = hub.pull("rlm/rag-prompt")
 
# LLM
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)
 
# RetrievalQA
qa_chain = RetrievalQA.from_chain_type(
    llm,
    retriever=vectorstore.as_retriever(),
    chain_type_kwargs={"prompt": prompt}
)
question = "What are the approaches to Task Decomposition?"
result = qa_chain({"query": question})
print(result["result"])

最终是使用如下prompt让大模型去做回答：

question：用户的问题

context: 基于语义匹配的最相似段落作为上下文

You are an assistant for question-answering tasks. Use the following pieces of retrieved context to answer the question. If you don't know the answer, just say that you don't know. Use three sentences maximum and keep the answer concise.\nQuestion: {question} \nContext: {context} \nAnswer:"

相关阅读:
索引优化与查询优化
梯度提升算法和 XGBoost 使用
QT商业播放器
python中怎样把一个文件夹中所有的*.ts文件都读进来形成一个视频文件？
MySQL之搭建主从复制
Map接口
java计算机毕业设计招聘信息系统源程序+mysql+系统+lw文档+远程调试
计算机毕业设计ssm+vue基本微信小程序的校园二手商城系统
非科班菜鸡算法学习记录 | 代码随想录算法训练营第56天|| 583. 两个字符串的删除操作 72. 编辑距离编辑距离总结篇
前端图片转成base64

原文地址：https://blog.csdn.net/u014403221/article/details/133622857