具体案例
如前所述,RAG 配置选择可能对消除幻觉产生重大影响。下文中将基于城市百科文章构建问答 RAG 应用并展示不同的配置选择是如何影响应用性能的。在搭建过程中,我们使用 LlamaIndex 作为该应用的框架。大家可以在 Google Colab( https://colab.research.google.com/github/truera/trulens/blob/main/trulens_eval/examples/expositional/vector-dbs/milvus/milvus_evals_build_better_rags.ipynb) 中所有代码。

从百科加载数据
首先需要加载数据。这里,我们使用 LlamaIndex 中的数据加载器直接从百科加载数据。
- from llama_index import WikipediaReader
-
-
- cities = [
- "Los Angeles", "Houston", "Honolulu", "Tucson", "Mexico City",
- "Cincinatti", "Chicago"
- ]
-
-
- wiki_docs = []
- for city in cities:
- try:
- doc = WikipediaReader().load_data(pages=[city])
- wiki_docs.extend(doc)
- except Exception as e:
- print(f"Err