当前位置: 首页 > news >正文

友情链接网站免费为什么要做企业网站

友情链接网站免费,为什么要做企业网站,有没有教做帽子的网站,江苏国龙翔建设网站.1. 什么是 RAG#xff1f; RAG#xff08;Retrieval-Augmented Generation#xff0c;检索增强生成#xff09;是一种结合信息检索与文本生成的技术#xff0c;旨在提升大型语言模型#xff08;LLM#xff09;在特定领域或私有数据上的表现。其核心流程分为两部分…1. 什么是 RAG RAGRetrieval-Augmented Generation检索增强生成是一种结合信息检索与文本生成的技术旨在提升大型语言模型LLM在特定领域或私有数据上的表现。其核心流程分为两部分 Indexing索引将源数据如文档、网页内容加载、拆分并存储为向量数据库。Retrieval Generation检索与生成在运行时根据用户查询从数据库中检索相关片段并通过 LLM 生成答案。 RAG 的优势在于 动态更新知识无需重新训练模型即可利用最新数据。减少幻觉通过外部数据验证避免模型生成错误信息。适应特定场景适用于企业知识库、学术研究、客服系统等场景。 2. RAG 的典型架构 一个完整的 RAG 应用通常包含以下组件 数据加载与预处理 Document Loaders加载原始数据如 PDF、网页、文本文件。Text Splitters将长文档拆分为小块Chunks便于检索和模型处理。 向量存储与检索 VectorStore将文本块嵌入为向量并存储如 Chroma、FAISS。Retriever根据用户查询检索最相关的文档片段。 生成答案 Prompt Template将检索结果与用户问题结合构造输入提示。LLM生成最终答案。 3. 实现 RAG 应用的完整流程 以下通过代码示例逐步演示如何构建一个基于 RAG 的问答系统。 步骤 1环境准备 安装 LangChain 及相关依赖 pip install langchain langchain-text-splitters langchain-community langgraph langchain-chroma步骤 2加载并预处理数据 从网页加载内容并拆分文本 from langchain_community.document_loaders import WebBaseLoader from langchain_text_splitters import RecursiveCharacterTextSplitter# 加载网页内容 loader WebBaseLoader(web_paths(https://lilianweng.github.io/posts/2023-06-23-agent/,),bs_kwargsdict(parse_onlybs4.SoupStrainer(class_(post-content, post-title, post-header))) ) docs loader.load()# 拆分文本为小块 text_splitter RecursiveCharacterTextSplitter(chunk_size1000, chunk_overlap200) all_splits text_splitter.split_documents(docs)步骤 3构建向量数据库 使用 Chroma 存储文本块的向量表示 # 初始化嵌入模型需通义千问API-KEY from langchain_community.embeddings import DashScopeEmbeddings# 初始化嵌入模型 embed_model DashScopeEmbeddings(modeltext-embedding-v2,dashscope_api_keysk-712a634dbaa7444d838d20b25eb938xx )# 构建向量数据库 from langchain_chroma import Chromavector_store Chroma(collection_nameexample_collection,embedding_functionembed_model,persist_directory./chroma_langchain_db, # Where to save data locally, remove if not necessary )步骤 4定义检索与生成逻辑 使用 LangGraph 编排流程并通过 LLM 生成答案 from langchain.chat_models import init_chat_model from langchain_core.prompts import PromptTemplate from langgraph.graph import StateGraph, START from typing_extensions import TypedDict, List from langchain_openai import ChatOpenAI# 初始化 LLM以 OpenAI 为例 llm ChatOpenAI(modeldeepseek-chat,api_keysk-e3f022d1746f415c9b0f4bc9a52a43xx, # todo 替换deepseek API Key https://platform.deepseek.com/api_keystemperature0.7,max_tokens512,timeout30,max_retries3,base_urlhttps://api.deepseek.com )# 定义状态结构 class State(TypedDict):question: strcontext: List[Document]answer: str# 检索函数 def retrieve(state: State):retrieved_docs vector_store.similarity_search(state[question])return {context: retrieved_docs}# 生成函数 def generate(state: State):docs_content \n\n.join(doc.page_content for doc in state[context])prompt PromptTemplate.from_template(Question: {question}\nContext: {context}\nAnswer:)messages prompt.invoke({question: state[question], context: docs_content})response llm.invoke(messages)return {answer: response.content}# 构建流程图 graph_builder StateGraph(State) graph_builder.add_edge(START, retrieve) graph_builder.add_sequence([retrieve, generate]) graph graph_builder.compile()步骤 5测试 RAG 应用 运行流程并验证输出 response graph.invoke({question: What is Task Decomposition?}) print(response[answer])示例输出 4. 关键技术点解析 文本拆分策略 使用 RecursiveCharacterTextSplitter 按字符递归拆分确保上下文连贯性。调整 chunk_size 和 chunk_overlap 以平衡检索效果与模型输入限制。 向量数据库优化 选择适合的嵌入模型如 text-embedding-3-large提升检索精度。持久化存储数据如 ./chroma_langchain_db以便后续扩展。 Prompt 设计 通过模板将检索结果与用户问题结合引导 LLM 生成更准确的答案。可尝试不同的 Prompt 结构如 Chain-of-Thought优化生成效果。 5. 扩展与进阶方向 支持对话式交互在 Part 2 中将 RAG 扩展为支持多轮对话的系统。多阶段检索结合 map_reduce 或 refine 等链式结构处理复杂查询。性能优化通过缓存机制减少重复计算或使用本地部署模型降低 API 成本。监控与调试集成 LangSmith 追踪流程分析各环节性能瓶颈。 6. 应用场景与案例 企业知识库问答 场景员工快速检索公司政策、产品手册。实现将内部文档构建为向量数据库结合 RAG 提供实时答案。 学术研究辅助 场景研究人员快速获取论文关键结论。实现从论文数据库中检索相关段落生成摘要。 个性化推荐系统 场景根据用户历史行为推荐相关内容。实现检索用户相似行为记录生成个性化推荐理由。 7. 常见问题与解决方案 Q1如何处理大文件加载失败 A使用分页加载或分块处理如 TextSplitter避免内存溢出。 Q2检索结果不相关怎么办 A优化嵌入模型选择调整向量相似度阈值或引入多路召回策略。 Q3如何部署为生产环境服务 A使用 FastAPI 或 Streamlit 封装为 Web API并通过 Docker 容器化部署。 8. 总结 通过 LangChain 的 RAG 框架你可以高效构建一个结合外部知识的智能问答系统。从数据加载、向量存储到检索生成LangChain 提供了完整的工具链大幅降低了开发复杂度。无论你是企业开发者、研究人员还是 AI 爱好者RAG 都能帮助你释放 LLM 的潜力。 下一步建议尝试将 RAG 应用于你的实际项目例如为你的团队搭建一个基于内部文档的智能助手或者为网站添加实时客服问答功能。通过实践你会发现 RAG 在提升效率和准确性上的巨大价值。
http://www.hkea.cn/news/14497792/

相关文章:

  • 微信知彼网络网站建设网站通cms
  • 新乡建设工程信息网站小清新 wordpress
  • 濮阳网站建设电话百度推广做网站什么价位
  • 手机网站设计图尺寸wordpress 文章地址
  • 做金属小飞机的网站怎么在各个网站免费推广信息
  • 打开网站需要用户名密码谷歌浏览器下载手机版最新版
  • 杭州 高端网站定制安全教育平台登录入口
  • 淘宝网站做超链接网上开店创业
  • 红花岗区建设局网站廊坊网站建设方案策划
  • 怎么给企业做网站wordpress完整模板下载
  • 北京智能建站系统价格php apc缓存 wordpress
  • 网站设计预算WordPress女人网模板
  • 手机h5免费模板网站模板极客联盟网站建设公司怎么样
  • 大型网站流量中国建筑工程网施工组织设计
  • 湘潭做网站出色磐石网络app安装软件下载
  • 资讯网站怎么做招聘网页设计
  • 重庆高端品牌网站建设网站登录密码怎么取消保存
  • 个人房屋做民宿在哪个网站肇庆网站建设咨询
  • 禅城南庄网站制作深圳插画设计公司
  • 宣威市网站建设工艺品网站建设
  • 软文营销平台网络营销优化推广
  • 中国建设质量协会网站做网站的公司多少钱
  • 网站突然不被百度收录知名的网站设计公司
  • 企业自建网站 备案网站建设企业最新报价
  • 中国哪些网站做软装网站seo步骤
  • html5做网站的好处外贸是做什么的工作内容是什么
  • 中国三大门户网站是哪三个浦口建设局网站
  • 南京培训网站建设泰州做网站优化
  • 网站建设唯地带网站栏目划分的原则
  • 做简单网站的框架wordpress learnpress