当前位置: 首页 > news >正文

网站 大气wordpress文章开始加内容

网站 大气,wordpress文章开始加内容,深圳福田网站建设,wordpress 个性博客课件链接#xff1a;https://cloud.189.cn/t/VNvmyimY7Vna#xff08;访问码#xff1a;e4cb#xff09;天翼云盘是中国电信推出的云存储服务#xff0c;为用户提供跨平台的文件存储、备份、同步及分享服务#xff0c;是国内领先的免费网盘#xff0c;安全、可靠、稳定、…课件链接https://cloud.189.cn/t/VNvmyimY7Vna访问码e4cb天翼云盘是中国电信推出的云存储服务为用户提供跨平台的文件存储、备份、同步及分享服务是国内领先的免费网盘安全、可靠、稳定、快速。天翼云盘为用户守护数据资产。https://cloud.189.cn/t/VNvmyimY7Vna%EF%BC%88%E8%AE%BF%E9%97%AE%E7%A0%81%EF%BC%9Ae4cb%EF%BC%89 原始数据来源于本课程的课件 RAG.pdf 文件需要Python解析pdf文件主要使用智谱清言的 embedding-3 将文本转向量化存储到 ChromaDB向量数据库中将向量查询的结果投喂给DeepSeek的deepseek-chat模型由它根据向量查询结果来回答用户提问。 .env文件 OPENAI_API_KEYsk-a6******9d OPENAI_BASE_URLhttps://api.deepseek.com/v1 OPENAI_MODELdeepseek-chat ZHIPU_BASE_URLhttps://open.bigmodel.cn/api/paas/v4/ ZHIPU_API_KEY4923c4dae*******lTGEx7 EMBEDDING_MODELembedding-3 启动向量数据库 chroma run --host 127.0.0.1 --port 5333 --path db_data 初始化 from openai import OpenAI from dotenv import load_dotenv import os import chromadb from chromadb.config import Settingsload_dotenv()# 将 api_key 传入到 openAI 当中 client OpenAI() ai_model os.getenv(OPENAI_MODEL) embed_model os.getenv(EMBEDDING_MODEL)from pdfminer.high_level import extract_pages from pdfminer.layout import LTTextContainerdef get_completion(prompt, modelai_model):封装 openai 接口messages [{role: user, content: prompt}]response client.chat.completions.create(modelmodel,messagesmessages,temperature0,)return response.choices[0].message.contentdef build_prompt(prompt_template, **kwargs):将 Prompt 模板赋值prompt prompt_templatefor k, v in kwargs.items():if isinstance(v, str):val velif isinstance(v, list) and all(isinstance(elem, str) for elem in v):val \n.join(v)else:val str(v)prompt prompt.replace(f__{k.upper()}__, val)return prompt 提示词 prompt_template 你是一个问答机器人。 你的任务是根据下述给定的已知信息回答用户问题。 确保你的回复完全依据下述已知信息。不要编造答案。 如果下述已知信息不足以回答用户的问题请直接回复我无法回答您的问题。 已知信息: __INFO__ 用户问 __QUERY__ 请用中文回答用户问题。解析pdf文件 def extract_text_from_pdf(filename, page_numbersNone, min_line_length1):从 PDF 文件中按指定页码提取文字paragraphs []ids []id_counter 0buffer full_text # 提取全部文本for i, page_layout in enumerate(extract_pages(filename)):# 如果指定了页码范围跳过范围外的页if page_numbers is not None and i not in page_numbers:continuefor element in page_layout:if isinstance(element, LTTextContainer):full_text element.get_text() \n# 按空行分隔将文本重新组织成段落lines full_text.split(\n)for text in lines:if len(text) min_line_length:buffer ( text) if not text.endswith(-) else text.strip(-)elif buffer:paragraphs.append(buffer)ids.append(fid{id_counter})buffer id_counter 1if buffer:paragraphs.append(buffer)ids.append(fid{id_counter})results {documents: paragraphs, ids: ids}return resultsparagraphs extract_text_from_pdf(RAG.pdf, page_numbers[4, 5],min_line_length10) 文本转向量函数 def get_embeddings(texts, modelembed_model):embedClient OpenAI(api_keyos.getenv(ZHIPU_API_KEY),base_urlos.getenv(ZHIPU_BASE_URL))data embedClient.embeddings.create(inputtexts, modelmodel).datareturn [x.embedding for x in data] 向量数据库连接器 class MyVectorDBConnector:def __init__(self, collection_name, embedding_fn):chroma_client chromadb.HttpClient(host127.0.0.1,port5333,)self.embedding_fn embedding_fnself.collection chroma_client.get_or_create_collection(namecollection_name)self.documents []def add_documents(self, contents):self.collection.add(embeddingsself.embedding_fn(contents.get(documents)),documentscontents.get(documents),idscontents.get(ids),)def search(self, query, top_n):results self.collection.query(query_embeddingsself.embedding_fn([query]),n_resultstop_n)return results# 创建一个向量数据库对象 vector_db MyVectorDBConnector(demo, get_embeddings) # 向向量数据库中添加文档 vector_db.add_documents(paragraphs) RAG机器人 class RAG_Bot:def __init__(self, vector_db, llm_api, n_results2):self.vector_db vector_dbself.llm_api llm_apiself.n_results n_resultsdef chat(self, user_query):# 1. 检索search_results self.vector_db.search(user_query, self.n_results)# 2. 构建 Promptprompt build_prompt(prompt_template, infosearch_results[documents][0], queryuser_query)# 3. 调用 LLMresponse self.llm_api(prompt)return response# 创建一个 RAG 机器人 bot RAG_Bot(vector_db,llm_apiget_completion ) 最后提问 # 用户查询 user_query 常用的向量数据库有哪些 response bot.chat(user_query) print(response) 运行效果
http://www.hkea.cn/news/14315057/

相关文章:

  • 响应式网站做seo南昌自助建站
  • 罗湖做网站成都古怪科技网站建设公司
  • 网站建设拿什么框架宠物网站设计与制作
  • 怎么做北京赛车网站郑州市新闻最新消息
  • html如果制作一个内容多的网站wordpress 鼠标翻页
  • 自营购物网站建设深圳网站建设案
  • 个人网站不能放广告怎么赚钱网站报404错误怎么解决办法
  • wordpress怎么做链接长沙网站seo按天计费
  • asp框架商城网站模板俄文网站建设方案
  • wordpress 模版安装个人如何优化网站有哪些方法
  • 环评怎么在网站做公示住房和城乡建设部建设司网站首页
  • dw做网站常用标签本墨陈黑做网站有版权
  • dns是不是做网站用的wp网站模板安装
  • 网站平台多少钱营销策划公司 采纳策划
  • 公司的网站建设与维护论文黄浦区未成年人思想道德建设网站
  • 上海网站建设优化价格设计导航网站 左侧菜单栏
  • 简单的网页制作模板关键词优化排名价格
  • 网页制作和网站建设的区别网站建设相关文章
  • 可视化建站工具evora wordpress
  • 如何做网站设计网站建设公司电话咨询
  • 昆山建设局网站表格下企业公示信息查询系统黑龙江
  • 外包网站问些什么问题wordpress 大气主题
  • 专门做团购的网站湖南有实力的关键词优化
  • 网络营销案例文章网站的优化分析
  • 建企业网站怎么收费wordpress是怎么添加登录的
  • 那些公司做网站适合注册公司的名字大全
  • 广州建设水务局网站自助构建网站
  • 宁波医院网站建设潍坊最早做网站的公司
  • 网站管理运营it运维前景怎么样
  • 宁波网站建设服务公司电话网站流量所需的成本.