当前位置: 首页 > news >正文

淮南查查网手机网站怎么做SEO优化

淮南查查网,手机网站怎么做SEO优化,广州外贸网站建设,延安网站设计公司文本上传构建向量库后台库的内容 调用上传文件接口先上传文件 存在疑问:暂时是把文件保存在tmp文件夹,定时清理,是否使用云存储 根据不同的文件类型选取不同的文件加载器加载文件内容 switch (file.mimetype) {case application/pdf:loader new PDFLoader(file.path)breakc…文本上传构建向量库后台库的内容 调用上传文件接口先上传文件 存在疑问:暂时是把文件保存在tmp文件夹,定时清理,是否使用云存储 根据不同的文件类型选取不同的文件加载器加载文件内容 switch (file.mimetype) {case application/pdf:loader new PDFLoader(file.path)breakcase text/plain:loader new TextLoader(file.path)breakcase application/msword:loader new DocxLoader(file.path)breakcase application/vnd.ms-excel:case application/vnd.openxmlformats-officedocument.spreadsheetml.sheet:loader new CSVLoader(file.path)breakcase application/json:loader new JSONLoader(file.path)breakcase text/html:default:loader new TextLoader(file.path)} 存在疑问:我们通过后缀名还是mimetype来区分加载器langchain使用的是后缀名 文本分割 顾名思义文本分割就是用来分割文本的。为什么需要分割文本Prompt 会存在字符限制 比如我们将一份300页的 pdf 发给 openai api让他进行总结他肯定会报超过最大 Token 错。所以这里就需要使用文本分割器去分割我们 loader 进来的 Document。 主要代码这里分块长度为1000每次携带上下文20 const textSplitter new RecursiveCharacterTextSplitter({chunkSize: 1000,chunkOverlap: 20,})文本向量化 我们和文件进行交流的时候不可能每次都把全量文本都当成prompt传给Gpt 所以需要进行文本向量化文本向量化后就可以进行文本相关性查询查出最符合的内容交与GPT进行相关性问答 建立一张上传文本表往数据库插入一条上传信息获取到id,用于向量查询的不同命名空间 表结构设计如下 const data await prisma.chatFiles.create({data: {originalname: file.originalname,mimetype: file.mimetype,path: file.path,filename: file.filename,encoding: file.encoding,userId,deviceId,},})向量文本内容持久化 console.log(创建向量数据库持久化)const store await PineconeStore.fromDocuments(docs,new OpenAIEmbeddings(),{pineconeIndex,// namespace: ${userId}_${file.filename.replace(.pdf, )},namespace: ${data.id},},)我们需要把向量化的文本持久化,便于下次进行聊天或者连续性问答通过后台文本表查询该次聊天向量文本内容这里暂时使用个人的云向量库 文本聊天的流程 1. 需要传入后台保存的文本表对应id,便于寻找相应向量数据库 const store await PineconeStore.fromExistingIndex(new OpenAIEmbeddings(), {pineconeIndex,namespace: storeId,})chatFiles(quest, functionName, res, callback, chatInfoId, store)2.chatfile 的核心代码 // 使用retriever进行向量相似查询找到相关数据const docs await this.retriever.getRelevantDocuments(question);const inputs { question, input_documents: docs };// 将数据交给gpt进行处理文本总结的核心流程 1. 需要传入后台保存的文本表对应id,便于寻找相应向量数据库 const store await PineconeStore.fromExistingIndex(new OpenAIEmbeddings(), {pineconeIndex,namespace: storeId,})// 获取前N个文档进行总结需要产品进行定义const docs await store.asRetriever(3).getRelevantDocuments()const chain loadSummarizationChain(new OpenAI({ temperature: 0 }))const response await chain.call({input_documents: docs.slice(0, 2),})总结类型使用refine链式总结把前面的chunk总结内容带入prompt 进行总结总结内容更精准 map_reduce 的话分段总结然后进行合并时间更快 需要设计一个删除文本相关的接口 const obj await prisma.chatFiles.findFirst({ where: { id: storeId } })if (obj) {const obj await prisma.chatFiles.delete({ where: { id: storeId } })obj obj.path fs.unlinkSync(obj.path)await pineconeClient.init({apiKey: process.env.PINECONE_API_KEY,environment: process.env.PINECONE_ENVIRONMENT,})const pineconeIndex pineconeClient.Index(01)await pineconeIndex.delete1({ deleteAll: true, namespace: storeId })}需要把临时上传文件后台文本表相应记录和向量数据相关的内容清除
http://www.hkea.cn/news/14446674/

相关文章:

  • 番禺外贸型网站建设桂林房产
  • 深圳 网站策划wordpress 生成水印
  • 常见的网站首页布局特价手机网站建设
  • 电脑装机网站明星百度指数在线查询
  • 科技公司网站建设策划方案海南省建设工程执业中心网站
  • 百度网站降级的原因wordpress 七牛 水印
  • 怎么学php网站开发大气婚庆网站源码
  • 东莞最便宜网站建设小门户网站模版
  • 网站建设费用 做个网站要多少钱手机网站怎么做淘宝客
  • 常用网站开发软件6企业网站建立意义何在
  • 苏州网站建设软件收费关于网站建设管理的通知
  • 网站建设的美图网店推广方法和技巧
  • seo点击排名软件哪家好网站建设和网络优化请示
  • ppt做的最好的网站四川平昌县建设局网站
  • 南宁网站制作定制如何用ftp登陆网站
  • 福州网站设计哪家好网站开发用盗版犯法
  • 成都网络推广网站奉贤网站建设推广
  • 专业建设标准搜易网优化的效果如何
  • 济南专业做网站公司哪家好南昌制作网站的公司吗
  • 纯静态网站开发如何在别人的网站模板上加兼容
  • 网站域名快速备案大连 找人做网站
  • asp.net网站开发教程 pdf做技能培训和那个网站合作好
  • 辽宁建设工程信息网官方网站大连白云小学网站建设
  • 上海民政网站相关建设情况网络 设计
  • 模板网站有哪几类电子商务网站平台建设目标
  • 常州企业网站建设价格网站开发与应用就业方向
  • 佛山网站建设seo优化如何恢复wordpress
  • 刷粉网站推广免费编程软件下载
  • 济南网站制作公司排名国外域名 网站备案
  • 工信部网站 备案时间成都自适应网站建设