当前位置: 首页 > news >正文

网站做端口映射wordpress 注册地址

网站做端口映射,wordpress 注册地址,怎么备案网站空间,新建站点的步骤节前#xff0c;我们组织了一场算法岗技术面试讨论会#xff0c;邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。 针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。 总结链接…节前我们组织了一场算法岗技术面试讨论会邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。 针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。 总结链接如下《大模型面试宝典》(2024版) 正式发布 今天我们来看看2个问题一个是回顾下主流 RAG 框架TOP10及一个有趣的soda RAG小工具另一个为防止恶意检索污染攻击的RAG方案RobustRAG思路供大家参考。 会有一些思路供大家一起参考。 问题1主流RAG框架TOP10及一个有趣的soda RAG小工具 最近 RAG 的轮子越来越多我们先后已经出现了多个RAG框架例如langchain, llamaindex,langraphqanything, ragflow等 例如通过github可以找到如下排序top10框架 Rank1、LangChain(86k stars):https://github.com/langchain-ai/langchain/当之无愧的霸主范围很全面但代码‍‍‍‍‍‍‍‍‍‍‍ Rank2、Quivr(33.4k stars):https://github.com/StanGirard/quivr Rank3、LlamaIndex(32.1k stars):https://github.com/run-llama/llama_index/ Rank4、Dify(31.2k stars):https://github.com/langgenius/dify Rank5、Langchain-Chatchat(28.5k stars):https://github.com/chatchat-space/Langchain-Chatchat Rank6、QAnything(9.7k stars):https://github.com/netease-youdao/QAnything特点是加入rerank后期更新也加入了文档理解‍‍‍‍‍‍‍ Rank7、danswer(9.5k stars):https://github.com/danswer-ai/danswer Rank8、RAGFlow(8.3k stars):https://github.com/infiniflow/ragflow特点是前期处理文档理解‍‍‍‍‍‍ Rank9、langchain4j(3.5k stars):https://github.com/langchain4j/langchain4j Rank10、Verba(4.3k stars):https://github.com/weaviate/Verba 最近有个新的框架SODA: Search, Organize, Discovery Anything(https://github.com/Liuziyu77/Soda/)有点儿意思根据其介绍。其支持网络检索、文本检索(本地数据库)、图像检索(本地数据库)。 其中在文本检索阶段采用两阶段检索过程第一阶段从数据库中检索信息第二阶段对检索到的文本进行重新排序其实标准的重排。 例如文本检索其通过构建本地文本数据库并从中检索信息通过修改上传的文件的路径其中文件包括TXT, DOCX, PDF等文件格式。 又如图像检索结果构建本地图像数据库并从中检索图像其中核心在于图像embedding的生成该项目中使用使用CLIP-B/32作为图像编码器。 又如网络检索结果其核心在于利用各种搜索引擎的API来根据用户输入检索相关信息包括google、Serper、Bing等不同的API 问题2为防止恶意检索污染攻击的RAG方案RobustRAG思路 这个有点意思《Certifiably Robust RAG against Retrieval Corruption》(https://arxiv.org/abs/2405.15556)其出发点在于由于依赖外部知识库的检索结果RAG模型容易受到Retrieval Corruption Attacks也就是恶意的检索污染攻击攻击方可以通过在检索结果中注入虚假或误导性的文本操纵模型的输出产生错误甚至有害的内容从而影响RAG模型的可靠性和实用性并带来难以预料的负面影响。 如下所示检索到的三个段落中有一个被破坏Vanilla RAG将所有段落串联起来作为LLM输入其响应被恶意段落劫持。 不同的是RobustRAG会隔离每个段落这样三个隔离回复中只有一个被破坏。然后RobustRAG会安全地汇总非结构化文本回复以获得稳健的输出。 因此其思想很简单就是先隔离后聚合(Isolate-then-Aggregate)策略。具体而言该框架包含以下两个关键步骤 一个是隔离回复对于检索到的每一段文本先独立地获取LLM的回复而不是将所有文本拼接在一起作为输入以限制恶意文本对其他回复的影响。 一个是安全聚合设计基于关键词和解码的方案如下两个代码逻辑以安全的方式聚合这些独立的回复生成最终的输出以实现即使存在少量恶意回复也能从正常回复中提取关键信息得出可靠的结果。 其中关键词聚合方案思路如下 1、提取关键词对每个独立的LLM回复进行关键词提取。使用启发式规则例如保留名词、形容词、数字等信息量大的词形成关键词集合 2、聚合关键词统计不同回复中关键词的出现频率。出现频率高的关键词更有可能携带正确和相关的信息。过滤掉出现频率低于阈值的关键词 3、生成最终回复使用筛选后的高频关键词再次提示LLM生成最终的回复。关键词集合以一定的顺序(如字母序)排列作为额外的上下文信息输入到LLM中。 解码聚合算法的思路如下 1、独立解码对每个检索到的文本RobustRAG独立地进行解码操作。在每个解码步骤得到LLM预测下一个词的概率分布向量 2、聚合概率向量将不同文本解码得到的概率向量进行聚合具体使用元素级平均得到一个新的概率分布 3、生成回复根据聚合的概率分布预测下一个词。重复这一过程直到生成完整的回复文本。在预测置信度较低时适当参考无检索结果时LLM的预测以保证回复的流畅性。 总结 本文主要讲了2个问题一个是回顾下主流RAG框架TOP10及一个有趣的soda RAG小工具另一个为防止恶意检索污染攻击的RAG方案RobustRAG思路。 其中关于主流框架方面当前有很多但不需要哪个都做还是需要选一个就行。另外RobustRAG在真实场景下用不太到但单纯从思想上来看是很有趣的。 技术交流群 前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~ 我们建了算法岗技术与面试交流群 想要大模型技术交流、了解最新面试动态的、需要源码资料、提升技术的同学可以直接加微信号mlc2040。加的时候备注一下研究方向 学校/公司CSDN即可。然后就可以拉你进群了。 方式①、微信搜索公众号机器学习社区后台回复交流 方式②、添加微信号mlc2040备注交流 面试精选 一文搞懂 Transformer 一文搞懂 Attention注意力机制 一文搞懂 Self-Attention 和 Multi-Head Attention 一文搞懂 BERT基于Transformer的双向编码器 一文搞懂 GPTGenerative Pre-trained Transformer 一文搞懂 Embedding嵌入 一文搞懂 Encoder-Decoder编码器-解码器 一文搞懂大模型的 Prompt Engineering提示工程 一文搞懂 Fine-tuning大模型微调 一文搞懂 LangChain 一文搞懂 LangChain 的 Retrieval 模块 一文搞懂 LangChain 的智能体 Agents 模块 一文搞懂 LangChain 的链 Chains 模块 参考文献 1、https://arxiv.org/abs/2405.15556 2、https://github.com/Liuziyu77/Soda/
http://www.hkea.cn/news/14368511/

相关文章:

  • 二手网站哪些做的比较好中文网站建设中模板
  • 局强化网站建设和管理如何推广自己的网站
  • 武进网站建设哪家好青岛知名设计公司
  • 淄博网站建设app开发图库下载网站源码
  • 专业的英文网站建设全媒体运营师报名费多少钱
  • 防静电产品东莞网站建设技术支持贪玩游戏官网
  • 校友网站建设怎么注册网店
  • 小说阅读网站开发视频263企业邮箱是哪个公司
  • 网站做动态还是静态太仓网站制作哪家好
  • 做生鲜的网站手机网站制作公司选哪家
  • 有了域名怎么制作网站旅游o2o平台有哪些
  • 云网站建设 优帮云免费网站空间
  • 公司建网站多少钱一年手机英语网站
  • 开发一个网站多少钱啊红色的网站
  • 建设企业展示网站模板网站开发
  • 深圳网站优化平台做网站的网站赚钱吗
  • 莲湖免费做网站好单库如何做网站
  • 个人域名怎么做社交网站软文文案范文
  • 分类信息网站 建议 建设学设计的网站都有哪些
  • 安全网站建设优化步骤
  • 分析海尔网站的建设特点和优势宣传片拍摄事件
  • 建设网站需要的人才百度浏览器
  • 大连网站开发公司shepiguo代理游戏网站
  • 网站建设h5 招聘搜狗网
  • 外贸多语言网站it运维主要做什么
  • 如何做网站不被坑辽宁建设工程信息网app
  • 保定网站制作企业给公司做网站需要多少钱
  • 宝应县建设工程管理局网站绍兴市交通建设有限公司网站
  • 仿站能被百度收录吗网站YYQQ建设
  • 沈阳网站建设培训班帮别人起名 做ppt的网站