当前位置: 首页 > news >正文

有做微推客的网站吗网站首页动画代码

有做微推客的网站吗,网站首页动画代码,兰州企业 网站建设,泗县口碑营销互联网营销推荐咨询一、什么是生成式AI#xff1f; 以ChatGPT为代表的生成式AI#xff0c;是对已有的数据和知识进行向量化的归纳#xff0c;总结出数据的联合概率。从而在生成内容时#xff0c;根据用户需求#xff0c;结合关联字词的概率#xff0c;生成新的内容。 可以这么联想#x…一、什么是生成式AI 以ChatGPT为代表的生成式AI是对已有的数据和知识进行向量化的归纳总结出数据的联合概率。从而在生成内容时根据用户需求结合关联字词的概率生成新的内容。 可以这么联想ChatGPT就是一个词语接龙的机器他会根据你给出的关键词自动生成关键词的下一个最有可能衔接的词语。比如你说“世界上最高的山”ChatGPT就会回答“喜马拉雅山”。 二、怎么得到一个大模型 大模型需要算力、数据/存力、算法这三大要素。 算力即需要GPU、NPU这些硬件进行训练。 数据/存力生成式AI需要处理和存储大量的数据。以GPT-3为例光是训练参数就达到了1750亿个训练数据达到45TB每天会产生45亿字内容。 算法生成式AI的主要算法是深度学习。从仿生学的角度人类希望AI能够模仿人脑的运行机制对知识进行思考推理——这就是通常所说的深度学习。 三、算法 为了实现深度学习学者们提出了大量的神经网络架构 先看三个经典的 深度神经网络DNN是最普遍的神经网络架构但是随着数据对于网路架构的要求越来越复杂这种方法逐渐有些吃力。卷积神经网络CNN是一种专门为处理图像数据而设计的神经网络架构能够有效地处理图像数据但是需要对输入数据进行复杂的预处理。循环神经网络RNN架构成为处理序列数据的常用方法。 1Transformer架构 由于RNN在处理长序列时容易遇到梯度消失和模型退化问题著名的Transformer算法被提出。 Transformer架构是目前文本生成领域的主流架构GPT、llama等LLM大语言模型都是基于Transformer实现了卓越的性能。 Transformer架构主要由输入部分输入输出嵌入与位置编码、多层编码器、多层解码器以及输出部分输出线性层与Softmax四大部分组成。 1输入部分 源文本嵌入层将源文本中的词汇数字表示转换为向量表示捕捉词汇间的关系。 位置编码器为输入序列的每个位置生成位置向量以便模型能够理解序列中的位置信息。 目标文本嵌入层在解码器中使用将目标文本中的词汇数字表示转换为向量表示。 2编码器部分 由N个编码器层堆叠而成。 每个编码器层由两个子层连接结构组成第一个子层是一个多头自注意力子层第二个子层是一个前馈全连接子层。每个子层后都接有一个规范化层和一个残差连接。 3解码器部分 由N个解码器层堆叠而成。 每个解码器层由三个子层连接结构组成第一个子层是一个带掩码的多头自注意力子层第二个子层是一个多头注意力子层编码器到解码器第三个子层是一个前馈全连接子层。每个子层后都接有一个规范化层和一个残差连接。 4输出部分 线性层将解码器输出的向量转换为最终的输出维度。 Softmax层将线性层的输出转换为概率分布以便进行最终的预测。 2训练 目前有两种训练方式预训练和SFT有监督微调 预训练是指将一个大型、通用的数据集作为知识喂给AI进行初步学习。经过预训练的模型叫作“基础模型”它对每个领域都有所了解但是无法成为某个领域的专家。SFT有监督微调SFT是指在预训练之后将一个特定任务的数据集喂给AI进一步训练模型。例如在已经预训练的语言模型基础上用专门的医学文本来微调模型使其更擅长处理医学相关的问答或文本生成任务。 四、Transformer里的编码解码到底是什么 语义的最小单位是TOKEN可以翻译成“词元”它是语言类模型中用数字来表示单词的最小语义单位。 比如下图中这句话“This is a input text.” 首先被 Tokenizer 转化成最小词元其中[CLS][SEP]为一句话的起始与结束符号CLSclassification 告知系统这是句子级别的分类的开始、SEPseparator 告知系统结束本句或分割下一句然后再通过 Embedding 的方式转化为向量。 比如猴子和香蕉这两个语义关系紧密。原子能和香蕉差距就比较远。 Transformer中编码器和解码器中的“码”指的是什么 以下是ChatGPT-4o-mini给出的答案 编码器中的“码” 输入表示编码器接收输入序列如文本并将其转换成一个高维的向量表示。这些向量捕捉了输入序列中单词之间的关系和上下文信息。特征提取编码器通过多层自注意力机制和前馈神经网络提取特征使得每个输入的表示包含了其在上下文中的重要性。 解码器中的“码” 生成输出解码器使用编码器生成的表示以及之前生成的单词逐步生成目标序列如翻译后的文本。这里的“码”指的是解码器对已生成内容的处理和对未来内容的预测。上下文结合解码器同样使用自注意力机制来考虑已生成的单词与当前生成位置的关系。 总结来说“码”在这里代表了对输入和输出数据的数学表示方式帮助模型理解和生成语言。 总的来说编码器负责理解和处理输入而解码器则负责生成输出二者协同工作以实现有效的序列转换。 参考 https://baijiahao.baidu.com/s?id1801561545647449293wfrspiderforpc
http://www.hkea.cn/news/14391909/

相关文章:

  • 做网站营销怎么去推广如何建设社区网站
  • 哪家专门做特卖网站淘客插件wordpress
  • 怎么做点播网站精准扶贫建设网站的目的
  • 如何做网站用户活跃度北京网站优化什么价格
  • 专业建站培训杰瑞网站建设
  • 专门做网站的公司与外包公司怎么制作网站游戏
  • 25转行做网站运营wordpress文章点开是个新网页
  • 简单的企业网站用WordPress配置cms
  • 淘宝网站建设策划书建设网站远达
  • 企业网站制作运营区块链app开发价格
  • 网站 带后台seo营销方法
  • 江苏电商网站开发邯郸市房价
  • 优秀网站作品截图查二级建造师个人信息查询
  • 采集wordpress文章上传外贸谷歌seo
  • 中国建设银行公积金网缴网站进入wordpress后台慢
  • 手机网站 微信网站好看的扁平化网站
  • 外贸订单的网站肥西建设局网站
  • 奇艺广州网站建设 熊掌号网站建设河南公司
  • asp.net 做网站实例用python写一个简单的网站
  • 卡地亚手表官方网站查询动漫制作专业属于什么类型专业
  • 英文建站系统遵义企业做网站
  • 网站优化注意事项南京重庆网站建设
  • 青岛菜西有做网站的吗做自己的网站的一般步骤
  • 知名室内设计网站山东网站空间
  • 网站设计模板旅游景点11页app store怎么调回中文
  • 门户网站建设方案哈尔滨建站的网站网页
  • 阿联酋网站后缀做网站为什么要用php框架
  • 网站改版数据来源表改怎么做wordpress英文版下载
  • 驻马店标准网站建设网站收录很慢
  • 网站挂马黑链检测清除工具北京企业建设网站制作