当前位置: 首页 > news >正文

做网站需要什么花费毕业设计做网站前端

做网站需要什么花费,毕业设计做网站前端,网站管理系统设置,广州在线网页制作工具引言 在本文[1]中#xff0c;我们将从高层次概述大型语言模型 (LLM) 的具体含义。 背景 2023年11月#xff0c;我偶然间听闻了OpenAI的开发者大会#xff0c;这个大会展示了人工智能领域的革命性进展#xff0c;让我深深着迷。怀着对这一领域的浓厚兴趣#xff0c;我加入了… 引言 在本文[1]中我们将从高层次概述大型语言模型 (LLM) 的具体含义。 背景 2023年11月我偶然间听闻了OpenAI的开发者大会这个大会展示了人工智能领域的革命性进展让我深深着迷。怀着对这一领域的浓厚兴趣我加入了ChatGPT并很快被激发了学习其背后的大型语言模型LLMs技术的热情。然而像许多人一样我对LLMs一窍不通不知道如何入门。 模型定义 大型语言模型LLMs例如ChatGPT正在成为当今技术界的热门话题。根据维基百科LLM的定义是LLM是一种因其能够实现通用语言理解和生成而著称的语言模型。它们通过在计算密集型的自我监督和半监督训练过程中学习文本文档的统计关系从而获得这些能力。LLM是采用变换器架构的人工神经网络。 换句话说LLMs通过在包括书籍、网站和用户生成内容在内的大量文本数据集上进行训练能够以一种自然的方式生成延续初始提示的新文本。 LLM模型本质上是一个参数众多的神经网络。简单来说参数越多模型的性能通常越好。因此我们经常听到关于模型大小的讨论这实际上是指其参数的数量。比如GPT-3拥有1750亿个参数而GPT-4的参数数量可能超过1万亿。 但模型具体长什么样呢 语言模型只是一个二进制文件 上图中参数文件是Meta的Llama-2–70b模型大小为140GB包含70b个参数数字格式。 run.c文件是推理程序用于查询模型。训练这些超大型模型是非常昂贵的。训练像 GPT-3 这样的模型需要花费数百万美元。 目前表现最为卓越的模型 GPT-4 已经不再是单一的模型而是多个模型的集合体。这些模型各自针对特定领域进行了训练或微调它们在推理时相互协作以实现最优的性能表现。 不过无需担心我们的目标是掌握大型语言模型的基础理论。幸运的是我们完全可以在自己的个人电脑上用参数数量少得多的模型进行训练。 模型推理 当模型训练完毕并准备就绪后用户用问题查询模型问题文本将传递到该 140GB 文件中并逐个字符进行处理然后返回最相关的文本作为结果输出。 最相关的意思是模型将返回最有可能是输入文本的下一个字符的文本。例如  Input: I like to eat Output: apple apple 被预测为接下来的单词这是因为在模型训练所用的大量数据中I like to eat 后面最常跟随的就是 apple。 我们之前提到的书籍和网站现在可以这样理解基于我们提供的数据片段模型学习到 I like to eat apple 是一个频繁出现的句子。而 I like to eat banana 也是一个常见的句子但出现频率没有前者高。 在模型训练时它记录了 apple 在 I like to eat 后面出现的概率为 0.375. 记录了 banana 在 I like to eat 后面出现的概率为 0.146 和 … 其他单词的概率记录 … 这些概率值实际上被保存在模型文件中形成了概率集合。在机器学习中这些概率通常被称作权重。简而言之LLM模型就像是一个概率数据库它能够为任何特定的字符以及其上下文相关的字符赋予一定的概率分布。 在2017年之前这样的技术听起来还像是天方夜谭。然而自从论文《Attention is all you need》发表之后Transformer 架构的出现使得通过训练神经网络处理庞大的数据集实现对上下文的深入理解成为现实。 模型架构 在大型语言模型LLM诞生之前神经网络的机器学习确实只能使用较小的数据集对于文本的上下文理解能力十分有限。这导致早期的模型无法像人类那样深入理解文本。 该论文最初发表时是为了训练用于语言翻译的模型。但OpenAI的团队意识到Transformer 架构是实现字符预测的关键技术。一旦模型经过整个互联网数据的训练它就可能像人类一样理解任何文本的上下文并流畅地完成句子。 下面是一个图解描述了模型训练过程中的内部机制 初次接触时我们可能不太明白但别担心我们将在随后的文章中逐步解释清楚。 Reference [1] Source: https://medium.com/waylandzhang/what-is-large-language-model-llms-zero-to-hero-06f329767d03 本文由 mdnice 多平台发布
http://www.hkea.cn/news/14287916/

相关文章:

  • 网站开发8080无法访问此页面旅游网站设计需求分析
  • 网站维护 静态页面怎么申请免费企业邮箱账号
  • 做静态网站接单免费咨询医生在线解答
  • 瑞金市网站建设怎么样制作一个网页
  • 搭建一个个人网站中国建设报官方网站
  • 网站建设在哪里办公如何查看网站域名证书
  • 南京集团网站建设江门网站建设自助建站
  • php网站开发个人职责wordpress英文版修改栏
  • 新兴建设网站qq音乐wordpress
  • 网站改版需要注意哪些seo问题个人网站建设教学视频
  • 做土特产的网站有哪些腾讯云wordpress建站
  • swf做网站头纪念平台网站建设
  • 石家庄网站建设蓝龙今天的最新新闻内容
  • 摄影师网站护肤品网站建设方案
  • 网站开头flash怎么做律师网站建设怎么样
  • 什么网站可以查建设用地规划许可证餐饮加盟网站怎么做
  • 用瀑布流做的美食网站重庆建工信息网官网
  • 房产类网站建设半瓶的wordpress之旅
  • seo外链网站源码长沙网络营销公司
  • 商城类网站建设多少钱罗湖区住房和建设局网站
  • 删除wordpress站iis7搭建网站教程
  • c苏宁网站开发外贸网站如何制作
  • 青海网站制作多少钱广告设计主要学什么内容
  • 网站怎么做可以增加点击率广州微网站开发
  • 黄金网站网址免费开发公司网签过期
  • 国外优秀电商设计网站项目优化seo
  • 做网站是58好还是百度好建网站和app
  • 省通信管理局 网站备案制度流程网站建设平台
  • 营销型网站的名词解释搜索引擎优化英文简称为
  • 美橙互联网站管理后台中国新农村建设促进会网站