当前位置: 首页 > news >正文

货运代理网站模板郴州网站优化公司

货运代理网站模板,郴州网站优化公司,做一个app需要多长时间,政务网站建设目的 意义目录 1. Word2Vec 简介2. Word2Vec 的训练方法2.1 Skip-Gram模型2.2 CBOW#xff08;Continuous Bag of Words#xff09;模型 3. Word2Vec 中的词嵌入表示4. 训练过程中是否使用独热编码#xff1f; 1. Word2Vec 简介 Word2Vec 是一种词嵌入模型#xff0c;主要通过无监督… 目录 1. Word2Vec 简介2. Word2Vec 的训练方法2.1 Skip-Gram模型2.2 CBOWContinuous Bag of Words模型 3. Word2Vec 中的词嵌入表示4. 训练过程中是否使用独热编码 1. Word2Vec 简介 Word2Vec 是一种词嵌入模型主要通过无监督学习来训练词汇的稠密向量表示。它通过分析大量的语料库学习到每个词token在该语料库中的上下文关系。Word2Vec 使用神经网络模型来生成每个词的嵌入向量嵌入向量的维度通常远小于词汇表的大小。 2. Word2Vec 的训练方法 Word2Vec 主要有两种训练方式 连续词袋模型Continuous Bag of Words, CBOW跳字模型Skip-gram 无论是 CBOW 还是 Skip-gramWord2Vec 都是通过上下文关系来训练词向量的而不是像 独热编码 那样直接表示每个词。 2.1 Skip-Gram模型 Skip-Gram 模型的目标是给定一个中心词target word预测它的上下文词context words。这种方法适用于小数据集能够更好地捕捉到词汇的稀有用法。 输入中心词target word输出上下文词context words例子 如果上下文窗口为 2给定句子 “The cat sat on the mat”在 “sat” 这个词的中心下模型会尝试预测 “The”、“cat”、“on” 和 “the” 这四个词作为上下文。 训练时Skip-Gram 模型通过最大化目标词和上下文词的条件概率更新模型中的参数。 2.2 CBOWContinuous Bag of Words模型 CBOW 模型的目标是给定上下文词context words预测目标词center word。CBOW 适合较大数据集计算上通常比 Skip-Gram 更高效。 输入上下文词context words输出中心词target word例子 给定上下文窗口为 2句子 “The cat sat on the mat”在上下文词 “The”、“cat”、“on” 和 “the” 下CBOW 模型会尝试预测 “sat” 作为中心词。 在训练时CBOW 模型通过最大化目标词的条件概率来更新参数。 联想成物理中的向量分量合并与分解的操作即可 3. Word2Vec 中的词嵌入表示 在 Word2Vec 中输入词汇并不直接使用 独热编码而是通过 嵌入矩阵embedding matrix将每个词映射到一个稠密向量空间。这些向量是在训练过程中学习到的。 独热编码独热编码One-Hot Encoding是将每个词表示为一个维度为词汇表大小的稀疏向量其中只有对应词的位置是 1其他位置是 0。例如如果词汇表大小是 5“dog” 在词汇表中的位置是 3那么它的独热编码表示为 [0, 0, 1, 0, 0]。这种表示方式通常会导致非常稀疏的高维向量维度非常大并且无法有效地捕捉词与词之间的关系。 词嵌入而在 Word2Vec 中每个词会被映射到一个固定维度的 密集向量通常是 50 到 300 维。这些向量表示了词与词之间的语义关系例如“king” 和 “queen” 会有相似的向量表示。 Word2Vec 的训练方式实际上是通过 嵌入矩阵 来进行的。在训练过程中模型会根据上下文词来调整每个词的向量使得在语义空间中相似的词会有相似的向量。 4. 训练过程中是否使用独热编码 是的在 Word2Vec 中一般会先将词转换成独热编码one-hot encoding向量再通过嵌入矩阵转换成稠密的低维嵌入向量。 这里是一个简化的流程 独热编码假设词汇表大小为 V每个词用一个 V 维的独热编码向量表示。例如如果“喜欢”是词汇表中的第 i 个词则它的独热编码在第 i 个位置为 1其他位置为 0。 嵌入矩阵设嵌入矩阵 W 的维度是 V × d其中 d 是嵌入的维度。嵌入矩阵 W 存储了每个词的嵌入向量每行对应词汇表中的一个词。 嵌入向量将独热编码向量 o 乘以嵌入矩阵 W得到词的嵌入向量 e。计算过程为 e o × W结果就是一个 d 维的嵌入向量。 这样每个词的独热编码就被映射到一个稠密、低维的嵌入空间中用以捕获词与词之间的语义关系。
http://www.hkea.cn/news/14499053/

相关文章:

  • 贵州网站制作公司电话甘肃建筑工程网
  • 河南城乡建设部网站建个人免费网站用哪个
  • 怎么自己做刷赞网站白种女人做爰网站
  • 北京网站开发网站建设浩森宇特陈铭生是什么小说
  • 表格如何做网站营销型网站建设必须的步骤包括
  • 在电脑上做网站的软件邯郸市内最新招聘信息
  • PHP网站开发成功案例今鼎网站建设
  • 轻松建站公司网站模板怎么做
  • 注册网站会员需要填写信息做短视频的能跟几个网站签约
  • 唐山网站建设互众动力个性化网页设计
  • 美食论坛网站模板app排名优化
  • 建个企业网站需要什么win10 安装wordpress
  • 网站内容转载discuz做网站
  • 网站优化 北京深圳建设网站首页
  • 支付宝也做网站吗做网站策划一个专利的主题宣传
  • 网站建设需要配置环境么网站建设二级菜单
  • iis网站访问权限免费最新如何建设网站教程视频
  • 做博客网站如何盈利网站快速收录软件
  • 老薛主机做多个网站手机怎么建立网站
  • c 做网站推广网站怎么做知乎
  • 中细软做的网站上海百度seo点击软件
  • 成都网站服务如何在360网站网页上做笔记
  • 专门做羽毛球的网站青海网站维护
  • 响应网站怎么做信息发布平台推广有哪些
  • wordpress文章字体修改为宋体网站seo快速排名软件
  • 网站建设所需的硬软件成品网站源码1688自动跳转
  • 国外h5分享网站wordpress怎么选主题
  • wordpress本站只对会员开放项目外包平台接活
  • phpcms 手机网站静态网页设计实训心得
  • 网站定制开发成本上海尚海整装官方网站