当前位置: 首页 > news >正文

建设银行短信带网站平昌移动网站建设

建设银行短信带网站,平昌移动网站建设,菏泽做网站优化的,青岛房产网房天下什么是 tokens#xff0c;ChatGPT里面的Tokens如何计数#xff1f; 什么是 tokens#xff1f; Tokens 可以被认为是词语的片段。在 API 处理提示之前#xff0c;输入会被分解成 tokens。这些 tokens 并不会精确地在单词的开始或结束处切分 - tokens 可以包含尾随的空格甚…什么是 tokensChatGPT里面的Tokens如何计数 什么是 tokens Tokens 可以被认为是词语的片段。在 API 处理提示之前输入会被分解成 tokens。这些 tokens 并不会精确地在单词的开始或结束处切分 - tokens 可以包含尾随的空格甚至子词。以下是一些帮助理解 tokens 长度的经验法则 1 token ~ 英文中的4个字符 1 token ~ ¾个单词 100 tokens ~ 75个单词 或者 1-2个句子 ~ 30个tokens 1段落 ~ 100个tokens 1,500个单词 ~ 2048个tokens 为了获取更多关于tokens如何叠加的上下文可以考虑以下例子 韦恩·格雷茨基的名言 “You miss 100% of the shots you don’t take” 包含11个tokens。 单词如何被分割成 tokens 也取决于语言。例如‘Cómo estás’西班牙语中的’你好吗’包含5个 tokens对应10个字符。较高的 token 到字符比率可能使得对英语以外的语言实现 API 更加昂贵。 我名字拼音空格wetchat我的微信号liyuechun wetchat liyc1215 包含13个tokens。 飞书、钉钉、企微GPT能力嫁接和AIGC企业培训联系我liyc1215 ”黎跃春“三个字包含8个tokens 付金亮三个字包含6个tokens 如果你想进一步探索分词你可以使用我们的交互式 Tokenizer 工具它可以让你计算 token 的数量并查看文本如何被分割成 tokens。或者如果你想通过编程方式进行分词可以使用 Tiktoken这是一个专为 OpenAI 模型设计的快速 BPE 分词器。你也可以尝试探索其他库例如 Python 的 transformers 包或者 node.js 的 gpt-3-encoder 包。 Token 限制 根据使用的模型不同请求中的prompt和completion之间最多可以使用4097个tokens。如果你的prompt是4000个tokens那么你的completion最多可以是97个tokens。 这个限制目前是一个技术限制但通常有许多创新的方法可以在这个限制内解决问题例如压缩你的prompt将文本分解成较小的部分等。 Token 定价 API 提供多种不同价格点的模型类型。每种模型都有一系列的能力其中davinci是最强大的ada是最快的。对这些不同模型的请求定价不同。你可以在这里找到关于token定价的详细信息。 探索 tokens API会根据语料库数据中的上下文来处理单词。GPT-3接受prompt将输入转换成一系列的tokens处理prompt并将预测的tokens转换回我们在响应中看到的单词。 在我们看来可能是两个相同的单词可能会根据它们在文本中的结构生成不同的tokens。考虑一下API如何根据文本中的上下文为单词’red’生成token值 在上面的第一个例子中‘ red’的token 2266包含一个尾随的空格。 带有前导空格并以大写字母开头的‘ Red’的token 2297与以小写字母开头的‘ red’的token 2266不同。 当 ‘Red’ 在句子开头时生成的token不包含前导空格。token 7738与前两个单词的例子不同。 观察 token越可能/频繁分配给它的token号就越低 在所有3个句子中为句号生成的token是相同的“13”。这是因为在语境上句号在语料库数据中的使用相当类似。 根据’red’在句子中的位置生成的token会有所不同 在句子中间的小写‘ red’ - (token: “2266”) 在句子中间的大写‘ Red’ - (token: “2297”) 在句子开头的大写‘Red’ - (token: “7738”) 既然我们知道tokens可以包含尾随的空格字符那么记住以空格字符结束的prompts可能会导致输出质量较低是有帮助的。这是因为API已经在它的tokens字典中包含了尾随的空格。 使用 logit_bias 参数 可以在 logit_bias 参数中为特定的 tokens 设置偏差以修改指定 tokens 出现在补全中的可能性。比如我们正在构建一个对用户鸡蛋过敏问题敏感的 AI 烘焙助手。 当我们使用提示 ‘The ingredients for banana bread are’ 运行 API 时回应将以26.8%的概率将 ‘eggs’ 包含为第二种原料。 注意要在 Playground 中查看补全概率请从 Show Probabilities 下拉菜单中选择 Full Spectrum。 由于我们的 AI 烘焙助手对鸡蛋过敏问题很敏感我们可以利用我们对 tokens 的了解在 logit_bias 参数中设置偏差以阻止模型生成包含任何 ‘egg’ 变体的响应。 首先使用这个分词器工具来确定我们需要为哪些 tokens 设置偏差。 Tokens: 尾随空格的单数形式‘ egg’ - “5935” 尾随空格的复数形式‘ eggs’ - “9653” 为‘Egg’或‘Eggs’生成的子词token - ‘gg’“1130” logit_bias 参数接受的偏差值范围是 -100 到 100极值结果导致相关 token 的禁止-100或独占选择100。 将 logit 偏差加到 prompt 中将修改 ‘egg’及其变体包含在我们的香蕉面包提示的响应中的可能性。上述提示生成了一个不包含任何鸡蛋的响应 虽然我们不能保证它会生成最好的无鸡蛋香蕉面包配方但 AI 烘焙助手满足了对用户鸡蛋过敏问题的考虑需求。 总结 使用英文对话比较划算其他语言包括中文计算Token时比较昂贵英文字母大概四个字母平均下来等于一个token中文汉字大概一个汉字平均下来两个token我昨天用GPT写了7篇高考作文总字数为10397Tokens 为21,008个。 计算了一下如果使用GPT3.5的API访问的话整个输入和输出总共21,008 个tokenGPT3.5 的单价为$0.002/1000tokens那么这7篇作文的整个对话花费折算成人民币的价格为21008/1000*(0.002*7) 0.294112元人民币GPT4是GPT3.5的60倍价格如果使用GPT4的话此次消费为0.294112 * 60 17.64672元。 最后总结 目前使用GPT3.5的价格还是很亲民划算的等待未来算力足够的时候我相信GPT4.0也不会贵。 原文链接https://blog.yredu.xyz/archives/5119
http://www.hkea.cn/news/14517423/

相关文章:

  • 网站浏览构思WordPress 百度联盟优化主题
  • o2o平台有哪些网站建设上线网站
  • 深圳建设银行分行网站lumen wordpress 下载
  • 网站建设教程 乐视网网站怎么做下载链接
  • 郑州网站seo排名sharepoint 网站开发
  • 企业3合1网站建设价格wordpress模板格式
  • 网站建设服务合同协议信宜做网站设置
  • 电子商务学网站建设好吗金融投资网站
  • 咋样着做自己的网站专业互联网软件开发
  • 重庆高铁建设网站优秀作文网站推荐
  • 网站设计应该遵循的原则北京代理记账公司
  • 制作网站的公司做网站去哪里找网站排名优化策划
  • 公司网站建设费用wordpress 恢复初始
  • 镇江外贸型网站建设中铁建设集团招标网站
  • wordpress托管建站快站的优惠券怎么发布的
  • 小轲网站建设赣州网站建设开发
  • 网站关键字在哪设置做家教中介 不建网站怎么做
  • 网站建设商业计划书范文山西网络营销推广seo
  • 在线动画手机网站模板下载徐州钢网架公司
  • .net 网站优化腾讯官方网站qq注册
  • 做pc端网站多少钱如何在外管局网站做延期收汇
  • 口碑好的镇江网站建设wordpress网页自适应屏幕大小
  • cps网站建设普洱市网站建设
  • 如何做线上网站的网站建立企业网站的费用
  • 招标网站有哪些贵阳网站制作贵阳网站建设哪家好
  • 小工厂怎么做网站网页游戏
  • 建设速干裤移动网站河北营销型网站建设
  • 淄博阿雷网站建设公司wordpress获取作者的角色
  • 酒泉建设厅网站网站优化标准
  • 帝国cms做网站流程免费网站添加站长统计