当前位置: 首页 > news >正文

自己做网站选什么好做好宣传信息网推广工作

自己做网站选什么好,做好宣传信息网推广工作,查域名价格,天津市建设工程质量安全监督管理总队网站文章目录 1.什么是人工智能对齐2.为什么要研究人工智能对齐3.人工智能对齐的常见方法 1.什么是人工智能对齐 人工智能对齐#xff08;AI Alignment#xff09;指让人工智能的行为符合人的意图和价值观。 人工智能系统可能会出现“不对齐”#xff08;misalign#xff09;的… 文章目录 1.什么是人工智能对齐2.为什么要研究人工智能对齐3.人工智能对齐的常见方法 1.什么是人工智能对齐 人工智能对齐AI Alignment指让人工智能的行为符合人的意图和价值观。 人工智能系统可能会出现“不对齐”misalign的问题。以ChatGPT这样的问答系统为例ChatGPT的回答可能会含有危害祖国统一、侮辱先烈、丑化中华民族、教唆暴力、出口成“脏”等违法或不符合社会主义核心价值观的言论也可能会出现阿谀奉承、威逼利诱、信口雌黄等干预用户达到预定目标的情况。消除人工智能系统不对齐的过程就称为人工智能对齐。 图 ChatGPT的不对齐行为 2.为什么要研究人工智能对齐 根据人工智能对齐的定义所有的人工智能问题包括AI伦理、AI治理、可解释性AI甚至是最基本的回归和分类问题都可以算是人工智能对齐问题。那么为什么学术界还要发明“人工智能对齐”这个新概念研究“人工智能对齐”这个新概念有什么价值呢 事实上人工智能对齐这一概念和ChatGPT这样的通用大模型的诞生密不可分。对于通用大模型而言一个模型可以同时完成多种任务而且不同的任务有着不同的期望有的任务希望能够更有想象力有的任务希望能够更尊重事实有的任务希望能够理性客观有的任务希望能有细腻丰富的情感。任务的多样性导致了需要对大模型进行全方面的对齐而不仅仅是就某些方面进行对齐。传统的研究往往针对某个方面进行对齐对于ChatGPT这样的通用模型会导致“按下葫芦浮起瓢”无法面面俱到。 随着机器学习模型规模的不断变大以及神经网络的大量应用人类已经无法完全理解和解释人工智能的某些行为。例如用于围棋AlphaGo下的某些棋迄今也不能被人类所完全理解。在未来有可能会出现全方面碾压人类的人工智能比如《流浪地球》里的MOSS。传统的对齐方法显然不能满足对这样的人工智能的对齐需求。 3.人工智能对齐的常见方法 人工智能对齐离不开人的接入。人对人工智能系统进行评估和反馈可以确认人工智能中不对齐的情况并指导其进行改进。 人工智能对齐的方法包括模仿学习和人类反馈强化学习。ChatGPT就采用了这些对齐方法。 ChatGPT训练步骤 图片来源 上图是ChatGPT的训练步骤图 步骤一利用收集到的数据进行监督学习这一部分就是在用模仿学习进行人工智能对齐。不过ChatGPT的训练团队认为仅仅用模仿学习并不能完全达到要求。 模仿学习不能完全满足对齐需求的原因可能如下模仿学习使用的数据集能覆盖到的数据范围是有限的不可能包括所有的情况。用这样数据集训练出来的人工智能难免有些边脚情形的表现不对齐。另外虽然训练后能够让训练目标基本上达到最优但是在训练目标最优情况下还是会出现在某些样本点上表现不好的情况。而这些样本点也许还挺重要这些不好的样本点可能会涉及到重大的法律或是舆论风险。 为此ChatGPT的训练过程进一步地使用了人类反馈强化学习。步骤图中的第二步和第三步就用到了人类反馈强化学习。 第二步通过人类的反馈构建奖励模型。 在这一步中提供反馈的人可以就其认为需要重点关注的问题进行着重考察来确保在哪些重要的问题上奖励模型是正确的。并且在后续的测试中如果发现了之前没有预料到的新问题还可以通过提供更多反馈样本来为奖励模型打上补丁。这样通过人工干预、不断迭代反馈奖励模型就趋于完善。这样就让奖励模型的人类的期望对齐。 在利用反馈进行奖励模型对齐的训练过程中对于每个样本先由语言模型输出几个备选的回答然后再由人类对这些回答进行排序。这样的做法与直接让用户提供参考答案相比更能够激发语言模型本身的创造力也能使得反馈更快更省钱。 第三步利用奖励模型进行强化学习。 步骤中提到的PPO算法就是一种强化学习算法。通过使用强化学习算法使得系统的行为和奖励模型对齐。 基于反馈的强化学习在ChatGPT等大模型上的成功应用使得该算法称为最受关注的大模型对齐算法。目前绝大多数的大模型都采用了这个技术进行对齐。 延伸阅读 《强化学习原理与Python实战》 肖智清 著 解密ChatGPT关键技术PPO和RLHF 理论完备:涵盖强化学习主干理论和常见算法带你参透ChatGPT技术要点实战性强:每章都有编程案例深度强化学习算法提供TenorFlow和PyTorch对照实现配套丰富:逐章提供知识点总结章后习题形式丰富多样。还有Gym源码解读、开发环境搭建指南、习题答案等在线资源助力自学。
http://www.hkea.cn/news/14448502/

相关文章:

  • 网站建设属于经营什么范围logo免费设计网站有哪些
  • 四川外国语大学网站建设系免费毕业设计网站建设
  • 济南建设网站的公司哪家好网页制作与网站制作
  • 微信网站模版装宽带一般多少钱
  • 湖北高端网站建设重庆企业网站开发方案
  • 珠三角做网站济宁人才网招聘信息网
  • 南通市住房建设局网站衡水企业网站设计
  • 管理系统论文seo推广品牌排行榜
  • 抚州专业的企业网站建设公司做网站用域名不备案怎么弄
  • 网站设计与开发的基本步骤包括哪些网站seo文章该怎么写
  • 做网站的网站违不违法天台做网站
  • 汽车网站模板免费下载怎么样建设企业网站
  • 贵阳网站开发哪家专业华为公司邮箱是多少
  • 垂直电商网站建设wordpress自定义页面宽度
  • 商城类网站风格化妆品网站设计报告
  • 带有互动的网站开发二级不死域名购买
  • 深圳网站建设黄浦网络别人做的网站不能用了
  • 海口市公司网站建设软文有哪些
  • 天津网站推广优化app软件开发官网
  • 网站建设 小知识广告推广营销
  • 怎么做网站 教学标签云wordpress
  • 现在一般做网站都是去哪家做的wordpress页面采集
  • 农产品网站开发深圳品牌设计公司的发展
  • 网站页尾的作用第三方网站宣传怎么做
  • 黄页网站系统wordpress主题请勿删除版权信息
  • 福州什么推广网站好石家庄建设一个网站多少钱
  • 沭阳网站建设哪家好建设银行个人网站个人客户
  • 中职国示范建设网站百度免费做网站
  • 广州腾虎网络网站建设熊掌号湛江市城乡住房建设局网站
  • 河南省建设部官方网站wordpress模板底部版权怎么修改