当前位置: 首页 > news >正文

福安 网站建设北京中高风险地区名单

福安 网站建设,北京中高风险地区名单,编辑网站,wordpress 微信商城模板GroupViT: Semantic Segmentation Emerges from Text Supervision 一、思想 把Transformer层分为多个组阶段grouping stages#xff0c;每个stage通过自注意力机制学习一组tokens#xff0c;然后使用学习到的组tokens通过分组模块Grouping Block融合相似的图片tokens。通过这…GroupViT: Semantic Segmentation Emerges from Text Supervision 一、思想 把Transformer层分为多个组阶段grouping stages每个stage通过自注意力机制学习一组tokens然后使用学习到的组tokens通过分组模块Grouping Block融合相似的图片tokens。通过这种组级联可以把图片中小分割块组成大块。 二、模型 图片分成不重叠的N个块每个块经过线性映射变成 image token除了 image tokens 每个grouping stage同时concat一组可学习的group tokens,image token和group tokens都输入Transformer层。 Grouping Block的作用是把小块组合成大块每个阶段都有该模块。 不是把所有的image token前向传播到所有Transformer层。 每个阶段经过GroupingBlock后得到的tokens数量越来越少因为分割的区域越来越大分割的数量越来越少。最后一层后所有分割tokens经过Transformer层输出平均池化得到图片表示z。 然后用了一个hard assignment技巧使得可微分将每个分割token分配给一个组。然后同一组的所有token融合得到一个新的分割token 双编码器结构GroupViT是图片编码器Transformer是文本编码器最终GroupViT输出的图片向量是所有输出的分割token的平均向量。 三、损失函数 Image-Text Contrastive Loss Multi-Label Image-Text Contrastive Loss 从GT文本中随机选出K个名词然后用模版填充“A photo of a {noun}”. 原始的文本图片对 the new sets of image-“prompted text” pairs Zero-Shot Transfer to Semantic Segmentation 四、实验 部分细节 ViT-S12 Transformer layershidden dimension of 384 input images of size 224 × 224patch size of 16 × 16 experiment with 1-stage and 2-stage architectures for GroupViT: 1-stage: 64 group tokens and insert the grouping block after the sixth Transformer layer;Before the grouping block, we project the 64 group tokens into 8 tokens using an MLP-Mixer layer [76] and output 8 segment tokens. 2-stage: there are 64 and 8 group tokens in the first and second grouping stages, respectively. We insert grouping blocks after the sixth and ninth Transformer layers. We use a 2-layer MLP to project the visual and text embedding vectors into the same latent space. Our batch size is 4096 with a learning rate initialized to 0.0016 and decayed via the cosine schedule. We use the Adam optimizer with a weight decay of 0.05. We train GroupVIT for 30 epochs with the 5 initial epochs containing linear warm-up. For the multi-label contrastive loss, we set K 3.  结果
http://www.hkea.cn/news/14503685/

相关文章:

  • 网站注册凡科html简单网页代码课程表
  • 张家界酷网科技网站建设做地方网站
  • 凡科网站怎么修改中国新设计师联盟
  • 怎么做织梦网站在线磁力搜索神器
  • 网站建设关键词排名优化芜湖网站建设推广公司
  • 山东饰品行业网站开发凡科建设的网站如何
  • wordpress网站备份还原天津市建设厅建筑业信息网
  • 中文网站欣赏做网站鼠标移动 链接变颜色
  • 北京 房地产 网站建设汕头seo课程培训
  • 沈阳模板 网站建设网站红色搭配
  • 网站怎样才能在百度被搜索到江津网站建设效果好不好
  • 赣州做公司网站太原优化网站
  • 网站收录最好的方法如何进行品牌营销
  • 五莲网站制作要怎样建立自己的网站
  • 建设好学校网站软件定制与开发
  • 网站实名制认证备案国外直播sdk
  • 重庆市住房和城乡建设厅官方网站网站建设背景朝阳
  • 如何做网站充值接口深圳市年检在哪个网站做
  • 怎么做网站架构图什么网站做的产品海报比较多
  • 曲阳路街道网站建设北京seo诊断
  • 天台建设局网站朋友做的网站图片不显示
  • 聊城手机网站建设服务asp网站开发实训总结
  • 招远网站建设多少钱网页代码模板源码
  • 开源php网站开发网页设计制作个人简历代码
  • 企业网站建站价格wordpress 摄影博客
  • 用asp.net做简易网站苏州建网站必去苏州聚尚网络
  • 母婴用品商城网站建设手机app界面设计分析
  • 网站开发公司基本业务流程图广州微网站建设咨询
  • sns社交网站建设上海网络推广公司
  • 做网站可以申请专利吗开发官网