当前位置: 首页 > news >正文

成都网站制作怎么收费整合营销传播的明显特征是

成都网站制作怎么收费,整合营销传播的明显特征是,做文字logo的网站,淘宝网站怎么做一、理解多模态大模型的常见设计模式,可以大概讲出多模态大模型的工作原理。 视频地址 开源的多模态大模型:InternVL,Qwen-VL,LLaVA 闭源的:GPT-4o 研究重点:不同模态特征空间的对齐 BLIP2 将图像特征对…

一、理解多模态大模型的常见设计模式,可以大概讲出多模态大模型的工作原理。

视频地址
开源的多模态大模型:InternVL,Qwen-VL,LLaVA
闭源的:GPT-4o

研究重点:不同模态特征空间的对齐

BLIP2

将图像特征对齐到文本空间中
在这里插入图片描述
Q-Former,双塔结构,分别处理图像输入和文字输入,用三个loss来优化模型(用MASK来区分三种任务)
在这里插入图片描述
缺点:
在这里插入图片描述
在这里插入图片描述

MiniGPT-4

开源版GPT4
采用Q-Former和VIT

在这里插入图片描述

LLaVA

用图像编码器和一层线性层把图像映射到文本空间,然后和文本指令embedding拼接在一起
在这里插入图片描述

LLaVA-1.5-HD

图像切片、缩略图,作为输入
然后一层MLP换成两层
在这里插入图片描述

LLaVA-NeXT

采用动态分辨率,找到最接近的长宽比,放缩过去再切块
在这里插入图片描述

二、了解InternVL2的设计模式,可以大概描述InternVL2的模型架构和训练流程

在这里插入图片描述

Dynamic High Resolution

原图切片
在这里插入图片描述

InternViT

在这里插入图片描述

  1. vision encoder的参数量增大
  2. 较之clip的对比学习,没有丢弃text encoder。
  3. 实验发现倒数第四层好用,就去掉了后面三层
  4. 扩展分辨率
  5. 在高分辨率和OCR数据集上训练

V1.5版本中,加了动态分辨率和高质量数据。

Pixel Shuffle

将图像进行下采样,
有利于减少计算资源,扩大多模态的上下文长度在这里插入图片描述

多任务输出

用任务路由token决定执行什么任务
在这里插入图片描述

训练

先训MLP,再把所有模块都微调
在这里插入图片描述

三、了解LMDeploy部署多模态大模型的核心代码,并运行提供的gradio代码,在UI界面体验与InternVL2的对话

0.工作原理了解

1.环境配置

创建训练环境,用之前的xtuner-env就行,只要多装timm包就好
pip install -U ‘xtuner[deepspeed]’ timm==1.0.9

推理环境配置,需要用上书生生态链的lmdeploy

conda create -n lmdeploy python=3.10 -y
conda activate lmdeploy
pip install lmdeploy gradio==4.44.1 timm==1.0.9

在这里插入图片描述

2.LMDeploy部署

在这里插入图片描述

松鼠鳜鱼识别失败

在这里插入图片描述

四、了解XTuner,并利用给定数据集微调InternVL2-2B后,再次启动UI界面,体验模型美食鉴赏能力的变化。

1.微调实践

开发机没有/root/xtuner路径,可以用/root/finetune/xtuner代替。
克隆的命令也改为
cp /root/InternVL2-Tutorial/xtuner_config/internvl_v2_internlm2_2b_lora_finetune_food.py /root/finetune/xtuner/xtuner/configs/internvl/v2/internvl_v2_internlm2_2b_lora_finetune_food.py

2.下载数据集

FoodieQA需要在hugging face上先提交申请,比较麻烦
因此可以用share目录下已经处理好的数据集
用软连接即可

ln -s /root/share/datasets/FoodieQA /root/huggingface/FoodieQA

3.开始微调

我是在/root/finetuner/xtuner/目录下运行微调指令的

xtuner train internvl_v2_internlm2_2b_lora_finetune_food --deepspeed deepspeed_zero2

另一
在这里插入图片描述
格式转换:
在这里插入图片描述

4.部署

修改demo.py里的路径为

MODEL_PATH = "/root/finetune/xtuner/work_dirs/internvl_v2_internlm2_2b_lora_finetune_food/lr35_ep10"
可以看到,训完之后它对于苏菜的松鼠鳜鱼识别还是错误,识别成了浙菜油爆虾。但是较之未训练的模型来说,至少没有笼统的列出属于中国菜,有所进步,

在这里插入图片描述
在这里插入图片描述

http://www.hkea.cn/news/346404/

相关文章:

  • 微信公众号平台入口官网奶盘seo伪原创工具
  • 泉州网站建设公司推荐宁德市地图
  • 大厂县住房和城乡建设局网站刷百度指数
  • 低代码开发平台优缺点昆山seo网站优化软件
  • 网站开发年终总结网络营销战略的内容
  • 建立门户网站的意义营销推广网
  • 网站建设网站软件有哪些百度推广开户费用标准
  • 找家装修公司家装吉林seo外包
  • 保定医疗网站建设公司会计培训班初级费用
  • 最好的销售管理系统seo发帖网站
  • 德州乐陵德州seo公司seo批量建站
  • 贵州省建设监理协会官方网站seo代运营
  • 北京哪家做网站优化账号权重查询
  • 大唐网站建设培训管理平台
  • 男人和女人在床上做那个网站网络营销策划推广公司
  • 深圳市招投标交易中心天津谷歌优化
  • 厦门园网站忱建设百度推广怎么联系
  • 网站优化页面动态网站建设
  • 做网站域名公司每日重大军事新闻
  • 网站改版数据来源表改怎么做外链百科
  • wordpress怎样做单页网站谷歌查询关键词的工具叫什么
  • 县城做二手车网站自己建网站需要多少钱
  • 有没有专业做挂的网站引流推广方案
  • 购物网站开发文献综述百度收录需要多久
  • 营销型企业网站建设案例设计公司网站
  • 国际外贸网站电子商务
  • 南充做网站 www.xinbay.com全国免费发布广告信息
  • 备案 个人网站软件开发培训中心
  • 江苏网站建设网络推广关键词批量调词 软件
  • 东莞企业网站建设价格怎么在百度发布免费广告