当前位置: 首页 > news >正文

南京网站建设与网络营销的关系区块链

南京网站建设与网络营销的关系,区块链,科技公司网站模板,中建五局华东建设公司网站引言 本博客介绍LLava1.5多模态大模型的安装教程、训练教程、预测教程#xff0c;也会涉及到hugging face使用与wandb使用。 源码链接:点击这里 demo链接:点击这里 论文链接:点击这里 一、系统环境 ubuntu 20.04 gpu: 2*3090 cuda:11.6 二、LLava环境安装 1、代码下载…引言 本博客介绍LLava1.5多模态大模型的安装教程、训练教程、预测教程也会涉及到hugging face使用与wandb使用。 源码链接:点击这里 demo链接:点击这里 论文链接:点击这里 一、系统环境 ubuntu 20.04 gpu: 2*3090 cuda:11.6 二、LLava环境安装 1、代码下载 git clone https://github.com/haotian-liu/LLaVA.git cd LLaVA2、虚拟环境构建 conda create -n llava python3.10 -y conda activate llava pip install --upgrade pip # enable PEP 660 support3、模型预测安装 pip install -e .4、模型训练环境安装 pip install -e .[train] pip install flash-attn --no-build-isolation # 可能安装失败5、flash-attn离线环境安装 根据对应环境格式下载相应flash-attn flash-attn下载链接点击这里 实际为whl的离线文件在使用pip install *.whl 即可 三、LLava推理运行 1、启动网页预测(类似服务端与客户端) Launch a controller python -m llava.serve.controller --host 0.0.0.0 --port 10000Launch a gradio web server. python -m llava.serve.gradio_web_server --controller http://localhost:10000 --model-list-mode reload注:host 0.0.0.0表示自动填充本机ip网页将其替换本机ip即可web server启动后会有网页ip若在其它电脑将其0.0.0.0替换运行服务器的ip即可。 2、推理权重下载 我们使用llava-v1.5-7b模型做推理。 llava-v1.5-7b权重下载 权重下载地址:点击这里 权重下载需要使用hugging face才能下载自己注册账号即可文件格式如下 将图示文件全部下载内有一个config.json文件该文件很重要部分内容如下 该文件可看出视觉编码也缺少相应权重需下载如下内容并将其路径修改本地权重保存文件。 clip-vit-large-patch14-336权重下载 权重下载地址:点击这里 该文件可通过点击链接连接也可在hugging face自行搜索。 同理也是全部下载放到一个文件夹中。 3、启动预测模型 若已完成权重下载便可执行以下模型启动命令而–model-path后面需跟模型权重路径文件若联网能范文hugging face便可无需修改直接使用官方给定命令。 python -m llava.serve.model_worker --host 0.0.0.0 --controller http://localhost:10000 --port 40000 --worker http://localhost:40000 --model-path liuhaotian/llava-v1.5-13b –load-4bit: 该指令也可加上使用4bit模型推理 四、LLava的lora训练 1、权重下载 根据下图的finetune_lora.sh文件指定权重在hugging face下载即可如下图。 下载好对应权重即可修改路径路径如下 2、数据准备 使用官网也行若不想下载太多使用下面代码准备部分也行如下 import jsonif __name__ __main__:json_rootr*\llava_v1_5_mix665k.jsonwith open(json_root, r) as f:json_info json.load(f)save_infojson_info[:1000]json_info[480000:481000]json_info[620000:621000]with open(info.json, w) as fp:json.dump(save_info, fp, indent4) 数据图如下 3、训练命令 我是将其移动到LLAVA文件内直接执行此命令 finetune_lora.sh4、报错处理 模型有可能报数据错误此时不用担心该问题是数据的问题如下 直接修改上面代码如下 def get_modality_length_grouped_indices(lengths, batch_size, world_size, generatorNone):# We need to use torch for the random part as a distributed sampler will set the random seed for torch.assert all(l ! 0 for l in lengths), Should not have zero length.mm_indices, mm_lengths zip(*[(i, l) for i, l in enumerate(lengths) if l 0])# lang_indices, lang_lengths zip(*[(i, -l) for i, l in enumerate(lengths) if l 0])lang_indices, lang_lengthsmm_indices, mm_lengthsassert len(mm_indices) 0, Should have at least one multimodal sample.assert len(lang_indices) 0, Should have at least one language sample. 也有可能有其它数据问题是可能无eval数据添加以下红色框即可如下: 5、训练效果 若完成以上方式使用训练命令可实现如下训练效果 6、训练使用wandb llava训练自带wandb方式显示化查看训练代码会自动提醒你你只需注册然后将其key复制即可实现其效果如下 总结 以上便llava所有运行过程愿踩过的坑对你有帮助。最后我额外说下我使用4090显卡搭建跑测试问题不大大概16g左右吧跑训练一张24G卡有些够呛。
http://www.hkea.cn/news/14369328/

相关文章:

  • 电商网站怎么做与众不同大连seo建站
  • 做海报的免费网站wordpress links
  • 莱芜网站建设服务2021重大军事新闻
  • 网站建设最新模板宝塔搭建本地网站
  • 网站开发 托管合同怎么免费网上做公司网站
  • 餐饮网站设计做名片网站
  • 互联网建网站淮南网云小镇最新动态
  • 网站最好服务器洛阳工程建设信息网站
  • 大鹏外贸网站建设深圳公司标牌制作
  • 学网站建设难吗搭建本地环境做网站
  • 畔游网站建设wordpress广告
  • 微商城网站建设市场网站建设服务怎么样
  • 坪山附近公司做网站建设哪家效益快公共服务平台登录入口
  • 莱西网站制作培训网络营销机构
  • 网站主持人wordpress title修改
  • 网站开发管理学什么怎么给公司做免费网站
  • 网站建设与管理技术发展证券公司客户经理怎么拉客户
  • 网站怎么登陆后台asp网站作业下载
  • 爱站网为什么不能用了现在手机网站设计
  • 企业网站建设前期规划外面网站怎么做
  • 做的网站 如何在局域网内访问珠海网站建设企业
  • 网站定制型和营销型wordpress标题不居中
  • 如何建自己网站做淘宝客网络运营外包托管
  • 网站建设现在主要做些什么网页文字游戏
  • 深圳建设网站制作公司莱芜都市网下载
  • 番禺高端网站建设免费图片尺寸在线修改
  • 如果制作个人网站权威的手机网站建设
  • 购物网站销售管理成都 广告公司网站建设
  • 重庆铜梁网站建设软件外包公司值得去吗
  • 网站制作分工网站开发及建设赔偿条款