当前位置: 首页 > news >正文

网站建设网站服务百度保障平台 客服

网站建设网站服务,百度保障平台 客服,汕头网站推广多少钱,医疗网站 seo怎么做目录 前言 思路介绍 代码 完整代码 拓展代码 前言 很多人在进行目标检测训练时习惯将得到的数据标注为XML文件的VOC格式,或者在网上获取的数据集被标注为XML文件,但是不同的标注工具进行的标注会产生不同的标注xml文件,这里我写了一种通用…

目录

前言

思路介绍

代码

完整代码

拓展代码


前言

        很多人在进行目标检测训练时习惯将得到的数据标注为XML文件的VOC格式,或者在网上获取的数据集被标注为XML文件,但是不同的标注工具进行的标注会产生不同的标注xml文件,这里我写了一种通用的针对含有最基本图片和标注坐标信息的xml进行转换,在这里简单介绍并分享出来

思路介绍

        xml文件中最基本需要含有的信息为size,object下的name和bndbox,具体示例如下图(如果xml文件中没有size也就是图片的宽和高则需要单独对每个图片进行读取,感兴趣可以私聊,这里不展开介绍)

 

        可以看到这几个标签下包含了标注的全部信息,接着进行转换

代码

        核心代码为,提取所需要的信息

size = root.find('size')
width = int(size.find('width').text)
height = int(size.find('height').text)
# 存储name和对应的归一化坐标
objects = []
# 遍历XML中的object标签
for obj in root.findall('object'):name = obj.find('name').textif name in category_to_index:category_index = category_to_index[name]else:continue  # 如果name不在指定类别中,跳过该objectbndbox = obj.find('bndbox')xmin = int(bndbox.find('xmin').text)ymin = int(bndbox.find('ymin').text)xmax = int(bndbox.find('xmax').text)ymax = int(bndbox.find('ymax').text)

        归一化代码如下,这也是YOLO格式的通用归一化代码

x_center = (xmin + xmax) / 2.0
y_center = (ymin + ymax) / 2.0
w = xmax - xmin
h = ymax - yminx = x_center / width
y = y_center / height
w = w / width
h = h / height

        这里最下边四行代码即为txt中每一行后四位数字

完整代码

        完整代码如下

import os
import xml.etree.ElementTree as ET# 定义类别顺序
categories = ['eggplant']
category_to_index = {category: index for index, category in enumerate(categories)}# 定义输入文件夹和输出文件夹
input_folder = r'D:\Annotations'  # 替换为实际的XML文件夹路径
output_folder = r'D:\labels'  # 替换为实际的输出TXT文件夹路径# 确保输出文件夹存在
os.makedirs(output_folder, exist_ok=True)# 遍历输入文件夹中的所有XML文件
for filename in os.listdir(input_folder):if filename.endswith('.xml'):xml_path = os.path.join(input_folder, filename)# 解析XML文件tree = ET.parse(xml_path)root = tree.getroot()# 提取图像的尺寸size = root.find('size')width = int(size.find('width').text)height = int(size.find('height').text)# 存储name和对应的归一化坐标objects = []# 遍历XML中的object标签for obj in root.findall('object'):name = obj.find('name').textif name in category_to_index:category_index = category_to_index[name]else:continue  # 如果name不在指定类别中,跳过该objectbndbox = obj.find('bndbox')xmin = int(bndbox.find('xmin').text)ymin = int(bndbox.find('ymin').text)xmax = int(bndbox.find('xmax').text)ymax = int(bndbox.find('ymax').text)# 转换为中心点坐标和宽高x_center = (xmin + xmax) / 2.0y_center = (ymin + ymax) / 2.0w = xmax - xminh = ymax - ymin# 归一化x = x_center / widthy = y_center / heightw = w / widthh = h / heightobjects.append(f"{category_index} {x} {y} {w} {h}")# 输出结果到对应的TXT文件txt_filename = os.path.splitext(filename)[0] + '.txt'txt_path = os.path.join(output_folder, txt_filename)with open(txt_path, 'w') as f:for obj in objects:f.write(obj + '\n')

拓展代码

        这个代码类别还需要自己获取并填写,这里给出一种更简单的方法,可以省去填写标签列表的环节并且自动类别编号,完整代码如下

import os
import xml.etree.ElementTree as ET
names_set = set()input_folder = r'D:\Annotations'  # 替换为实际的XML文件夹路径
output_folder = r'D:\labels'  # 替换为实际的输出TXT文件夹路径for filename in os.listdir(input_folder):if filename.endswith('.xml'):tree = ET.parse(os.path.join(input_folder, filename))root = tree.getroot()for obj in root.findall('object'):name = obj.find('name').textnames_set.add(name)
# 输出所有的name
categories = []
for name in names_set:categories.append(name)
print(categories)category_to_index = {category: index for index, category in enumerate(categories)}
os.makedirs(output_folder, exist_ok=True)# 遍历输入文件夹中的所有XML文件
for filename in os.listdir(input_folder):if filename.endswith('.xml'):xml_path = os.path.join(input_folder, filename)# 解析XML文件tree = ET.parse(xml_path)root = tree.getroot()# 提取图像的尺寸size = root.find('size')width = int(size.find('width').text)height = int(size.find('height').text)# 存储name和对应的归一化坐标objects = []# 遍历XML中的object标签for obj in root.findall('object'):name = obj.find('name').textif name in category_to_index:category_index = category_to_index[name]else:continue  # 如果name不在指定类别中,跳过该objectbndbox = obj.find('bndbox')xmin = int(bndbox.find('xmin').text)ymin = int(bndbox.find('ymin').text)xmax = int(bndbox.find('xmax').text)ymax = int(bndbox.find('ymax').text)# 转换为中心点坐标和宽高x_center = (xmin + xmax) / 2.0y_center = (ymin + ymax) / 2.0w = xmax - xminh = ymax - ymin# 归一化x = x_center / widthy = y_center / heightw = w / widthh = h / heightobjects.append(f"{category_index} {x} {y} {w} {h}")# 输出结果到对应的TXT文件txt_filename = os.path.splitext(filename)[0] + '.txt'txt_path = os.path.join(output_folder, txt_filename)with open(txt_path, 'w') as f:for obj in objects:f.write(obj + '\n')

http://www.hkea.cn/news/18828/

相关文章:

  • 海口网站建设策划关键词排名优化工具有用吗
  • 请问哪里可以做网站汕头seo
  • 访问国外网站速度慢苏州关键词seo排名
  • 做网站备案照片的要求谷歌seo教程
  • wordpress站点全屏新站如何让百度快速收录
  • wordpress 会议 主题推广排名seo
  • 源码开发网站建设sem与seo的区别
  • 如何查网站的空间防恶意点击软件
  • 单位网站建设收费标准互联网推广引流
  • 网站有中文源码加英文怎么做关键词歌词完整版
  • 建设网站企业银行做网站的平台
  • 如何进行网站建设分析网站推广app软件
  • 做ppt的软件模板下载网站网站服务公司
  • 网站icp备案认证怎么做谷歌网页版入口在线
  • 高安网站建设艺考培训
  • 主流的网站开发技术百度推广后台管理
  • 传奇网站模板免费下载优化网络搜索引擎
  • 提升学历报考什么专业比较好seosem顾问
  • 做违法网站犯法吗推广费用一般多少钱
  • 网站版权该怎么做呢五种常用的网站推广方法
  • 周宁县建设局网站关键词挖掘站网
  • 做第三方团购的平台网站全网线报 实时更新
  • 六安建六安建设网站seo推广代理
  • 网站建设管理经验免费推广渠道有哪些
  • 网站备案信息真实性核验单 打印规格北京百度搜索优化
  • 网站建设有没有十大搜索引擎网站
  • 电子商务实网站的建设课件网站的优化策略方案
  • 喀什网站建设公司营销网络的建设
  • 药店网站模板营销软件代理推广
  • 站长工具seo综合查询columbu cat新闻今天的最新新闻