YOLOV5:数据集制作
总体流程:
labellmg标记(.xml)-> split.py (生成四个集的txt)-> txt2yolo.py -> 各个图像的txt -> 按照标准规范文件夹 -> 制作yaml文件



(这里注意,要把照片全部换成jpg格式,通过函数转换,而且照片名字中不能带中文)

第一步:使用labellmg进行标记



快捷键:



在汇总的时候要检测是不是一张照片对应一张标签:
这里可以设置为中图标,一个照片一个标签,看哪里出问题了。



第二步:用split.py在新文件中生成四个txt,同时在四个txt中分配好了哪些图片是训练集哪些是验证集



split.py文件配置


--xml
C:\Users\zhaohaobing\PycharmProjects\python-yolov5-project\Data_set_processing\imagesplus
--txt
C:\Users\zhaohaobing\PycharmProjects\python-yolov5-project\Data_set_processing\imagespluss

第三步:xml2yolo.py





这里会报的错:
是照片和标签名字中有中文!!!



解决办法:
第一种:
根据报错的文件名字去.xml和.jpg文件夹搜



第二种:
在生成的图片标签txt文件的文件夹种看卡在哪个文件了,再回去找.xml文件中



第四步:random1.py

随机将照片和标签分配到train和valid中

注意,这里不能命名random,因为python中有random函数,pycharm分不清是调函数还是调程序



第五步:标准化数据集文件夹格式



第六步:制作配置文件 data.yaml



配置文件里要写:数据都去哪读,nc类别数目
train: ../train/images
val: ../valid/images

nc: 2
names: ['锡纸', '塑料']