yolov5训练自己的模型


1.视频图片切片

import cv2

cap = cv2.VideoCapture("tiaowu.mp4")
isOpened = cap.isOpened  # 判断是否打开‘
print(isOpened)
fps = cap.get(cv2.CAP_PROP_FPS)  # 帧率
width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
print(fps, width, height)
i = 0
while (isOpened):
    if i == 5000:
        break
    else:
        i += 1
    (flag, frame) = cap.read()  # 读取每一张 flag frame
    fileName = 'xulie/image' + str(i) + '.jpg'
    print(fileName)
    if flag == True:
        cv2.imwrite(fileName, frame, [cv2.IMWRITE_JPEG_QUALITY, 100])

2.文件标注

https://www.makesense.ai/ 或者用labelimg

在yolov5文件夹下,新建个datasets文件夹,然后在datasets

生成新建文件夹:images(原始图片) train (训练文件夹 图片和txt,文件名称一致 90%)val(5%) test(5%)

3.修改训练文件

  3.1打开 data文件夹下有个 coco128.yaml文件

path: ../datasets 
train: train 
val: val 
test: test

nc : 1 (类别个数)
names 类别名称

 3.2修改model下的yolov5s.yaml

nc:1

 4.开始训练

 python train.py --cfg models/yolov5s.yaml --data data/coco128.yaml --weights yolov5s.pt --epoch 150 --batch-size 4

epoch是指训练轮数,可以从可视化图表看收敛情况,一般100以上吧,也有的简单的50轮就有效果了。我这里150其实多了。(为了方便演示,我下面的截图是用的epoch=10,实际模型我训练了150,那个要好久好久,其实没必要,这种简单的圆形,二三十次就收敛的很好了)

batch-size是一次放入训练的数量,4就是一次放4张图去训练。这个跟电脑性能有关,主要是显卡,我试了试,我这台笔记本最多跑到

5.训练完成

可以看到,它最终是保存了两个结果,last.pt 和 best.pt 顾名思义就是最后一次和最佳一次

结果保存在  runs\train\exp10\weights\   这个路径下,大小都是14M左右,和原始的5s大小相当

 runs\train\exp10\  文件夹下,还保存了一些可视化训练情况的图表,比如有个results.png

 6.使用训练后的模型

 python detect.py --weights runs/train/exp10/weights/best.pt --source data/images/image1919.jpg
 python detect.py --weights runs/train/exp10/weights/best.pt --source data/video/tiaowu.mp4

7.继续训练

python train.py --resume True --cfg models/yolov5s.yaml --data data/coco128.yaml --weights runs/train/exp10/weights/last.pt --epoch 150 --batch-size 4