核心内容摘要
ChatTTS流式处理实战:高并发场景下的语音合成优化方案
数据集格式Pascal VOC格式YOLO格式(不包含分割路径的txt文件仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)1660标注数量(xml文件个数)1660标注数量(txt文件个数)1660标注类别数5所在github仓库firc-dataset标注类别名称(注意yolo格式类别顺序不和这个对应而以labels文件夹classes.txt为准):[dmjrb,dyrb,ejgdl,gfb_zc_rcx,ycdw]每个类别标注的框数dmjrb大面积热斑 框数 1453dyrb单一热斑 框数 3265ejgdl二极管短路 框数 502gfb_zc_rcx光伏板正常热成像 框数 32248ycdw异常低温 框数 5853总框数43321图片分辨率640x640使用标注工具labelImg标注规则对类别进行画矩形框重要说明数据集没有划分训练验证测试集需自行划分特别声明本数据集不对训练的模型或者权重文件精度作任何保证图片预览标注例子