Seedance 2.0实时生成引擎解析(2024唯一官方认证SDK调用手册)

核心内容摘要

3分钟生成专业级视频:Wan Studio 2.5平民化创作革命
Linux用户管理全攻略:从useradd到权限分配,一篇就够了

7大场景玩转开源HLS下载器:从基础到高级的视频流获取全指南

总结区分自监督Self-Supervised Learning没有人工标注标签是从数据自己构造出来的半监督Semi-Supervised Learning一小部分有人工标注 大量无标注数据

自监督是什么核心思想用数据本身来“出题考自己”不找人打标签而是从原始数据里人为制造一个任务这个任务的“正确答案”可以自动得到模型通过做这些“自问自答”的任务学到有用表示。

典型例子

NLP文本任务预测被遮住的词我今天去___吃饭→ 正确答案食堂BERT、GPT 的预训练都是自监督

图像遮住一块图像让模型补全把图像打乱顺序让模型还原

对比学习现在很火同一张图片的不同增强 → 应该“相似”不同图片 → 应该“不同”SimCLR、MoCo 都是自监督

半监督是什么核心思想用少量标注数据带着大量无标注数据一起学现实中标注很贵无标注数据很多那就先用少量标注数据“指路”再把无标注数据也利用起来典型例子图像分类100 张图片有标签猫 / 狗10 万张图片没标签方法先用有标签数据训练模型给无标签数据“猜标签”把猜得很准的也当作训练数据伪标签常见方法Pseudo Label伪标签Consistency Regularization一致性约束FixMatch / Mean Teacher特点

总结用到了人工标注提升标注效率依赖初始标签质量任务通常是明确的下游任务

自监督 vs 半监督对照表维度自监督半监督是否需要人工标签不需要少量标签来源数据自己构造人工 模型预测主要用途预训练 / 表征学习具体任务训练常见位置训练前训练中代表模型BERT、SimCLRFixMatch

星空无限传媒免费入口NBA-星空无限传媒免费入口应用

百度百家号客服电话人工服务

123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123 123