核心内容摘要
从仿真到实战:基于LTspice的H桥电机驱动电路设计与优化
快速了解部分基础信息英文
题目: CLARE: Continual Learning for Vision-Language-Action Models via Autonomous Adapter Routing and Expansion
时间:
2026.
机构: Technical University of Munich (TUM), Robotics Institute Germany
3个英文关键词: Continual Learning, Vision-Language-Action Models (VLA), Parameter-Efficient Fine-Tuning1句话通俗
总结本文干了什么事情本文提出了一种名为CLARE的框架让机器人能在不遗忘旧技能的前提下通过自主添加微小的新模块来持续学习新任务且不需要存储旧数据或依赖任务标签。
研究痛点现有研究不足 / 要解决的具体问题现有的视觉-语言-动作模型VLA在通过微调适应新任务时容易发生“灾难性遗忘”即学会新技能就忘了旧技能现有的持续学习方法通常需要存储大量旧数据回放或依赖任务标识符Oracle这在真实机器人的长期运行中既不现实也不高效。
核心方法
关键技术、模型或研究设计简要提出CLARE框架通过在预训练VLA模型的特定层中插入轻量级的“适配器”Adapters并利用自动编码器判别器根据特征相似性自主决定何时扩展新模块以及推理时路由激活哪个模块。
深入了解部分相比前人创新在哪里完全自主无需任务标识符Task-ID即可在推理时自动路由
无范例Exemplar-free不需要存储旧数据即可避免遗忘
动态扩展仅在特征统计显示任务具有显著新颖性时才扩展参数参数增长极低约2%每任务。
解决方法/算法的通俗解释想象机器人的大脑是一个预训练好的通用模型。
CLARE给这个大脑装上了“可插拔的技能卡”适配器。
当遇到新任务时它会先检查现有的“技能卡”是否适用通过特征相似度判断如果不适用就插一张新的。
在工作时它会自动扫描环境找到最匹配的那张“技能卡”来使用从而既学会了新东西又没丢掉老本事。
解决方法的具体做法模块化适配器在Transformer的Feed-Forward层插入轻量级适配器训练时仅更新适配器参数冻结主干。
自主路由为每个适配器配对一个自动编码器判别器推理时激活重构误差最小即特征最匹配的适配器。
动态扩展策略计算新任务特征与现有判别器的z-score若高于阈值则新增适配器-判别器对否则复用现有适配器。
基于前人的哪些方法基于Vision-Language-Action (VLA) 模型如基于Diffusion/Flow Matching的策略、混合专家系统Mixture-of-Experts, MoE的思想、以及参数高效微调技术如LoRA。
实验设置、数据、评估方式、结论数据基于LIBERO benchmarkLIBERO-90预训练LIBERO-10持续学习测试。
设置Franka机械臂在厨房环境执行10个连续长视野任务如开抽屉、放物品等。
评估指标AUC总体成功率、FWT新任务学习能力、NBT遗忘程度越低越好。
结论CLARE在AUC和NBT指标上显著优于SeqFFT、SeqLoRA、PackNet、ER和LOTUS等基线方法实现了高新任务性能且无灾难性遗忘。
提到的同类工作LOTUS基于技能库和回放的方法SDP (Sparse Diffusion Policy)需要任务标识符的手动路由扩散策略EWC/PackNet基于正则化或剪枝的持续学习方法ER (Experience Replay)基于存储旧数据回放的方法。
和本文相关性最高的3个文献LOTUS: Continual imitation learning for robot manipulation through unsupervised skill discovery.PackNet: Adding a new chapter to a convolutional neural network for incremental learning.LoRA: Low-rank adaptation of large language models.我的研究持续学习的工作在加上新任务训练时也不让vla遗忘旧任务而且参数增长量也较小。
但是VLA选择的是DiT结构。
而且无真机验证。