核心内容摘要
男生女生一起对愁愁
一ã€�AI模å�‹è®ç»ƒé—ç�¯æ�§åˆ¶ç³»ç»Ÿä»¥å��å�‘ä¼ æ’为å��馈机制✅ æ�§åˆ¶ç»“æ�„ç›®æ ‡æœ€å°�化æ�Ÿå¤±å‡½æ•°å�³è®©é¢„测尽å�¯èƒ½æ�¥è¿‘真å®�æ ‡ç¾æ�§åˆ¶å™¨ä¼˜åŒ–器如SGDã€�Adam被æ�§å¯¹è±¡ç¥�ç»�网络的å�‚æ•°æ�ƒé‡�ä¸�å��ç½®å��馈信å�·æ�Ÿå¤±å‡½æ•°çš„æ¢¯åº¦é€šè¿‡å��å�‘ä¼ æ’计算。 å��馈å›�è·¯é—ç�¯ 关键点å��å�‘ä¼ æ’ è¯¯å·®å��馈机制将输出端的“å��å·®â€�æ�Ÿå¤±é€�å±‚ä¼ é€’å›�输入端指导å�‚数调整é—ç�¯æ€§æ¯�一次è¿ä»£éƒ½ä¾�赖上一次的输出结æ�œæ�¥ä¿®æ£è‡ªèº«å½¢æˆ�自我优化å›�路稳æ€�ç›®æ ‡æ”¶æ•›åˆ°æ�Ÿå¤±å‡½æ•°çš„局部æ��å°�值ç�†æƒ³æƒ…况下æ�¥è¿‘全局最优。类比如å�Œå¦ç”Ÿå�šé¢˜å��å¯¹ç”æ¡ˆå��馈错题订æ£å�‚数更新下次å�šå¾—更好。二ã€�AI预测æ�¨ç�†å¼€ç�¯æ�§åˆ¶ç³»ç»Ÿâœ… æ�§åˆ¶ç»“æ�„ç›®æ ‡å¯¹æ–°è¾“å…¥å¿«é€Ÿç”Ÿæˆ�输出æ�§åˆ¶å™¨å›ºå®šå�‚æ•°çš„ç¥�ç»�ç½‘ç»œæ— å��馈输出ä¸�用äº�修改模å�‹æœ¬èº«ã€‚â›” æ— å��馈å›�路开ç�¯ 关键点å�‚数冻结è®ç»ƒå®Œæˆ�å��模å�‹ç»“æ�„ä¸�æ�ƒé‡�固定å�•å�‘执行输入 → è¾“å‡ºæ— è‡ªæˆ‘ä¿®æ£èƒ½åŠ›è„†å¼±æ€§è‹¥è¾“å…¥åˆ†å¸ƒå��移如è®ç»ƒç”¨ç™½å¤©å›¾åƒ�测试用夜间图åƒ�性能骤é™�ä½†ç³»ç»Ÿæ— æ³•æ„ŸçŸ¥æˆ–è°ƒæ•´ã€‚ç±»æ¯”èƒŒç†Ÿç”æ¡ˆçš„å¦ç”Ÿå�‚åŠ è€ƒè¯•â€”â€”è‹¥é¢˜ç›®ç¨�å�˜æ— 法ç�°åœºè°ƒæ•´ç–略。三ã€�AI智能体ä¸�具身智能高级é—ç�¯æ�§åˆ¶ç³»ç»Ÿâœ… æ�§åˆ¶ç»“æ�„ç›®æ ‡åœ¨ç�¯å¢ƒä¸æœ€å¤§åŒ–长期奖励或达æˆ�ä»»åŠ¡ç›®æ ‡æ„ŸçŸ¥å™¨ä¼ æ„Ÿå™¨/观测æ�¥å�£æ‘„åƒ�头ã€�麦克é£�ã€�APIç‰æ�§åˆ¶å™¨ç–略网络Policy Network或规划模å�—执行器动作输出电机ã€�API调用ã€�文本生æˆ�å��馈æº�ç�¯å¢ƒè¿”å›�的新状æ€�ä¸�奖励信å�·ã€‚ 感知-决ç–-执行-å��馈é—ç�¯ 关键点æŒ�ç»äº¤äº’智能体ä¸�ç�¯å¢ƒå½¢æˆ�æ°¸ä¸�å�œæ¢çš„交互循ç�¯å��馈驱动å¦ä¹ 通过强化å¦ä¹ 如PPOã€�DQN或在线微调ä¸�æ–优化ç–略具身性Embodiment智能体拥有“身体â€�物ç�†æˆ–虚拟其行为直æ�¥å½±å“�感知输入形æˆ�行动-感知耦å�ˆã€‚类比人类å¦éª‘自行车——摔倒负å��馈→ 调整平衡ç–略更新→ å†�å°�试直至æ�Œæ�¡ã€‚å››ã€�三者对比总结维度AIè®ç»ƒAI预测AI智能体/具身智能æ�§åˆ¶ç±»å�‹é—ç�¯å¼€ç�¯é—ç�¯å��馈å˜åœ¨âœ…æ�Ÿå¤±æ¢¯åº¦â�Œâœ…ç�¯å¢ƒå¥–励/状æ€�å�‚数是å�¦æ›´æ–°æ˜¯å�¦æ˜¯åœ¨çº¿/离线å¦ä¹ ç›®æ ‡å¯¼å�‘最å°�化æ�Ÿå¤±æ‰§è¡Œæ˜ å°„æœ€å¤§åŒ–ç´¯ç§¯å¥–åŠ±é€‚åº”æ€§ç¦»çº¿é€‚åº”æ— åœ¨çº¿è‡ªé€‚åº”å…¸å�‹åº”用模å�‹å¼€å�‘阶段模å�‹éƒ¨ç½²é˜¶æ®µæœºå™¨äººã€�游æˆ�AIã€�自动驾驶五ã€�深层æ„�义AIä»�“工具â€�到“行为主体â€�的演进è®ç»ƒé—ç�¯ → 让AI“å¦ä¼šâ€�æŸ�ç§�能力å¦ä¹ 阶段预测开ç�¯â†’ 让AI“应用â€�æ‰€å¦æ‰§è¡Œé˜¶æ®µæ™ºèƒ½ä½“é—ç�¯â†’ 让AI“活在世界ä¸â€�通过行动改å�˜ç�¯å¢ƒå¹¶ä»�结æ�œä¸å¦ä¹ 自主阶段。æ£å¦‚æ�§åˆ¶è®ºä¹‹çˆ¶ç»´çº³æ‰€è¨€â€œæœ‰æ•ˆçš„行为必须基äº�对结æ�œçš„æ„ŸçŸ¥ã€‚â€�真æ£çš„æ™ºèƒ½ä¸�在äº�计算多快而在äº�能å�¦æ�„建并利用å��馈å›�è·¯å®�ç�°ç›®æ ‡/æ„�图。å…ã€�未æ�¥è¶‹åŠ¿è��å�ˆé—ç�¯è®ç»ƒ-部署一体化模å�‹ä¸Šçº¿å��æŒ�ç»æ”¶é›†ç”¨æˆ·å��馈自动触å�‘å†�è®ç»ƒå¦‚æ�¨è��系统具身预è®ç»ƒåœ¨æ¨¡æ‹Ÿç�¯å¢ƒä¸é€šè¿‡é—ç�¯äº¤äº’预è®ç»ƒé€šç”¨ç–略如Google RT-2AI Agentæ“�作系统具备记忆ã€�规划ã€�å��æ€�能力的é—ç�¯è®¤çŸ¥æ�¶æ�„如AutoGenã€�LangChain Agent。结è¯AI的智能化程度å�–决äº�å…¶é—ç�¯çš„æ·±åº¦ä¸�广度。è®ç»ƒé—ç�¯èµ‹äºˆAI知识预测开ç�¯èµ‹äºˆAI效ç�‡æ™ºèƒ½ä½“é—ç�¯èµ‹äºˆAI生命。当AIä¸�仅能“知é�“â€�还能“行动â€�并“ä»�行动ä¸å¦ä¹ â€�——它便真æ£è¸�å…¥äº†è‡ªä¸»æ™ºèƒ½çš„æ®¿å ‚ã€‚è¿™æ£æ˜¯æ�§åˆ¶è®ºç•™ç»™AI时代的终æ��å�¯ç¤ºã€‚