首页速度优化原装RT-ZC10B罗德与施瓦茨示波器电流探头10MHz 150A

网站优化

lite-avatar形象库开源可部署：基于LiteAvatarGallery的150+2D形象完全免费使用

ComfyUI-Florence2模型加载故障深度修复与系统优化指南

2026-06-08 19:29:48

阅读时长:9分钟

562次阅读

核心内容摘要

千匠网络B2B商城系统：重塑渠道分销，开启数智化新时代

LLMåœ¨AI Agentä¸çš„æ–‡æœ¬é£�æ ¼è¿�ç§»åº”ç”¨å…³é”®è¯�å¤§è¯è¨€æ¨¡å�‹LLMã€�AI Agentã€�æ–‡æœ¬é£�æ ¼è¿�ç§»ã€�è‡ªç„¶è¯è¨€å¤„ç�†ã€�åº”ç”¨åœºæ™¯æ‘˜è¦�æœ¬æ–‡æ·±å…¥æ�¢è®¨äº†å¤§è¯è¨€æ¨¡å�‹LLMåœ¨AI Agentä¸çš„æ–‡æœ¬é£�æ ¼è¿�ç§»åº”ç”¨ã€‚é¦–å…ˆä»‹ç»�äº†ç›¸å…³èƒŒæ™¯åŒ…æ‹¬ç ”ç©¶ç›®çš„ã€�é¢„æœŸè¯»è€…å’Œæ–‡æ¡£ç»“æ�„ç‰ã€‚æ�¥ç�€é˜�è¿°äº†æ ¸å¿ƒæ¦‚å¿µå¦‚LLMå’ŒAI Agentçš„å�Ÿç�†å�Šå…¶è�”ç³»å¹¶ç»™å‡ºäº†ç›¸åº”çš„æ–‡æœ¬ç¤ºæ„�å›¾å’ŒMermaidæµ�ç¨‹å›¾ã€‚è¯¦ç»†è®²è§£äº†æ ¸å¿ƒç®—æ³•å�Ÿç�†å’Œå…·ä½“æ“�ä½œæ¥éª¤ä½¿ç”¨Pythonä»£ç �è¿›è¡Œè¯´æ˜�ã€‚å�Œæ—¶ç»™å‡ºäº†æ•°å¦æ¨¡å�‹å’Œå…¬å¼�å¹¶ä¸¾ä¾‹è¿›è¡Œè§£é‡Šã€‚é€šè¿‡é¡¹ç›®å®�æˆ˜å±•ç¤ºäº†ä»£ç �å®�é™…æ¡ˆä¾‹å�Šè¯¦ç»†è§£é‡Šã€‚åˆ†æ��äº†è¯¥æŠ€æœ¯åœ¨å¤šä¸ªé¢†åŸŸçš„å®�é™…åº”ç”¨åœºæ™¯æ�¨è��äº†ç›¸å…³çš„å¦ä¹ èµ„æº�ã€�å¼€å�‘å·¥å…·æ¡†æ�¶å’Œè®ºæ–‡è‘—ä½œã€‚æœ€å��æ€»ç»“äº†æœªæ�¥å�‘å±•è¶‹åŠ¿ä¸�æŒ‘æˆ˜è§£ç”äº†å¸¸è§�é—®é¢˜å¹¶æ��ä¾›äº†æ‰©å±•é˜…è¯»å’Œå�‚è€ƒèµ„æ–™æ—¨åœ¨ä¸ºè¯»è€…å…¨é�¢å‘ˆç�°LLMåœ¨AI Agentä¸è¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»åº”ç”¨çš„å…¨è²Œã€‚

èƒŒæ™¯ä»‹ç»�

1 ç›®çš„å’ŒèŒƒå›´åœ¨å½“ä»Šè‡ªç„¶è¯è¨€å¤„ç�†é¢†åŸŸå¤§è¯è¨€æ¨¡å�‹LLMçš„å‡ºç�°å¸¦æ�¥äº†å·¨å¤§çš„å�˜é�©ã€‚LLMå…·æœ‰å¼ºå¤§çš„è¯è¨€ç�†è§£å’Œç”Ÿæˆ�èƒ½åŠ›è€ŒAI Agentåˆ™æ˜¯èƒ½å¤Ÿè‡ªä¸»æ‰§è¡Œä»»åŠ¡çš„æ™ºèƒ½å®�ä½“ã€‚å°†LLMåº”ç”¨äº�AI Agentä¸çš„æ–‡æœ¬é£�æ ¼è¿�ç§»å…·æœ‰é‡�è¦�çš„ç ”ç©¶å’Œåº”ç”¨ä»·å€¼ã€‚æœ¬æ–‡çš„ç›®çš„åœ¨äº�æ·±å…¥æ�¢è®¨LLMå¦‚ä½•åœ¨AI Agentä¸å®�ç�°æ–‡æœ¬é£�æ ¼è¿�ç§»åˆ†æ��å…¶æŠ€æœ¯å�Ÿç�†ã€�å®�é™…åº”ç”¨åœºæ™¯ä»¥å�Šæœªæ�¥å�‘å±•è¶‹åŠ¿ã€‚èŒƒå›´æ¶µç›–äº†ä»�æ ¸å¿ƒæ¦‚å¿µçš„é˜�è¿°åˆ°å…·ä½“ç®—æ³•å®�ç�°å†�åˆ°å®�é™…é¡¹ç›®æ¡ˆä¾‹å’Œåº”ç”¨é¢†åŸŸçš„å…¨é�¢åˆ†æ��ã€‚

2 é¢„æœŸè¯»è€…æœ¬æ–‡é¢„æœŸè¯»è€…åŒ…æ‹¬è‡ªç„¶è¯è¨€å¤„ç�†é¢†åŸŸçš„ç ”ç©¶äººå‘˜ã€�AIå¼€å�‘è€…ã€�å¯¹AIæŠ€æœ¯æ„Ÿå…´è¶£çš„å¦ç”Ÿä»¥å�Šç›¸å…³ä¼�ä¸šçš„æŠ€æœ¯äººå‘˜ã€‚ç ”ç©¶äººå‘˜å�¯ä»¥ä»�æœ¬æ–‡ä¸è�·å�–å…³äº�LLMåœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»æ–¹é�¢çš„æœ€æ–°ç ”ç©¶æ€�è·¯å’Œæ–¹æ³•å¼€å�‘è€…å�¯ä»¥å¦ä¹ åˆ°å…·ä½“çš„ç®—æ³•å®�ç�°å’Œä»£ç �æ¡ˆä¾‹ç”¨äº�å®�é™…é¡¹ç›®å¼€å�‘å¦ç”Ÿå�¯ä»¥é€šè¿‡æœ¬æ–‡äº†è§£è¯¥é¢†åŸŸçš„åŸºç¡€çŸ¥è¯†å’Œå‰�æ²¿åŠ¨æ€�ä¼�ä¸šæŠ€æœ¯äººå‘˜å�¯ä»¥äº†è§£è¯¥æŠ€æœ¯åœ¨å®�é™…ä¸šåŠ¡ä¸çš„åº”ç”¨åœºæ™¯å’Œæ½œåœ¨ä»·å€¼ã€‚

3 æ–‡æ¡£ç»“æ�„æ¦‚è¿°æœ¬æ–‡å…±åˆ†ä¸ºå��ä¸ªéƒ¨åˆ†ã€‚ç¬¬ä¸€éƒ¨åˆ†æ˜¯èƒŒæ™¯ä»‹ç»�åŒ…æ‹¬ç›®çš„å’ŒèŒƒå›´ã€�é¢„æœŸè¯»è€…ã€�æ–‡æ¡£ç»“æ�„æ¦‚è¿°å’Œæœ¯è¯è¡¨ç¬¬äºŒéƒ¨åˆ†é˜�è¿°æ ¸å¿ƒæ¦‚å¿µä¸�è�”ç³»ç»™å‡ºæ ¸å¿ƒæ¦‚å¿µå�Ÿç�†å’Œæ�¶æ�„çš„æ–‡æœ¬ç¤ºæ„�å›¾å’ŒMermaidæµ�ç¨‹å›¾ç¬¬ä¸‰éƒ¨åˆ†è¯¦ç»†è®²è§£æ ¸å¿ƒç®—æ³•å�Ÿç�†å’Œå…·ä½“æ“�ä½œæ¥éª¤ä½¿ç”¨Pythonä»£ç �è¿›è¡Œè¯´æ˜�ç¬¬å››éƒ¨åˆ†ç»™å‡ºæ•°å¦æ¨¡å�‹å’Œå…¬å¼�å¹¶è¿›è¡Œè¯¦ç»†è®²è§£å’Œä¸¾ä¾‹è¯´æ˜�ç¬¬äº”éƒ¨åˆ†æ˜¯é¡¹ç›®å®�æˆ˜åŒ…æ‹¬å¼€å�‘ç�¯å¢ƒæ�å»ºã€�æº�ä»£ç �è¯¦ç»†å®�ç�°å’Œä»£ç �è§£è¯»ç¬¬å…éƒ¨åˆ†åˆ†æ��å®�é™…åº”ç”¨åœºæ™¯ç¬¬ä¸ƒéƒ¨åˆ†æ�¨è��ç›¸å…³çš„å·¥å…·å’Œèµ„æº�åŒ…æ‹¬å¦ä¹ èµ„æº�ã€�å¼€å�‘å·¥å…·æ¡†æ�¶å’Œè®ºæ–‡è‘—ä½œç¬¬å…«éƒ¨åˆ†æ€»ç»“æœªæ�¥å�‘å±•è¶‹åŠ¿ä¸�æŒ‘æˆ˜ç¬¬ä¹�éƒ¨åˆ†æ˜¯é™„å½•è§£ç”å¸¸è§�é—®é¢˜ç¬¬å��éƒ¨åˆ†æ��ä¾›æ‰©å±•é˜…è¯»å’Œå�‚è€ƒèµ„æ–™ã€‚

4 æœ¯è¯è¡¨

1.

1 æ ¸å¿ƒæœ¯è¯å®šä¹‰å¤§è¯è¨€æ¨¡å�‹LLMæ˜¯ä¸€ç§�åŸºäº�æ·±åº¦å¦ä¹ çš„è¯è¨€æ¨¡å�‹é€šè¿‡åœ¨å¤§è§„æ¨¡æ–‡æœ¬æ•°æ�®ä¸Šè¿›è¡Œè®ç»ƒå¦ä¹ è¯è¨€çš„æ¨¡å¼�å’Œè§„å¾‹èƒ½å¤Ÿå®Œæˆ�å¤šç§�è‡ªç„¶è¯è¨€å¤„ç�†ä»»åŠ¡å¦‚æ–‡æœ¬ç”Ÿæˆ�ã€�é—®ç”ç³»ç»Ÿç‰ã€‚AI Agentæ˜¯ä¸€ç§�èƒ½å¤Ÿæ„ŸçŸ¥ç�¯å¢ƒã€�è‡ªä¸»å†³ç–å¹¶æ‰§è¡Œä»»åŠ¡çš„æ™ºèƒ½å®�ä½“å®ƒå�¯ä»¥ä¸�å¤–éƒ¨ç�¯å¢ƒè¿›è¡Œäº¤äº’ä»¥å®�ç�°ç‰¹å®šçš„ç›®æ ‡ã€‚æ–‡æœ¬é£�æ ¼è¿�ç§»æŒ‡å°†ä¸€æ®µæ–‡æœ¬çš„é£�æ ¼ä»�ä¸€ç§�ç±»å�‹è½¬æ�¢ä¸ºå�¦ä¸€ç§�ç±»å�‹ä¾‹å¦‚å°†æ£å¼�é£�æ ¼çš„æ–‡æœ¬è½¬æ�¢ä¸ºå�£è¯åŒ–é£�æ ¼çš„æ–‡æœ¬æˆ–è€…å°†æ–°é—»æŠ¥é�“é£�æ ¼çš„æ–‡æœ¬è½¬æ�¢ä¸ºå°�è¯´é£�æ ¼çš„æ–‡æœ¬ã€‚

1.

2 ç›¸å…³æ¦‚å¿µè§£é‡Šè‡ªç„¶è¯è¨€å¤„ç�†NLPæ˜¯äººå·¥æ™ºèƒ½çš„ä¸€ä¸ªé‡�è¦�é¢†åŸŸæ—¨åœ¨è®©è®¡ç®—æœºèƒ½å¤Ÿç�†è§£ã€�å¤„ç�†å’Œç”Ÿæˆ�äººç±»è¯è¨€ã€‚LLMå’Œæ–‡æœ¬é£�æ ¼è¿�ç§»éƒ½æ˜¯è‡ªç„¶è¯è¨€å¤„ç�†çš„å…·ä½“åº”ç”¨ã€‚æ·±åº¦å¦ä¹ æ˜¯ä¸€ç§�åŸºäº�äººå·¥ç¥�ç»�ç½‘ç»œçš„æœºå™¨å¦ä¹ æ–¹æ³•é€šè¿‡æ�„å»ºå¤šå±‚ç¥�ç»�ç½‘ç»œæ�¥å¦ä¹ æ•°æ�®çš„å¤�æ�‚æ¨¡å¼�å’Œç‰¹å¾�ã€‚LLMé€šå¸¸åŸºäº�æ·±åº¦å¦ä¹ æ�¶æ�„å¦‚Transformerã€‚

1.

3 ç¼©ç•¥è¯�åˆ—è¡¨LLMLarge Language Modelå¤§è¯è¨€æ¨¡å�‹AIArtificial Intelligenceäººå·¥æ™ºèƒ½NLPNatural Language Processingè‡ªç„¶è¯è¨€å¤„ç�†

æ ¸å¿ƒæ¦‚å¿µä¸�è�”ç³»æ ¸å¿ƒæ¦‚å¿µå�Ÿç�†å¤§è¯è¨€æ¨¡å�‹LLMå¤§è¯è¨€æ¨¡å�‹åŸºäº�æ·±åº¦å¦ä¹ æŠ€æœ¯é€šå¸¸é‡‡ç”¨Transformeræ�¶æ�„ã€‚Transformeræ�¶æ�„ä¸çš„æ³¨æ„�åŠ›æœºåˆ¶ä½¿å¾—æ¨¡å�‹èƒ½å¤Ÿæ›´å¥½åœ°æ�•æ�‰æ–‡æœ¬ä¸çš„é•¿è·�ç¦»ä¾�èµ–å…³ç³»ã€‚åœ¨è®ç»ƒè¿‡ç¨‹ä¸LLMåœ¨å¤§è§„æ¨¡çš„æ–‡æœ¬æ•°æ�®ä¸Šè¿›è¡Œæ— ç›‘ç�£å¦ä¹ å¦ä¹ è¯è¨€çš„ç»Ÿè®¡è§„å¾‹å’Œè¯ä¹‰ä¿¡æ�¯ã€‚è®ç»ƒå®Œæˆ�å��LLMå�¯ä»¥æ ¹æ�®è¾“å…¥çš„æ–‡æœ¬ç”Ÿæˆ�å�ˆç�†çš„è¾“å‡ºã€‚ä¾‹å¦‚è¾“å…¥ä¸€ä¸ªé—®é¢˜LLMå�¯ä»¥ç”Ÿæˆ�ç›¸åº”çš„ç”æ¡ˆã€‚AI AgentAI Agentæ˜¯ä¸€ä¸ªå…·æœ‰è‡ªä¸»æ€§å’Œæ™ºèƒ½æ€§çš„å®�ä½“å®ƒå�¯ä»¥æ„ŸçŸ¥ç�¯å¢ƒä¸çš„ä¿¡æ�¯æ ¹æ�®é¢„è®¾çš„ç›®æ ‡å’Œè§„åˆ™è¿›è¡Œå†³ç–å¹¶æ‰§è¡Œç›¸åº”çš„è¡ŒåŠ¨ã€‚AI Agenté€šå¸¸ç”±æ„ŸçŸ¥æ¨¡å�—ã€�å†³ç–æ¨¡å�—å’Œæ‰§è¡Œæ¨¡å�—ç»„æˆ�ã€‚æ„ŸçŸ¥æ¨¡å�—è´Ÿè´£è�·å�–ç�¯å¢ƒä¿¡æ�¯å†³ç–æ¨¡å�—æ ¹æ�®æ„ŸçŸ¥åˆ°çš„ä¿¡æ�¯å’Œç›®æ ‡è¿›è¡Œå†³ç–æ‰§è¡Œæ¨¡å�—åˆ™æ‰§è¡Œå†³ç–ç»“æ�œã€‚æ–‡æœ¬é£�æ ¼è¿�ç§»æ–‡æœ¬é£�æ ¼è¿�ç§»çš„ç›®æ ‡æ˜¯å°†è¾“å…¥æ–‡æœ¬çš„é£�æ ¼è½¬æ�¢ä¸ºæŒ‡å®šçš„ç›®æ ‡é£�æ ¼ã€‚å®�ç�°æ–‡æœ¬é£�æ ¼è¿�ç§»çš„æ–¹æ³•æœ‰å¤šç§�å…¶ä¸ä¸€ç§�å¸¸è§�çš„æ–¹æ³•æ˜¯åŸºäº�é¢„è®ç»ƒçš„è¯è¨€æ¨¡å�‹ã€‚é€šè¿‡å¯¹è¾“å…¥æ–‡æœ¬è¿›è¡Œç¼–ç �ç„¶å��ç»“å�ˆç›®æ ‡é£�æ ¼çš„ç‰¹å¾�ç”Ÿæˆ�å…·æœ‰ç›®æ ‡é£�æ ¼çš„æ–‡æœ¬ã€‚æ�¶æ�„çš„æ–‡æœ¬ç¤ºæ„�å›¾---------------- | å¤§è¯è¨€æ¨¡å�‹ | ---------------- | v ---------------- | æ–‡æœ¬é£�æ ¼è¿�ç§» | ---------------- | v ---------------- | AI Agent | ----------------è¿™ä¸ªç¤ºæ„�å›¾å±•ç¤ºäº†LLMã€�æ–‡æœ¬é£�æ ¼è¿�ç§»å’ŒAI Agentä¹‹é—´çš„å…³ç³»ã€‚LLMä¸ºæ–‡æœ¬é£�æ ¼è¿�ç§»æ��ä¾›äº†å¼ºå¤§çš„è¯è¨€å¤„ç�†èƒ½åŠ›æ–‡æœ¬é£�æ ¼è¿�ç§»å°†è¾“å…¥æ–‡æœ¬è½¬æ�¢ä¸ºç‰¹å®šé£�æ ¼çš„æ–‡æœ¬ç„¶å��AI Agentå�¯ä»¥ä½¿ç”¨è¿™äº›é£�æ ¼åŒ–çš„æ–‡æœ¬è¿›è¡Œå�„ç§�ä»»åŠ¡ã€‚Mermaidæµ�ç¨‹å›¾è¾“å…¥æ–‡æœ¬å¤§è¯è¨€æ¨¡å�‹ç¼–ç �ç›®æ ‡é£�æ ¼ç‰¹å¾�æ��å�–æ–‡æœ¬é£�æ ¼è¿�ç§»ç”Ÿæˆ�AI Agentä½¿ç”¨é£�æ ¼åŒ–æ–‡æœ¬è¾“å‡ºç»“æ�œè¯¥æµ�ç¨‹å›¾å±•ç¤ºäº†ä»�è¾“å…¥æ–‡æœ¬åˆ°æœ€ç»ˆè¾“å‡ºç»“æ�œçš„æ•´ä¸ªè¿‡ç¨‹ã€‚é¦–å…ˆè¾“å…¥æ–‡æœ¬ç»�è¿‡å¤§è¯è¨€æ¨¡å�‹è¿›è¡Œç¼–ç �ç„¶å��æ��å�–ç›®æ ‡é£�æ ¼çš„ç‰¹å¾�æ�¥ç�€è¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»ç”Ÿæˆ�å…·æœ‰ç›®æ ‡é£�æ ¼çš„æ–‡æœ¬AI Agentä½¿ç”¨è¿™äº›é£�æ ¼åŒ–çš„æ–‡æœ¬æ‰§è¡Œä»»åŠ¡æœ€å��è¾“å‡ºç»“æ�œã€‚

æ ¸å¿ƒç®—æ³•å�Ÿç�† å…·ä½“æ“�ä½œæ¥éª¤æ ¸å¿ƒç®—æ³•å�Ÿç�†åœ¨ä½¿ç”¨LLMè¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»æ—¶æˆ‘ä»¬å�¯ä»¥é‡‡ç”¨åŸºäº�å¾®è°ƒçš„æ–¹æ³•ã€‚å…·ä½“æ�¥è¯´æˆ‘ä»¬é¦–å…ˆä½¿ç”¨ä¸€ä¸ªé¢„è®ç»ƒçš„å¤§è¯è¨€æ¨¡å�‹ç„¶å��åœ¨ç‰¹å®šçš„æ–‡æœ¬é£�æ ¼è¿�ç§»æ•°æ�®é›†ä¸Šå¯¹è¯¥æ¨¡å�‹è¿›è¡Œå¾®è°ƒã€‚åœ¨å¾®è°ƒè¿‡ç¨‹ä¸æ¨¡å�‹å¦ä¹ å°†è¾“å…¥æ–‡æœ¬è½¬æ�¢ä¸ºç›®æ ‡é£�æ ¼çš„æ–‡æœ¬ã€‚å…·ä½“æ“�ä½œæ¥éª¤æ¥éª¤1æ•°æ�®å‡†å¤‡æ”¶é›†ç”¨äº�æ–‡æœ¬é£�æ ¼è¿�ç§»çš„æ•°æ�®é›†ã€‚æ•°æ�®é›†åº”åŒ…å�«è¾“å…¥æ–‡æœ¬å’Œå¯¹åº”çš„ç›®æ ‡é£�æ ¼æ–‡æœ¬ã€‚ä¾‹å¦‚å¦‚æ�œè¦�è¿›è¡Œæ£å¼�é£�æ ¼åˆ°å�£è¯åŒ–é£�æ ¼çš„è¿�ç§»æ•°æ�®é›†åº”åŒ…å�«æ£å¼�é£�æ ¼çš„æ–‡æœ¬å’Œå¯¹åº”çš„å�£è¯åŒ–é£�æ ¼çš„æ–‡æœ¬ã€‚æ¥éª¤2æ¨¡å�‹é€‰æ‹©é€‰æ‹©ä¸€ä¸ªå�ˆé€‚çš„é¢„è®ç»ƒå¤§è¯è¨€æ¨¡å�‹å¦‚GPTç³»åˆ—ã€�BERTç‰ã€‚è¿™äº›æ¨¡å�‹å·²ç»�åœ¨å¤§è§„æ¨¡çš„æ–‡æœ¬æ•°æ�®ä¸Šè¿›è¡Œäº†é¢„è®ç»ƒå…·æœ‰å¼ºå¤§çš„è¯è¨€ç�†è§£å’Œç”Ÿæˆ�èƒ½åŠ›ã€‚æ¥éª¤3å¾®è°ƒæ¨¡å�‹åœ¨å‡†å¤‡å¥½çš„æ•°æ�®é›†ä¸Šå¯¹é¢„è®ç»ƒæ¨¡å�‹è¿›è¡Œå¾®è°ƒã€‚å¾®è°ƒè¿‡ç¨‹ä¸ä½¿ç”¨å�ˆé€‚çš„æ�Ÿå¤±å‡½æ•°æ�¥ä¼˜åŒ–æ¨¡å�‹çš„å�‚æ•°ä½¿å¾—æ¨¡å�‹èƒ½å¤Ÿæ›´å¥½åœ°è¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»ã€‚æ¥éª¤4æ�¨ç�†ä½¿ç”¨å¾®è°ƒå��çš„æ¨¡å�‹è¿›è¡Œæ�¨ç�†ã€‚è¾“å…¥éœ€è¦�è¿›è¡Œé£�æ ¼è¿�ç§»çš„æ–‡æœ¬æ¨¡å�‹å°†è¾“å‡ºå…·æœ‰ç›®æ ‡é£�æ ¼çš„æ–‡æœ¬ã€‚Pythonæº�ä»£ç �è¯¦ç»†é˜�è¿°importtorchfromtransformersimportGPT2LMHeadModel,GPT2Tokenizer,AdamW# æ¥éª¤1æ•°æ�®å‡†å¤‡input_texts[This is a formal statement.,The meeting will commence at 3 PM.]target_texts[This is a normal statement, you know.,The meeting will start at 3 PM.]# æ¥éª¤2æ¨¡å�‹é€‰æ‹©tokenizerGPT2Tokenizer.from_pretrained(gpt

modelGPT2LMHeadModel.from_pretrained(gpt

# æ¥éª¤3å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

epochs3forepochinrange(epochs):total_loss0forinput_text,target_textinzip(input_texts,target_texts):input_idstokenizer.encode(input_text,return_tensorspt)target_idstokenizer.encode(target_text,return_tensorspt)outputsmodel(input_ids,labelstarget_ids)lossoutputs.loss optimizer.zero_grad()loss.backward()optimizer.step()total_lossloss.item()print(fEpoch{epoch1}, Loss:{total_loss/len(input_texts)})# æ¥éª¤4æ�¨ç�†input_textThis is a formal report.input_idstokenizer.encode(input_text,return_tensorspt)outputmodel.generate(input_ids)output_texttokenizer.decode(output[0],skip_special_tokensTrue)print(Input text:,input_text)print(Output text:,output_text)åœ¨ä¸Šè¿°ä»£ç �ä¸æˆ‘ä»¬é¦–å…ˆå‡†å¤‡äº†è¾“å…¥æ–‡æœ¬å’Œç›®æ ‡æ–‡æœ¬ã€‚ç„¶å��é€‰æ‹©äº†GPT2æ¨¡å�‹å’Œå¯¹åº”çš„åˆ†è¯�å™¨ã€‚æ�¥ç�€å¯¹æ¨¡å�‹è¿›è¡Œäº†å¾®è°ƒä½¿ç”¨AdamWä¼˜åŒ–å™¨å’Œäº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°ã€‚æœ€å��ä½¿ç”¨å¾®è°ƒå��çš„æ¨¡å�‹è¿›è¡Œæ�¨ç�†å°†è¾“å…¥æ–‡æœ¬è¿›è¡Œé£�æ ¼è¿�ç§»å¹¶è¾“å‡ºç»“æ�œã€‚

æ•°å¦æ¨¡å�‹å’Œå…¬å¼� è¯¦ç»†è®²è§£ ä¸¾ä¾‹è¯´æ˜�æ•°å¦æ¨¡å�‹åœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»ä¸æˆ‘ä»¬å�¯ä»¥ä½¿ç”¨åŸºäº�æ�¡ä»¶æ¦‚ç�‡çš„æ¨¡å�‹ã€‚è®¾è¾“å…¥æ–‡æœ¬ä¸ºx xxç›®æ ‡é£�æ ¼æ–‡æœ¬ä¸ºy yyæˆ‘ä»¬çš„ç›®æ ‡æ˜¯æœ€å¤§åŒ–æ�¡ä»¶æ¦‚ç�‡P ( y âˆ£ x ) P(y|x)P(yâˆ£x)ã€‚å…¬å¼�åœ¨å¾®è°ƒè¿‡ç¨‹ä¸æˆ‘ä»¬é€šå¸¸ä½¿ç”¨äº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°æ�¥ä¼˜åŒ–æ¨¡å�‹çš„å�‚æ•°ã€‚äº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°çš„å…¬å¼�ä¸ºL âˆ’ âˆ‘ i 1 N log â�¡ P ( y i âˆ£ x i ) L -\sum_{i1}^{N} \log P(y_i|x_i)Lâˆ’i1âˆ‘Nâ€‹logP(yiâ€‹âˆ£xiâ€‹)å…¶ä¸N NNæ˜¯æ•°æ�®é›†çš„æ ·æœ¬æ•°é‡�x i x_ixiâ€‹æ˜¯ç¬¬i iiä¸ªè¾“å…¥æ–‡æœ¬y i y_iyiâ€‹æ˜¯ç¬¬i iiä¸ªç›®æ ‡é£�æ ¼æ–‡æœ¬ã€‚è¯¦ç»†è®²è§£äº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°è¡¡é‡�äº†æ¨¡å�‹é¢„æµ‹çš„æ¦‚ç�‡åˆ†å¸ƒä¸�çœŸå®�æ ‡ç¾çš„æ¦‚ç�‡åˆ†å¸ƒä¹‹é—´çš„å·®å¼‚ã€‚åœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»ä¸æˆ‘ä»¬å¸Œæœ›æ¨¡å�‹ç”Ÿæˆ�çš„ç›®æ ‡é£�æ ¼æ–‡æœ¬çš„æ¦‚ç�‡å°½å�¯èƒ½æ�¥è¿‘çœŸå®�çš„ç›®æ ‡é£�æ ¼æ–‡æœ¬ã€‚é€šè¿‡æœ€å°�åŒ–äº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°æˆ‘ä»¬å�¯ä»¥è°ƒæ•´æ¨¡å�‹çš„å�‚æ•°ä½¿å¾—æ¨¡å�‹èƒ½å¤Ÿæ›´å¥½åœ°è¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»ã€‚ä¸¾ä¾‹è¯´æ˜�å�‡è®¾æˆ‘ä»¬æœ‰ä¸€ä¸ªç®€å�•çš„æ•°æ�®é›†åŒ…å�«ä¸¤ä¸ªæ ·æœ¬è¾“å…¥æ–‡æœ¬x 1 x_1x1â€‹â€œThis is a formal sentence.â€�ç›®æ ‡é£�æ ¼æ–‡æœ¬y 1 y_1y1â€‹â€œThis is a normal sentence.â€�è¾“å…¥æ–‡æœ¬x 2 x_2x2â€‹â€œThe event will occur tomorrow.â€�ç›®æ ‡é£�æ ¼æ–‡æœ¬y 2 y_2y2â€‹â€œThe event will happen tomorrow.â€�åœ¨å¾®è°ƒè¿‡ç¨‹ä¸æ¨¡å�‹ä¼šæ ¹æ�®è¾“å…¥æ–‡æœ¬x i x_ixiâ€‹ç”Ÿæˆ�é¢„æµ‹çš„ç›®æ ‡é£�æ ¼æ–‡æœ¬y ^ i \hat{y}_iy^â€‹iâ€‹ã€‚äº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°ä¼šè®¡ç®—é¢„æµ‹çš„ç›®æ ‡é£�æ ¼æ–‡æœ¬çš„æ¦‚ç�‡åˆ†å¸ƒä¸�çœŸå®�ç›®æ ‡é£�æ ¼æ–‡æœ¬çš„æ¦‚ç�‡åˆ†å¸ƒä¹‹é—´çš„å·®å¼‚ã€‚é€šè¿‡ä¸�æ–è°ƒæ•´æ¨¡å�‹çš„å�‚æ•°ä½¿å¾—äº¤å�‰ç†µæ�Ÿå¤±å‡½æ•°çš„å€¼é€�æ¸�å‡�å°�ä»�è€Œæ��é«˜æ¨¡å�‹çš„æ–‡æœ¬é£�æ ¼è¿�ç§»èƒ½åŠ›ã€‚

é¡¹ç›®å®�æˆ˜ä»£ç �å®�é™…æ¡ˆä¾‹å’Œè¯¦ç»†è§£é‡Šè¯´æ˜�

1 å¼€å�‘ç�¯å¢ƒæ�å»ºå®‰è£…Pythoné¦–å…ˆç¡®ä¿�ä½ å·²ç»�å®‰è£…äº†Python

6æˆ–æ›´é«˜ç‰ˆæœ¬ã€‚ä½ å�¯ä»¥ä»�Pythonå®˜æ–¹ç½‘ç«™https://www.python.org/downloads/ä¸‹è½½å¹¶å®‰è£…Pythonã€‚å®‰è£…å¿…è¦�çš„åº“ä½¿ç”¨ä»¥ä¸‹å‘½ä»¤å®‰è£…å¿…è¦�çš„åº“pipinstalltorch transformerstorchæ˜¯PyTorchæ·±åº¦å¦ä¹ æ¡†æ�¶transformersæ˜¯Hugging Faceæ��ä¾›çš„ç”¨äº�è‡ªç„¶è¯è¨€å¤„ç�†çš„åº“åŒ…å�«äº†å�„ç§�é¢„è®ç»ƒçš„è¯è¨€æ¨¡å�‹ã€‚

2 æº�ä»£ç �è¯¦ç»†å®�ç�°å’Œä»£ç �è§£è¯»importtorchfromtransformersimportGPT2LMHeadModel,GPT2Tokenizer,AdamW# æ•°æ�®å‡†å¤‡input_texts[This is a formal description.,The project has achieved significant progress.]target_texts[This is a normal description, like you usually say.,The project has made great progress.]# æ¨¡å�‹é€‰æ‹©tokenizerGPT2Tokenizer.from_pretrained(gpt

modelGPT2LMHeadModel.from_pretrained(gpt

# å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

epochs5forepochinrange(epochs):total_loss0forinput_text,target_textinzip(input_texts,target_texts):# å°†è¾“å…¥æ–‡æœ¬å’Œç›®æ ‡æ–‡æœ¬è½¬æ�¢ä¸ºæ¨¡å�‹å�¯ä»¥å¤„ç�†çš„å¼ é‡�input_idstokenizer.encode(input_text,return_tensorspt)target_idstokenizer.encode(target_text,return_tensorspt)# å‰�å�‘ä¼ æ’outputsmodel(input_ids,labelstarget_ids)lossoutputs.loss# å��å�‘ä¼ æ’å’Œå�‚æ•°æ›´æ–°optimizer.zero_grad()loss.backward()optimizer.step()total_lossloss.item()print(fEpoch{epoch1}, Loss:{total_loss/len(input_texts)})# æ�¨ç�†input_textThis is a formal announcement.input_idstokenizer.encode(input_text,return_tensorspt)outputmodel.generate(input_ids)output_texttokenizer.decode(output[0],skip_special_tokensTrue)print(Input text:,input_text)print(Output text:,output_text)ä»£ç �è§£è¯»ä¸�åˆ†æ��æ•°æ�®å‡†å¤‡input_textsåˆ—è¡¨åŒ…å�«äº†éœ€è¦�è¿›è¡Œé£�æ ¼è¿�ç§»çš„è¾“å…¥æ–‡æœ¬target_textsåˆ—è¡¨åŒ…å�«äº†å¯¹åº”çš„ç›®æ ‡é£�æ ¼æ–‡æœ¬ã€‚æ¨¡å�‹é€‰æ‹©ä½¿ç”¨GPT2Tokenizerå¯¹æ–‡æœ¬è¿›è¡Œåˆ†è¯�ä½¿ç”¨GPT2LMHeadModelä½œä¸ºé¢„è®ç»ƒæ¨¡å�‹ã€‚å¾®è°ƒæ¨¡å�‹ä½¿ç”¨AdamWä¼˜åŒ–å™¨å¯¹æ¨¡å�‹è¿›è¡Œå¾®è°ƒã€‚åœ¨æ¯�ä¸ªepochä¸é��å�†æ•°æ�®é›†çš„æ¯�ä¸ªæ ·æœ¬è®¡ç®—æ�Ÿå¤±å¹¶è¿›è¡Œå��å�‘ä¼ æ’å’Œå�‚æ•°æ›´æ–°ã€‚æ�¨ç�†è¾“å…¥ä¸€ä¸ªæ–°çš„æ–‡æœ¬ä½¿ç”¨å¾®è°ƒå��çš„æ¨¡å�‹è¿›è¡Œç”Ÿæˆ�æœ€å��å°†ç”Ÿæˆ�çš„ç»“æ�œè§£ç �ä¸ºæ–‡æœ¬å¹¶è¾“å‡ºã€‚

å®�é™…åº”ç”¨åœºæ™¯æ–‡å¦åˆ›ä½œåœ¨æ–‡å¦åˆ›ä½œä¸ä½œè€…å�¯èƒ½éœ€è¦�æ ¹æ�®ä¸�å�Œçš„é£�æ ¼è¦�æ±‚åˆ›ä½œä½œå“�ã€‚AI Agentç»“å�ˆLLMçš„æ–‡æœ¬é£�æ ¼è¿�ç§»èƒ½åŠ›å�¯ä»¥å¸®åŠ©ä½œè€…å¿«é€Ÿç”Ÿæˆ�å…·æœ‰ç‰¹å®šé£�æ ¼çš„æ–‡æœ¬å¦‚å�¤ä»£è¯—è¯�é£�æ ¼ã€�ç�°ä»£å°�è¯´é£�æ ¼ç‰ã€‚ä¾‹å¦‚ä½œè€…å�¯ä»¥è¾“å…¥ä¸€æ®µæ™®é€šçš„æ��è¿°æ€§æ–‡æœ¬AI Agentå°†å…¶è½¬æ�¢ä¸ºå�¤ä»£è¯—è¯�é£�æ ¼çš„æ–‡æœ¬ä¸ºåˆ›ä½œæ��ä¾›ç�µæ„Ÿã€‚å®¢æœ�æœ�åŠ¡åœ¨å®¢æœ�æœ�åŠ¡ä¸ä¸�å�Œçš„å®¢æˆ·å�¯èƒ½å–œæ¬¢ä¸�å�Œçš„æ²Ÿé€šé£�æ ¼ã€‚AI Agentå�¯ä»¥æ ¹æ�®å®¢æˆ·çš„å��å¥½å°†æ ‡å‡†çš„å®¢æœ�å›�å¤�æ–‡æœ¬è½¬æ�¢ä¸ºç›¸åº”çš„é£�æ ¼å¦‚å�‹å¥½äº²åˆ‡é£�æ ¼ã€�ä¸“ä¸šä¸¥è°¨é£�æ ¼ç‰ã€‚è¿™æ ·å�¯ä»¥æ��é«˜å®¢æˆ·çš„æ»¡æ„�åº¦å¢�å¼ºå®¢æˆ·ä¸�ä¼�ä¸šä¹‹é—´çš„äº’åŠ¨ã€‚å¹¿å‘Šè�¥é”€åœ¨å¹¿å‘Šè�¥é”€ä¸ä¸�å�Œçš„äº§å“�å’Œç›®æ ‡å�—ä¼—éœ€è¦�ä¸�å�Œçš„å¹¿å‘Šé£�æ ¼ã€‚AI Agentå�¯ä»¥æ ¹æ�®äº§å“�ç‰¹ç‚¹å’Œç›®æ ‡å�—ä¼—çš„å–œå¥½å°†äº§å“�ä¿¡æ�¯è½¬æ�¢ä¸ºå…·æœ‰å�¸å¼•åŠ›çš„å¹¿å‘Šæ–‡æ¡ˆå¦‚å¹½é»˜é£�è¶£é£�æ ¼ã€�æ¿€æƒ…æ¾�æ¹ƒé£�æ ¼ç‰ã€‚ä»�è€Œæ��é«˜å¹¿å‘Šçš„æ•ˆæ�œå�¸å¼•æ›´å¤šçš„æ¶ˆè´¹è€…ã€‚æ•™è‚²é¢†åŸŸåœ¨æ•™è‚²é¢†åŸŸæ•™å¸ˆå�¯ä»¥ä½¿ç”¨AI Agentå°†å¦æœ¯æ€§çš„æ–‡æœ¬è½¬æ�¢ä¸ºé€‚å�ˆå¦ç”Ÿç�†è§£çš„é£�æ ¼å¦‚é€šä¿—æ˜“æ‡‚é£�æ ¼ã€�ç”ŸåŠ¨æœ‰è¶£é£�æ ¼ç‰ã€‚å¸®åŠ©å¦ç”Ÿæ›´å¥½åœ°ç�†è§£å¦ä¹ å†…å®¹æ��é«˜å¦ä¹ æ•ˆæ�œã€‚

å·¥å…·å’Œèµ„æº�æ�¨è��

1 å¦ä¹ èµ„æº�æ�¨è��

7.

1 ä¹¦ç±�æ�¨è��ã€Šè‡ªç„¶è¯è¨€å¤„ç�†å…¥é—¨ã€‹è¿™æœ¬ä¹¦å…¨é�¢ä»‹ç»�äº†è‡ªç„¶è¯è¨€å¤„ç�†çš„åŸºç¡€çŸ¥è¯†å’Œå¸¸ç”¨æŠ€æœ¯é€‚å�ˆåˆ�å¦è€…å…¥é—¨ã€‚ã€Šæ·±åº¦å¦ä¹ ã€‹æ·±åº¦å¦ä¹ æ˜¯LLMçš„æ ¸å¿ƒæŠ€æœ¯è¿™æœ¬ä¹¦æ·±å…¥è®²è§£äº†æ·±åº¦å¦ä¹ çš„å�Ÿç�†å’Œç®—æ³•ã€‚ã€ŠTransformersåŸºç¡€æ•™ç¨‹ã€‹è¯¦ç»†ä»‹ç»�äº†Transformeræ�¶æ�„å�Šå…¶åœ¨è‡ªç„¶è¯è¨€å¤„ç�†ä¸çš„åº”ç”¨ã€‚

7.

2 åœ¨çº¿è¯¾ç¨‹Courseraä¸Šçš„â€œNatural Language Processing Specializationâ€�è¯¥è¯¾ç¨‹ç”±çŸ¥å��æ•™æ�ˆæ�ˆè¯¾æ¶µç›–äº†è‡ªç„¶è¯è¨€å¤„ç�†çš„å�„ä¸ªæ–¹é�¢ã€‚edXä¸Šçš„â€œDeep Learning for Natural Language Processingâ€�ä¸“æ³¨äº�æ·±åº¦å¦ä¹ åœ¨è‡ªç„¶è¯è¨€å¤„ç�†ä¸çš„åº”ç”¨ã€‚å“”å“©å“”å“©ä¸Šçš„ä¸€äº›è‡ªç„¶è¯è¨€å¤„ç�†ç›¸å…³çš„æ•™ç¨‹è§†é¢‘è¿™äº›è§†é¢‘é€šå¸¸ç”±ä¸€çº¿å¼€å�‘è€…æˆ–ç ”ç©¶äººå‘˜åˆ†äº«å†…å®¹å®�ç”¨ä¸”æ˜“æ‡‚ã€‚

7.

3 æŠ€æœ¯å�šå®¢å’Œç½‘ç«™Hugging Faceå�šå®¢Hugging Faceæ˜¯è‡ªç„¶è¯è¨€å¤„ç�†é¢†åŸŸçš„é¢†å…ˆå…¬å�¸å…¶å�šå®¢åˆ†äº«äº†è®¸å¤šå…³äº�é¢„è®ç»ƒæ¨¡å�‹å’Œè‡ªç„¶è¯è¨€å¤„ç�†çš„æœ€æ–°ç ”ç©¶æˆ�æ�œå’ŒæŠ€æœ¯åº”ç”¨ã€‚Towards Data Scienceè¿™æ˜¯ä¸€ä¸ªæ•°æ�®ç§‘å¦å’Œäººå·¥æ™ºèƒ½é¢†åŸŸçš„çŸ¥å��å�šå®¢å¹³å�°æœ‰å¾ˆå¤šå…³äº�è‡ªç„¶è¯è¨€å¤„ç�†å’ŒLLMçš„é«˜è´¨é‡�æ–‡ç« ã€‚arXiv.orgè¯¥ç½‘ç«™æ��ä¾›äº†å¤§é‡�çš„å¦æœ¯è®ºæ–‡åŒ…æ‹¬è‡ªç„¶è¯è¨€å¤„ç�†å’ŒAIé¢†åŸŸçš„æœ€æ–°ç ”ç©¶æˆ�æ�œã€‚

2 å¼€å�‘å·¥å…·æ¡†æ�¶æ�¨è��

7.

1 IDEå’Œç¼–è¾‘å™¨PyCharmæ˜¯ä¸€æ¬¾ä¸“ä¸šçš„Pythoné›†æˆ�å¼€å�‘ç�¯å¢ƒå…·æœ‰å¼ºå¤§çš„ä»£ç �ç¼–è¾‘ã€�è°ƒè¯•å’Œè‡ªåŠ¨è¡¥å…¨åŠŸèƒ½ã€‚Visual Studio Codeè½»é‡�çº§çš„ä»£ç �ç¼–è¾‘å™¨æ”¯æŒ�å¤šç§�ç¼–ç¨‹è¯è¨€å¹¶ä¸”æœ‰ä¸°å¯Œçš„æ‰©å±•æ�’ä»¶ã€‚Jupyter Notebooké€‚å�ˆè¿›è¡Œäº¤äº’å¼�ç¼–ç¨‹å’Œæ•°æ�®åˆ†æ��æ–¹ä¾¿ä»£ç �çš„å±•ç¤ºå’Œåˆ†äº«ã€‚

7.

2 è°ƒè¯•å’Œæ€§èƒ½åˆ†æ��å·¥å…·TensorBoardç”¨äº�å�¯è§†åŒ–æ·±åº¦å¦ä¹ æ¨¡å�‹çš„è®ç»ƒè¿‡ç¨‹å’Œæ€§èƒ½æŒ‡æ ‡å¸®åŠ©å¼€å�‘è€…æ›´å¥½åœ°ç�†è§£æ¨¡å�‹çš„è®ç»ƒæƒ…å†µã€‚Py-Spyå�¯ä»¥å¯¹Pythonä»£ç �è¿›è¡Œæ€§èƒ½åˆ†æ��æ‰¾å‡ºä»£ç �ä¸çš„æ€§èƒ½ç“¶é¢ˆã€‚Debugpyæ˜¯ä¸€ä¸ªPythonè°ƒè¯•å™¨æ”¯æŒ�åœ¨å¤šç§�ç�¯å¢ƒä¸‹è¿›è¡Œè°ƒè¯•ã€‚

7.

3 ç›¸å…³æ¡†æ�¶å’Œåº“PyTorchæ˜¯ä¸€ä¸ªå¼€æº�çš„æ·±åº¦å¦ä¹ æ¡†æ�¶å…·æœ‰åŠ¨æ€�å›¾å’Œä¸°å¯Œçš„å·¥å…·åº“å¹¿æ³›åº”ç”¨äº�è‡ªç„¶è¯è¨€å¤„ç�†é¢†åŸŸã€‚TensorFlowå�¦ä¸€ä¸ªçŸ¥å��çš„æ·±åº¦å¦ä¹ æ¡†æ�¶æ��ä¾›äº†é«˜æ•ˆçš„è®¡ç®—å’Œåˆ†å¸ƒå¼�è®ç»ƒèƒ½åŠ›ã€‚TransformersHugging Faceæ��ä¾›çš„åº“åŒ…å�«äº†å�„ç§�é¢„è®ç»ƒçš„è¯è¨€æ¨¡å�‹å’Œå·¥å…·æ–¹ä¾¿è¿›è¡Œè‡ªç„¶è¯è¨€å¤„ç�†ä»»åŠ¡ã€‚

3 ç›¸å…³è®ºæ–‡è‘—ä½œæ�¨è��

7.

1 ç»�å…¸è®ºæ–‡â€œAttention Is All You Needâ€�ä»‹ç»�äº†Transformeræ�¶æ�„æ˜¯è‡ªç„¶è¯è¨€å¤„ç�†é¢†åŸŸçš„ç»�å…¸è®ºæ–‡ã€‚â€œBERT: Pre-training of Deep Bidirectional Transformers for Language Understandingâ€�æ��å‡ºäº†BERTæ¨¡å�‹æ�¨åŠ¨äº†é¢„è®ç»ƒè¯è¨€æ¨¡å�‹çš„å�‘å±•ã€‚â€œGenerative Pretrained Transformer 3 (GPT-

: Language Models are Few-Shot Learnersâ€�ä»‹ç»�äº†GPT-3æ¨¡å�‹å±•ç¤ºäº†å¤§è¯è¨€æ¨¡å�‹çš„å¼ºå¤§èƒ½åŠ›ã€‚

7.

2 æœ€æ–°ç ”ç©¶æˆ�æ�œåœ¨arXiv.orgä¸Šæ�œç´¢â€œLarge Language Modelâ€�å’Œâ€œText Style Transferâ€�ç‰å…³é”®è¯�å�¯ä»¥æ‰¾åˆ°æœ€æ–°çš„ç ”ç©¶è®ºæ–‡ã€‚è¿™äº›è®ºæ–‡é€šå¸¸æ�¢è®¨äº†LLMåœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»æ–¹é�¢çš„æ–°æ–¹æ³•å’Œæ–°æŠ€æœ¯ã€‚

7.

3 åº”ç”¨æ¡ˆä¾‹åˆ†æ��ä¸€äº›çŸ¥å��çš„æŠ€æœ¯å�šå®¢å’Œä¼šè®®è®ºæ–‡ä¼šåˆ†äº«LLMåœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»æ–¹é�¢çš„åº”ç”¨æ¡ˆä¾‹ã€‚ä¾‹å¦‚åœ¨ACLAssociation for Computational Linguisticsä¼šè®®ä¸Šçš„ä¸€äº›è®ºæ–‡ä¼šä»‹ç»�å®�é™…åº”ç”¨ä¸çš„ç»�éªŒå’Œæˆ�æ�œã€‚

æ€»ç»“æœªæ�¥å�‘å±•è¶‹åŠ¿ä¸�æŒ‘æˆ˜æœªæ�¥å�‘å±•è¶‹åŠ¿æ›´å¼ºå¤§çš„æ¨¡å�‹éš�ç�€æŠ€æœ¯çš„ä¸�æ–å�‘å±•æœªæ�¥çš„å¤§è¯è¨€æ¨¡å�‹å°†å�˜å¾—æ›´åŠ å¼ºå¤§ã€‚æ¨¡å�‹çš„è§„æ¨¡ä¼šä¸�æ–å¢�å¤§è®ç»ƒæ•°æ�®ä¼šæ›´åŠ ä¸°å¯Œä»�è€Œæ��é«˜æ–‡æœ¬é£�æ ¼è¿�ç§»çš„è´¨é‡�å’Œæ•ˆæ�œã€‚å¤šæ¨¡æ€�è��å�ˆæœªæ�¥çš„æ–‡æœ¬é£�æ ¼è¿�ç§»å�¯èƒ½ä¼šä¸�å›¾åƒ�ã€�éŸ³é¢‘ç‰å¤šæ¨¡æ€�ä¿¡æ�¯è¿›è¡Œè��å�ˆã€‚ä¾‹å¦‚åœ¨è§†é¢‘å†…å®¹åˆ›ä½œä¸AI Agentå�¯ä»¥æ ¹æ�®è§†é¢‘çš„ç”»é�¢é£�æ ¼å’ŒéŸ³é¢‘ç‰¹ç‚¹å°†æ–‡æœ¬è½¬æ�¢ä¸ºä¸�ä¹‹åŒ¹é…�çš„é£�æ ¼ã€‚ä¸ªæ€§åŒ–å®šåˆ¶æ ¹æ�®ç”¨æˆ·çš„ä¸ªæ€§åŒ–éœ€æ±‚è¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»å°†æˆ�ä¸ºæœªæ�¥çš„ä¸€ä¸ªé‡�è¦�å�‘å±•æ–¹å�‘ã€‚AI Agentå�¯ä»¥å¦ä¹ ç”¨æˆ·çš„è¯è¨€ä¹ æƒ¯å’Œé£�æ ¼å��å¥½ä¸ºç”¨æˆ·æ��ä¾›æ›´åŠ ä¸ªæ€§åŒ–çš„æ–‡æœ¬é£�æ ¼è¿�ç§»æœ�åŠ¡ã€‚æŒ‘æˆ˜æ•°æ�®è´¨é‡�å’Œæ•°é‡�é«˜è´¨é‡�çš„æ–‡æœ¬é£�æ ¼è¿�ç§»æ•°æ�®é›†æ˜¯è®ç»ƒæ¨¡å�‹çš„å…³é”®ã€‚ç„¶è€Œæ”¶é›†å’Œæ ‡æ³¨å¤§è§„æ¨¡çš„é«˜è´¨é‡�æ•°æ�®é›†æ˜¯ä¸€é¡¹å…·æœ‰æŒ‘æˆ˜æ€§çš„ä»»åŠ¡ã€‚å�Œæ—¶ä¸�å�Œé£�æ ¼çš„æ–‡æœ¬æ•°æ�®åˆ†å¸ƒå�¯èƒ½ä¸�å�‡è¡¡è¿™ä¹Ÿä¼šå½±å“�æ¨¡å�‹çš„æ€§èƒ½ã€‚é£�æ ¼ç�†è§£å’Œæ�§åˆ¶å‡†ç¡®ç�†è§£æ–‡æœ¬çš„é£�æ ¼å¹¶è¿›è¡Œç²¾ç¡®çš„é£�æ ¼æ�§åˆ¶æ˜¯ä¸€ä¸ªéš¾é¢˜ã€‚ä¸�å�Œçš„äººå¯¹é£�æ ¼çš„ç�†è§£å�¯èƒ½å˜åœ¨å·®å¼‚è€Œä¸”é£�æ ¼çš„å®šä¹‰å’Œåˆ†ç±»ä¹Ÿæ¯”è¾ƒå¤�æ�‚ã€‚å¦‚ä½•è®©æ¨¡å�‹å‡†ç¡®åœ°æŠŠæ�¡é£�æ ¼å¹¶è¿›è¡Œè¿�ç§»æ˜¯æœªæ�¥éœ€è¦�è§£å†³çš„é—®é¢˜ã€‚è®¡ç®—èµ„æº�å’Œæ•ˆç�‡è®ç»ƒå¤§è¯è¨€æ¨¡å�‹éœ€è¦�å¤§é‡�çš„è®¡ç®—èµ„æº�å’Œæ—¶é—´ã€‚åœ¨å®�é™…åº”ç”¨ä¸å¦‚ä½•æ��é«˜æ¨¡å�‹çš„è®ç»ƒå’Œæ�¨ç�†æ•ˆç�‡é™�ä½�è®¡ç®—æˆ�æœ¬æ˜¯ä¸€ä¸ªäºŸå¾…è§£å†³çš„æŒ‘æˆ˜ã€‚

é™„å½•å¸¸è§�é—®é¢˜ä¸�è§£ç”é—®é¢˜1LLMåœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»ä¸çš„æ•ˆæ�œå¦‚ä½•ç”LLMåœ¨æ–‡æœ¬é£�æ ¼è¿�ç§»ä¸å…·æœ‰è¾ƒå¥½çš„æ•ˆæ�œã€‚é€šè¿‡åœ¨å¤§è§„æ¨¡æ•°æ�®ä¸Šè¿›è¡Œé¢„è®ç»ƒLLMå¦ä¹ äº†ä¸°å¯Œçš„è¯è¨€çŸ¥è¯†å’Œæ¨¡å¼�ã€‚åœ¨å¾®è°ƒå��æ¨¡å�‹å�¯ä»¥åœ¨ä¸€å®šç¨‹åº¦ä¸Šå®�ç�°æ–‡æœ¬é£�æ ¼çš„è¿�ç§»ã€‚ç„¶è€Œæ•ˆæ�œè¿˜å�—åˆ°æ•°æ�®é›†è´¨é‡�ã€�æ¨¡å�‹é€‰æ‹©å’Œè®ç»ƒæ–¹æ³•ç‰å› ç´ çš„å½±å“�ã€‚é—®é¢˜2å¦‚ä½•é€‰æ‹©å�ˆé€‚çš„é¢„è®ç»ƒæ¨¡å�‹è¿›è¡Œæ–‡æœ¬é£�æ ¼è¿�ç§»ç”é€‰æ‹©å�ˆé€‚çš„é¢„è®ç»ƒæ¨¡å�‹éœ€è¦�è€ƒè™‘å¤šä¸ªå› ç´ ã€‚é¦–å…ˆè¦�æ ¹æ�®ä»»åŠ¡çš„éœ€æ±‚å’Œæ•°æ�®é›†çš„ç‰¹ç‚¹é€‰æ‹©æ¨¡å�‹çš„è§„æ¨¡å’Œç±»å�‹ã€‚ä¾‹å¦‚å¦‚æ�œæ•°æ�®é›†è¾ƒå°�å�¯ä»¥é€‰æ‹©ç›¸å¯¹è¾ƒå°�çš„æ¨¡å�‹å¦‚æ�œéœ€è¦�å¤„ç�†é•¿æ–‡æœ¬å�¯ä»¥é€‰æ‹©å…·æœ‰é•¿åº�åˆ—å¤„ç�†èƒ½åŠ›çš„æ¨¡å�‹ã€‚å…¶æ¬¡è¦�è€ƒè™‘æ¨¡å�‹çš„æ€§èƒ½å’Œæ•ˆæ�œå�¯ä»¥å�‚è€ƒç›¸å…³çš„ç ”ç©¶è®ºæ–‡å’Œå®�éªŒç»“æ�œã€‚é—®é¢˜3æ–‡æœ¬é£�æ ¼è¿�ç§»æ˜¯å�¦ä¼šæ”¹å�˜æ–‡æœ¬çš„è¯ä¹‰ç”åœ¨ç�†æƒ³æƒ…å†µä¸‹æ–‡æœ¬é£�æ ¼è¿�ç§»åº”è¯¥å�ªæ”¹å�˜æ–‡æœ¬çš„é£�æ ¼è€Œä¸�æ”¹å�˜æ–‡æœ¬çš„è¯ä¹‰ã€‚ç„¶è€Œåœ¨å®�é™…åº”ç”¨ä¸ç”±äº�æ¨¡å�‹çš„å±€é™�æ€§å’Œé£�æ ¼è¿�ç§»çš„å¤�æ�‚æ€§å�¯èƒ½ä¼šå‡ºç�°ä¸€å®šç¨‹åº¦çš„è¯ä¹‰å��å·®ã€‚ä¸ºäº†å‡�å°‘è¯ä¹‰å��å·®å�¯ä»¥é‡‡ç”¨ä¸€äº›æŠ€æœ¯æ‰‹æ®µå¦‚åœ¨è®ç»ƒè¿‡ç¨‹ä¸åŠ å…¥è¯ä¹‰çº¦æ�Ÿã€‚é—®é¢˜4å¦‚ä½•è¯„ä¼°æ–‡æœ¬é£�æ ¼è¿�ç§»çš„æ•ˆæ�œç”è¯„ä¼°æ–‡æœ¬é£�æ ¼è¿�ç§»çš„æ•ˆæ�œå�¯ä»¥ä»�å¤šä¸ªæ–¹é�¢è¿›è¡Œã€‚ä¸€æ–¹é�¢å�¯ä»¥ä½¿ç”¨äººå·¥è¯„ä¼°çš„æ–¹æ³•è®©ä¸“ä¸šäººå‘˜å¯¹è¿�ç§»å��çš„æ–‡æœ¬è¿›è¡Œæ‰“åˆ†å’Œè¯„ä»·ã€‚å�¦ä¸€æ–¹é�¢å�¯ä»¥ä½¿ç”¨ä¸€äº›è‡ªåŠ¨è¯„ä¼°æŒ‡æ ‡å¦‚BLEUã€�ROUGEç‰ã€‚è¿™äº›æŒ‡æ ‡å�¯ä»¥è¡¡é‡�è¿�ç§»å��çš„æ–‡æœ¬ä¸�ç›®æ ‡é£�æ ¼æ–‡æœ¬ä¹‹é—´çš„ç›¸ä¼¼åº¦ã€‚

æ‰©å±•é˜…è¯» å�‚è€ƒèµ„æ–™æ‰©å±•é˜…è¯»ã€Šè‡ªç„¶è¯è¨€å¤„ç�†è¿›é˜¶ã€‹è¿›ä¸€æ¥æ·±å…¥å¦ä¹ è‡ªç„¶è¯è¨€å¤„ç�†çš„é«˜çº§æŠ€æœ¯å’Œæ–¹æ³•ã€‚ã€ŠAIæœªæ�¥è¿›è¡Œå¼�ã€‹æ�¢è®¨äººå·¥æ™ºèƒ½çš„æœªæ�¥å�‘å±•è¶‹åŠ¿å’Œåº”ç”¨åœºæ™¯ã€‚å…³æ³¨ä¸€äº›çŸ¥å��çš„è‡ªç„¶è¯è¨€å¤„ç�†ç ”ç©¶å›¢é˜Ÿå’Œå¦è€…çš„å�šå®¢äº†è§£ä»–ä»¬çš„æœ€æ–°ç ”ç©¶æˆ�æ�œå’Œè§‚ç‚¹ã€‚å�‚è€ƒèµ„æ–™Hugging Faceå®˜æ–¹æ–‡æ¡£https://huggingface.co/docsPyTorchå®˜æ–¹æ–‡æ¡£https://pytorch.org/docs/stable/index.htmlç›¸å…³çš„å¦æœ¯ä¼šè®®è®ºæ–‡é›†å¦‚ACLã€�EMNLPç‰ã€‚é€šè¿‡ä»¥ä¸Šçš„æ–‡ç« æˆ‘ä»¬å…¨é�¢æ·±å…¥åœ°æ�¢è®¨äº†LLMåœ¨AI Agentä¸çš„æ–‡æœ¬é£�æ ¼è¿�ç§»åº”ç”¨æ¶µç›–äº†ä»�æ ¸å¿ƒæ¦‚å¿µåˆ°å®�é™…åº”ç”¨çš„å�„ä¸ªæ–¹é�¢å¸Œæœ›å¯¹è¯»è€…æœ‰æ‰€å¸®åŠ©ã€‚

lite-avatar形象库开源可部署：基于LiteAvatarGallery的150+2D形象完全免费使用

核心内容摘要

千匠网络B2B商城系统：重塑渠道分销，开启数智化新时代

èƒŒæ™¯ä»‹ç»�

4 æœ¯è¯è¡¨

3 ç¼©ç•¥è¯�åˆ—è¡¨LLMLarge Language Modelå¤§è¯è¨€æ¨¡å�‹AIArtificial Intelligenceäººå·¥æ™ºèƒ½NLPNatural Language Processingè‡ªç„¶è¯è¨€å¤„ç�†

modelGPT2LMHeadModel.from_pretrained(gpt

# æ¥éª¤3å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

é¡¹ç›®å®�æˆ˜ä»£ç �å®�é™…æ¡ˆä¾‹å’Œè¯¦ç»†è§£é‡Šè¯´æ˜�

1 å¼€å�‘ç�¯å¢ƒæ�å»ºå®‰è£…Pythoné¦–å…ˆç¡®ä¿�ä½ å·²ç»�å®‰è£…äº†Python

modelGPT2LMHeadModel.from_pretrained(gpt

# å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

å·¥å…·å’Œèµ„æº�æ�¨è��

1 å¦ä¹ èµ„æº�æ�¨è��

2 å¼€å�‘å·¥å…·æ¡†æ�¶æ�¨è��

3 ç›¸å…³è®ºæ–‡è‘—ä½œæ�¨è��

: Language Models are Few-Shot Learnersâ€�ä»‹ç»�äº†GPT-3æ¨¡å�‹å±•ç¤ºäº†å¤§è¯è¨€æ¨¡å�‹çš„å¼ºå¤§èƒ½åŠ›ã€‚

困困兔完整版免费观看-困困兔完整版免费观看应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

百度百家号客服电话人工服务

lite-avatar形象库开源可部署：基于LiteAvatarGallery的150+2D形象完全免费使用

核心内容摘要

千匠网络B2B商城系统：重塑渠道分销，开启数智化新时代

èƒŒæ™¯ä»‹ç»�

4 æœ¯è¯­è¡¨

3 ç¼©ç•¥è¯�åˆ—è¡¨LLMLarge Language Modelå¤§è¯­è¨€æ¨¡å�‹AIArtificial Intelligenceäººå·¥æ™ºèƒ½NLPNatural Language Processingè‡ªç„¶è¯­è¨€å¤„ç�†

modelGPT2LMHeadModel.from_pretrained(gpt

# æ­¥éª¤3å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

é¡¹ç›®å®�æˆ˜ä»£ç �å®�é™…æ¡ˆä¾‹å’Œè¯¦ç»†è§£é‡Šè¯´æ˜�

1 å¼€å�‘ç�¯å¢ƒæ�­å»ºå®‰è£…Pythoné¦–å…ˆç¡®ä¿�ä½ å·²ç»�å®‰è£…äº†Python

modelGPT2LMHeadModel.from_pretrained(gpt

# å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

å·¥å…·å’Œèµ„æº�æ�¨è��

1 å­¦ä¹ èµ„æº�æ�¨è��

2 å¼€å�‘å·¥å…·æ¡†æ�¶æ�¨è��

3 ç›¸å…³è®ºæ–‡è‘—ä½œæ�¨è��

: Language Models are Few-Shot Learnersâ€�ä»‹ç»�äº†GPT-3æ¨¡å�‹å±•ç¤ºäº†å¤§è¯­è¨€æ¨¡å�‹çš„å¼ºå¤§èƒ½åŠ›ã€‚

困困兔完整版免费观看-困困兔完整版免费观看应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

相关优化文章 推荐

百度百家号客服电话人工服务

4 æœ¯è¯è¡¨

3 ç¼©ç•¥è¯�åˆ—è¡¨LLMLarge Language Modelå¤§è¯è¨€æ¨¡å�‹AIArtificial Intelligenceäººå·¥æ™ºèƒ½NLPNatural Language Processingè‡ªç„¶è¯è¨€å¤„ç�†

# æ¥éª¤3å¾®è°ƒæ¨¡å�‹optimizerAdamW(model.parameters(),lr1e-

1 å¼€å�‘ç�¯å¢ƒæ�å»ºå®‰è£…Pythoné¦–å…ˆç¡®ä¿�ä½ å·²ç»�å®‰è£…äº†Python

1 å¦ä¹ èµ„æº�æ�¨è��

: Language Models are Few-Shot Learnersâ€�ä»‹ç»�äº†GPT-3æ¨¡å�‹å±•ç¤ºäº†å¤§è¯è¨€æ¨¡å�‹çš„å¼ºå¤§èƒ½åŠ›ã€‚

相关优化文章推荐