核心内容摘要
斯坦福与英伟达联合:AI训练为什么“炒冷饭“比“吃新鲜“更有效?
MinerU-
2B图文对è¯�效æ�œå±•ç¤ºä¸Šä¼ æŠ€æœ¯å›¾çº¸â†’è‡ªåŠ¨è¯†åˆ«å…ƒä»¶åŠŸèƒ½è¯´æ˜�
è¿™ä¸�是普通OCR是能“看懂â€�电路图的AIåŠ©æ‰‹ä½ æœ‰æ²¡æœ‰è¯•è¿‡å¯¹ç�€ä¸€å¼ 密密麻麻的PCB设计图å�‘呆元件编å�·å°�å¾—åƒ�èš‚èš�ä¿¡å�·çº¿ç»•æ�¥ç»•å�»å…³é”®å�‚数还被é�®æŒ¡äº†ä¸€å�Šã€‚以å‰�å�ªèƒ½æˆªå›¾å�‘ç»™å�Œäº‹é—®â€œè¿™ä¸ªU7到底是什么芯片â€�——ç‰å›�å¤�è¦�å�Šå°�时查手册è¦�一å°�时改错å†�花两å°�时。ç�°åœ¨æŠŠè¿™å¼ 图往MinerU里一拖3ç§’å��å®ƒå°±å‘Šè¯‰ä½ â€œU7为TI出å“�çš„TPS63020DSJR DC-DCé™�å�‹å�‡å�‹è½¬æ�¢å™¨è¾“入电å�‹èŒƒå›´
5–
5V最大输出电æµ�2Aå°�装为10引脚SON……â€�è¿�æ•°æ�®æ‰‹å†Œç¬¬17页的典å�‹åº”ç”¨ç”µè·¯éƒ½ç»™ä½ æ ‡å‡ºæ�¥äº†ã€‚è¿™ä¸�是在编故事而是MinerU-
2B真å®�跑出æ�¥çš„æ•ˆæ�œã€‚它ä¸�å�ªâ€œçœ‹è§�â€�æ–‡å—æ›´åœ¨â€œç�†è§£â€�技术图纸的逻辑结æ�„哪是元件符å�·ã€�å“ªæ˜¯ç½‘ç»œæ ‡ç¾ã€�哪是注释框ã€�å“ªæ˜¯å°ºå¯¸æ ‡æ³¨ã€‚å®ƒæŠŠä¸€å¼ é�™æ€�图åƒ�å�˜æˆ�了å�¯äº¤äº’ã€�å�¯è¿½é—®ã€�å�¯æ·±æŒ–的技术文档。我们今天ä¸�讲å�‚æ•°ã€�ä¸�è�Šæ�¶æ�„就用6å¼ çœŸå®�技术图纸——ä»�å�Ÿç�†å›¾åˆ°æœºæ¢°åР工图ä»�手绘è�‰ç¨¿åˆ°PDFå¯¼å‡ºå›¾â€”â€”å¸¦ä½ äº²çœ¼çœ‹çœ‹ä¸€ä¸ª
2Bçš„å°�模å�‹æ€�么把工程师最头疼的“看图识物â€�å�˜æˆ�ç‚¹é¼ æ ‡å°±èƒ½å®Œæˆ�的日常æ“�作。
技术图纸å®�测6类典å�‹åœºæ™¯ç»“æ�œå…¨å…¬å¼€æˆ‘们准备了6å¼ ä¸�å�Œæ�¥æº�ã€�ä¸�å�Œå¤�æ�‚度的技术图纸全部æ�¥è‡ªçœŸå®�项目已脱æ•�覆盖电å�ã€�机械ã€�自动化三大领域。æ¯�å¼ å›¾éƒ½ç”¨å�Œä¸€å¥—æµ�ç¨‹æµ‹è¯•ä¸Šä¼ â†’æ��问→记录å“�åº”æ—¶é—´â†’æ ¸å¯¹å‡†ç¡®æ€§â†’æ ‡æ³¨äº®ç‚¹ã€‚æ‰€æœ‰æµ‹è¯•å�‡åœ¨æ ‡å‡†CPUç�¯å¢ƒIntel i
H下完æˆ�未å�¯ç”¨GPUåŠ é€Ÿã€‚
1 场景一ICå�Ÿç�†å›¾è¯†åˆ«TI官方å�‚考设计截图图纸特点A4尺寸PNGå�«12个IC符å�·ã€�37个电阻电容ã€�多层走线ã€�å¯†é›†ç½‘ç»œæ ‡ç¾å¦‚“VCC_3V3â€�“I2C_SCLâ€�ã€�å�³ä¸‹è§’嵌入å°�å—å�·ç‰ˆæœ¬å�·å’Œæ—¥æœŸæ��é—®æŒ‡ä»¤â€œè¯·åˆ—å‡ºå›¾ä¸æ‰€æœ‰é›†æˆ�电路的å�‹å�·ã€�å�‚商和主è¦�功能并指出I2C总线è¿�æ�¥äº†å“ªäº›å™¨ä»¶â€�å“�应时间
4秒�际输出节选U1STMicroelectronics STM32F030F4P6 —— 32�ARM Cortex-M0微�制器主频48MHz内置6KB FlashU2NXP PCA9555 —— 16�I/O扩展器通过I2C���U1通信U3TI TPS63020DSJR —— 高效����转�器为U1和U2�供稳定
3V电æº�I2C总线è¿�æ�¥å™¨ä»¶U1主æ�§ã€�U2ä»�设备ã€�U4EEPROMå�‹å�·AT24C02亮点观察准确区分了“U1作为主æ�§â€�和“U2/U4作为ä»�设备â€�的角色将“TPS63020DSJRâ€�完整识别为å�‹å�·è€Œé��截æ–为“TPS63020â€�自动关è�”了电æº�路径U3→U1/U2超出å�•纯OCR范畴。
2 场景二PCB布局图元件定ä½�嘉立创Gerber导出图图纸特点å�•层Top Layer PNGå�«ç„Šç›˜ã€�ä¸�å�°å—符ã€�定ä½�å”ã€�æ�¿è¾¹æ¡†ä¸�å�°æ–‡å—æ��å°�约6pt部分被铜箔å��光干扰æ��é—®æŒ‡ä»¤â€œè¯·æ ‡å‡ºæ‰€æœ‰å¸¦â€˜R’å‰�缀的贴片电阻ä½�ç½®X/Yå��æ ‡å¹¶è¯´æ˜�其阻值和精度â€�å“�应时间
1秒�际输出R1��(
4
3mm,
1
7mm)阻值10kΩ ±1%��“103�R2��(
4
1mm,
1
7mm)阻值100kΩ ±1%��“104�R3��(
4
9mm,
1
7mm)阻值1MΩ ±5%ä¸�å�°â€œ105â€�精度由å°�装类å�‹æ�¨æ–R4ä¸�å�°æ¨¡ç³Šç–‘似“220â€�建议人工å¤�æ ¸äº®ç‚¹è§‚å¯Ÿå��æ ‡å�•ä½�自动统一为毫米符å�ˆPCB行业惯例对“10310×10³10kΩâ€�ç‰å·¥ç¨‹ç¼–ç �规则完全æ�Œæ�¡ä¸»åŠ¨æ ‡æ³¨å˜ç–‘项ä¸�强行猜测。
3 场景三机械装é…�图零件解æ��SolidWorks工程图PDF截图图纸特点å�«ä¸»è§†å›¾ã€�俯视图ã€�局部放大图ã€�æ��æ–™æ �ã€�å…¬å·®æ ‡æ³¨ã€�表é�¢ç²—糙度符å�·ä¸æ–‡æ ‡é¢˜æ �英文技术è¦�求æ��问指令“请æ��å�–‘零件åº�å�·3’对应的å��ç§°ã€�æ��æ–™ã€�æ•°é‡�å�Šå…³é”®å°ºå¯¸ç›´å¾„/长度/公差â€�å“�应时间
8秒�际输出�称定�销轴�料45#钢调质处�HB
数�2件关键尺寸φ8h
7
000/-
015mmé…�å�ˆå”径总长25±
1mm倒角C
5å›¾çº¸å±€éƒ¨æ”¾å¤§å›¾ä¸æ ‡æ³¨äº®ç‚¹è§‚察精准定ä½�“åº�å�·3â€�在å¤�æ�‚视图ä¸çš„对应å®�体æ£ç¡®è§£æ��“φ8h7â€�公差代å�·å�«ä¹‰ä»�å±€éƒ¨æ”¾å¤§å›¾ä¸æ��å�–倒角信æ�¯ä½“ç�°è·¨åŒºåŸŸè¯ä¹‰å…³è�”能力。
4 场景四手绘电路è�‰ç¨¿è¯†åˆ«æ‰‹æœºæ‹�摄白æ�¿ç…§å›¾çº¸ç‰¹ç‚¹é��æ£äº¤æ‹�æ‘„ã€�轻微é€�视畸å�˜ã€�背景有粉笔å—干扰ã€�元件符å�·ä¸ºæ‰‹ç»˜é£�æ ¼è¿�放三角形ä¸�è§„æ•´ã€�ç”µé˜»æ³¢æµªçº¿æªæ–œæ��问指令“请还å�Ÿè¯¥ç”µè·¯åŠŸèƒ½å¹¶æŒ‡å‡ºè¿�放U1çš„å��馈类å�‹å’Œå¢�益计算公å¼�â€�å“�应时间
6ç§’å®�际输出这是一个å�Œç›¸æ”¾å¤§ç”µè·¯è¾“入信å�·æ�¥è‡³U1å�Œç›¸ç«¯å��相端-通过R2æ�¥åœ°R1è¿�æ�¥è¾“出ä¸�å��相端æ�„æˆ�è´Ÿå��馈。å��馈类å�‹ç”µå�‹ä¸²è�”è´Ÿå��馈å¢�益公å¼�Av 1 R1/R2å…¶ä¸R1100kΩR210kΩç�†è®ºå¢�益≈11å€�亮点观察在ä½�è´¨é‡�图åƒ�ä¸ä»�识别出手绘è¿�放符å�·å‡†ç¡®åˆ¤æ–å��馈拓扑结æ�„ä»�æ¨¡ç³Šç”µé˜»æ ‡æ³¨ä¸è¾¨è¯†å‡ºâ€œ100Kâ€�和“10Kâ€�数值。
5 场景五多页PDFæŠ€æœ¯è§„æ ¼ä¹¦å®‰æ£®ç¾�MOSFETæ•°æ�®æ‰‹å†Œç¬¬3页图纸特点PDF截图å�«è¡¨æ ¼ã€�曲线图ã€�æ–‡å—æ��è¿°æ··å�ˆæ�’ç‰ˆè¡¨æ ¼åˆ—æ ‡é¢˜ä¸ºè‹±æ–‡VGS, ID, RDS(on)曲线图横纵å��æ ‡ä¸ºç‰©ç�†é‡�V, A, Ωæ��问指令“请æ��å�–‘Electrical Characteristicsâ€™è¡¨æ ¼ä¸æ‰€æœ‰RDS(on)å�‚数包括测试æ�¡ä»¶å’Œå…¸å�‹å€¼â€�å“�应时间
9秒�际输出VGS (V)ID (A)RDS(on) Max (Ω)RDS(on) Typ (Ω)Test Condition
10100.
0
018TJ 25°C
1050.
0
016TJ 125°C
4.
550.
0
025TJ 25°C亮点观察完ç¾�é‡�å»ºè¡¨æ ¼ç»“æ�„ä¿�ç•™å�Ÿå§‹å�•ä½�ä¸�æ�¡ä»¶åŒºåˆ†â€œMaxâ€�ä¸�“Typâ€�列自动补全表头缺失的“Test Conditionâ€�列å��。
6 场景å…CADå›¾çº¸å°ºå¯¸æ ‡æ³¨è¯†åˆ«AutoCAD DWG导出PNG图纸特点å�«å¤šé‡�å¼•çº¿æ ‡æ³¨ã€�å †å� 公差如“⌀
1
0±
1â€�ã€�å½¢ä½�公差符å�·â—�ã€�åŸºå‡†å—æ¯�A/B/Cæ��问指令“请列出所有å�«â€˜â—�’符å�·çš„å½¢ä½�公差è¦�求并说æ˜�å…¶æ�§åˆ¶å¯¹è±¡å’Œå…¬å·®å€¼â€�å“�应时间
3秒�际输出�
05 Aæ�§åˆ¶Î¦12å”轴线相对äº�基准A底é�¢çš„å�‚直度公差值
05mmâ—�
1 B-C�制Φ8销轴轴线相对�基准B左侧端�和C�侧端�组�的公共基准的�轴度公差值
1mm亮点观察准确识别形�公差符�“���解“公共基准B-C�的���义将“⌀
1
0±
1â€�ä¸çš„直径符å�·â€œâŒ€â€�ä¸�公差分离处ç�†é�¿å…�误读为“直径
1
0公差±
1�。
为什么它能“看懂�图纸三个关键能力拆解MinerU-
2Bä¸�是é� å †ç®—åŠ›ç¡¬åˆšè€Œæ˜¯ç”¨ä¸‰é‡�能力层层递进把“看图â€�å�˜æˆ�“读图â€�
1 第一层åƒ�ç´ çº§è§†è§‰æ„ŸçŸ¥â€”â€”ä¸�å�ªæ˜¯OCR更是“版é�¢è¯ä¹‰åˆ†å‰²â€�ä¼ ç»ŸOCRæŠŠæ•´å¼ å›¾å½“æ–‡æœ¬æµ�处ç�†è€ŒMinerUå…ˆå�šè§†è§‰ç»“æ�„ç�†è§£å®ƒèƒ½è‡ªåŠ¨åŒºåˆ†â€œæ ‡é¢˜åŒºâ€�â€œè¡¨æ ¼åŒºâ€�“示æ„�图区â€�“注释区â€�。在å�Ÿç�†å›¾ä¸å®ƒçŸ¥é�““U1â€�是元件编å�·ã€�“R2â€�是电阻ã€�“C5â€�是电容——ä¸�是é� å—典匹é…�而是通过符å�·å½¢çжã€�ä½�置关系ã€�上下文布局å¦ä¹ 得到的。测试ä¸å�³ä½¿æŠŠâ€œU7â€�手写æˆ�“U⑦â€�它ä¾�然能æ£ç¡®å½’类为集æˆ�电路。
2 第二层领域知识注入——内置电å�/机械术è¯åº“ä¸�规则引æ“�模å�‹åœ¨è®ç»ƒæ—¶è��å�ˆäº†æ•°ä¸‡ä»½æŠ€æœ¯æ–‡æ¡£å†…建了电å�元件命å��规范TI/ST/NXPå‰�缀体系电阻电容编ç �规则EIA-96ã€�三ä½�æ•°æ ‡æ³•å…¬å·®æ ‡æ³¨å›½æ ‡GB/T 1182电气符å�·IEC 60617æ ‡å‡†PCB设计术è¯SMTã€�PTHã€�Gerberã€�Netlist所以当它看到“TPS63020â€�立刻关è�”到TI官网文档看到“⌀
1
0±
1â€�自动解æ��为直径公差而é��普通数å—。
3 第三层多轮对è¯�å¼�æ�¨ç�†â€”—支æŒ�追问ã€�ä¿®æ£ã€�è�šç„¦ç»†èŠ‚å®ƒä¸�是一次性输出就结æ�Ÿã€‚ä½ å�¯ä»¥æ�¥ç�€é—®â€œU7的散çƒè¦�求是什么â€� → 它会翻å›�æ•°æ�®æ‰‹å†Œç›¸å…³ç« 节“把R1的阻值改æˆ�
7kΩ电路功能会�化�� → 它基��放知识���馈网络影�“�显示�电�相关的元件� → 它动�过滤�新组织输出这�能力让技术图纸�“��图片��级为“�交互知识图谱�。
å’Œä¼ ç»Ÿæ–¹æ¡ˆå¯¹æ¯”çœ�下的ä¸�å�ªæ˜¯æ—¶é—´æˆ‘们把MinerU-
2B和三ç§�常用方案å�šäº†æ¨ªå�‘å®�测å�Œä¸€å¼ å�Ÿç�†å›¾å�Œä¸€å·¥ç¨‹å¸ˆæ“�ä½œå¯¹æ¯”ç»´åº¦ä¼ ç»Ÿäººå·¥æŸ¥æ‰‹å†Œé€šç”¨OCRExcelæ•´ç�†MinerU-
2B识别ICå�‹å�·12分钟翻PDFæ�œç´¢3分钟OCRå‡ºé”™éœ€äººå·¥æ ¡
4秒一次准确æ��å�–è¡¨æ ¼å�‚æ•°8åˆ†é’ŸæŠ„å†™æ ¸å¯¹5åˆ†é’Ÿæ ¼å¼�错乱é‡�æ�’
9ç§’å�Ÿæ ·ç»“æ�„化输出定ä½�元件å��æ ‡6分钟用尺å�é‡�æ�¢ç®—ä¸�支æŒ�æ— ç©ºé—´ç�†è§£
1秒毫米级å��æ ‡ç›´å‡ºç�†è§£ç”µè·¯åŠŸèƒ½15分钟分æ��ç”»è�‰å›¾æ— 法å®�ç�°
6秒直�给出拓扑公�累计节��次耗时—约40%92%�41分钟→
5分钟更关键的是质é‡�æ��å�‡äººå·¥æ˜“æ¼�æ�‰å°�å—å�·æ³¨é‡Šé€šç”¨OCR常把“10kΩâ€�识别æˆ�“10kQâ€�而MinerU在6类图纸ä¸ä¿�æŒ�
9