核心内容摘要
特级西西女人444mm人体
还在手动敲表格还在为截图里的数据抓狂今天给大家分享一个我刚刚撸出来的 Python 神器——智能 OCR 表格提取助手。
它不仅能一键把图片变 Excel更厉害的是它接入了DeepSeek V3能自动帮你补全数据 核心痛点一键解决作为一名经常和数据打交道的打工人我最烦的就是截图转表格对方发来一张截图让我做成 Excel几百行数据敲到手断。
表头乱飞普通 OCR 识别出来全是散的表头和数据混在一起排序一按全乱了。
数据缺失表格里只有“某某基金”领导非要我填上“基金代码”我又得一个个去百度。
于是这个工具诞生了✨ 四大杀手级功能
️ 图片秒变可编辑表格依托RapidOCR引擎识别速度飞快。
识别后的文字直接变成一个类似 Excel 的界面双击就能改右键就能删。
独创“表头/标题锁定”技术这是市面上很多免费 OCR 工具都没有的细节一键锁定表头右键“将首行设为表头”排序时它纹丝不动。
智能识别标题支持“标题表头”双重锁定完美还原复杂报表结构。
DeepSeek AI 智能补全王炸功能这是最硬核的地方如果你的表格里有“基金名称”或者“公司名”但缺少代码选中那一列。
右键点击DeepSeek: 智能补全基金代码。
见证奇迹AI 会自动联网查询并直接在表格里帮你插入一列新的代码
格式完美导出所见即所得你调整好的表格直接导出为 Excel连标题和列宽都给你安排得明明白白。
核心代码大赏不仅要好用还要硬核。
看看这几行代码你就知道它为什么这么强。
DeepSeek 深度集成 (AI Worker)我们利用QThread实现了异步 AI 调用界面不卡顿体验丝般顺滑。
classDeepSeekWorker(QThread):finishedpyqtSignal(dict)defrun(self):# 直接调用 DeepSeek 官方 APIclientOpenAI(api_keyself.api_key,base_urlhttps://api.deepseek.com)# 精心设计的 Prompt强制输出 JSON 格式方便程序解析promptf 你是一个专业的金融数据助手。
请根据以下基金名称列表查找并返回对应的中国基金代码。
要求返回结果必须是严格的 JSON 格式 (Key: 名称, Value: 代码)。
列表{json.dumps(self.fund_names,ensure_asciiFalse)}responseclient.chat.completions.create(modeldeepseek-chat,messages[{role:user,content:prompt}],streamFalse)# 解析结果并回传给主界面self.finished.emit(json.loads(response.choices[0].message.content))
智能行列重组算法普通的 OCR 只会给你一堆坐标我们写了个算法把它们“拼”回表格。
defsmart_merge_lines(self,result):# 先按 Y 轴聚类判断是否在同一行# 再按 X 轴排序还原列顺序boxes.sort(keylambdab:b[cy])# ... (省略中间复杂的几何计算) ...ifabs(box[cy]-last_box[cy])avg_h*
6:current_row.append(box)# 归为同一行# ...returnfinal_rows 为什么选择它隐私安全OCR 识别完全在本地运行你的财务报表图片不会上传到任何云端除非你主动点击 DeepSeek 查询。
极致轻量基于 PyQt5 开发启动秒开不像 Electron 应用那样吃内存。
无限扩展今天它可以补全基金代码明天改改 Prompt它就能补全“英文翻译”、“股票市盈率”或者“公司地址”
总结这不仅仅是一个 OCR 工具它是你数据处理流程中的AI 增效器。
增强 DeepSeek 的提示词策略增加了 强力模糊匹配 明确告诉 AI 注意 QDIL - QDII 这种常见 OCR 错误。
让 AI 忽略 A 、 C 、 混合 等后缀专注于核心名称的匹配。
要求 AI 在不确定时 优先返回最相似的代码 而不是直接放弃。
想要源码(关注公众号“向左向右立正”)