核心内容摘要
4k高清下的“白嫩丰满”美学艺术
适用人群想快速体验 PaddlePaddle PaddleOCR 的开发者系统支持LinuxCPU/GPU、macOS仅 CPU版本说明基于 PaddlePaddle
3.
0 PaddleOCR v
3.
0
环境准备在开始之前请确保你的开发环境满足以下条件已安装Docker
x 及以上版本Linux 用户GPU 版本安装了NVIDIA 显卡驱动安装并配置好NVIDIA Container ToolkitmacOS 用户使用Docker Desktop for Mac仅支持 CPU 提示如果你不确定是否已安装 NVIDIA Container Toolkit可在终端执行docker run --gpus all nvidia/cuda:
1
8-base-ubuntu
2
04 nvidia-smi。
如果能正常输出显卡信息则说明配置成功。
拉取 PaddlePaddle Docker 镜像PaddlePaddle 官方提供了多个预构建的 Docker 镜像包含 CPU 和 GPU 版本。
我们推荐使用百度云镜像源国内下载更快✅
CPU 版适用于 macOS / 无 GPU 的 Linuxdockerpull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:
3.
0✅
GPU 版仅限 Linux⚠️ 请确保你已正确安装 NVIDIA Container Toolkit推荐CUDA
1
8兼容性最好dockerpull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:
3.
0-gpu-cuda
1
8-cudnn
9其他选项适用于较新驱动# CUDA
1
6dockerpull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:
3.
0-gpu-cuda
1
6-cudnn
5# CUDA
1
9dockerpull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:
3.
0-gpu-cuda
1
9-cudnn
9 镜像详情参考PaddlePaddle Docker 安装文档macOS▶️
启动 Docker 容器️ CPU 版启动命令Linux / macOSdockerrun --name paddle_docker\-itd\-v$PWD:/paddle\-p8038:8038\ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:
3.
0\/bin/bash GPU 版启动命令仅 Linuxdockerrun --name paddle_docker\--gpus all\-itd\-v$PWD:/paddle\ccr-2vdh3abv-pub.cnc.bj.baidubce.com/paddlepaddle/paddle:
3.
0-gpu-cuda
1
8-cudnn
9\/bin/bash参数说明参数说明--name paddle_docker指定容器名称方便后续操作-itd后台运行并支持交互式终端-v $PWD:/paddle将当前主机目录挂载到容器/paddle路径-p 8038:8038端口映射如需 Web 服务可保留--gpus all启用所有 GPU仅 GPU 版需要
进入容器dockerexec-it paddle_docker /bin/bash进入后你将看到一个已预装Python 3 PaddlePaddle
3.
0的干净环境。
验证 Paddle 是否正常python -cimport paddle; print(paddle.__version__)
获取 PaddleOCR 表格 PDF 示例项目项目地址https://gitee.com/michah/paddleocr_table_pdf_demo在容器内执行cd/paddlegitclone https://gitee.com/michah/paddleocr_table_pdf_democdpaddleocr_table_pdf_demo
安装依赖该项目未提供requirements.txt但根据 README我们需要手动安装以下依赖pipinstallpaddleocr
3.
0 PyMuPDF Pillow reportlab tqdm opencv-python numpy 注意PaddleOCR
3.
0 与 PaddlePaddle
3.
0 版本需严格匹配避免兼容问题。
▶️
运行示例程序python demo.py该脚本会读取项目中的page_
png图像含表格使用 PaddleOCR 的表格识别能力解析结构输出结构化 JSON 并生成美观 PDFpage_5_pred_html_fixed.pdf你可以在/paddle/paddleocr_table_pdf_demo目录下查看结果文件。
❓
八、
常见问题解答Q1如何确认 GPU 是否生效在容器内执行python-cimport paddle; print(paddle.device.get_device())输出gpu:0表示 GPU 正常输出cpu表示仅使用 CPUQ2macOS 能用 GPU 吗不能。
Docker Desktop for Mac 不支持 GPU 加速只能使用 CPU 版本。
如需 GPU 推理请使用 Linux 主机。
Q3中文模型下载太慢怎么办PaddleOCR 会自动下载中文检测/识别模型。
若网络较慢可提前设置缓存目录exportPADDLE_HOME/paddle/.paddlemkdir-p$PADDLE_HOME模型将缓存在该路径下避免重复下载。
✅