Complete PP-OCRv5 research and v4 vs v5 comparison

## 研究成果

### PP-OCRv5 API 測試
- 成功升級到 PaddleOCR 3.3.2 (PP-OCRv5)
- 理解新 API 結構和調用方式
- 驗證基礎檢測功能

### 關鍵發現
 PP-OCRv5 **沒有內建手寫分類功能**
- text_type 字段是語言類型,不是手寫/印刷分類
- 仍需要 OpenCV Method 3 來分離手寫和印刷文字

### 完整 Pipeline 對比測試
- v4 (2.7.3): 檢測 14 個文字 → 4 個候選區域
- v5 (3.3.2): 檢測 50 個文字 → 7 個候選區域
- 主簽名區域:兩個版本幾乎相同 (1150x511 vs 1144x511)

### 性能分析
優點:
- v5 手寫識別準確率 +13.7% (文檔承諾)
- 可能減少漏檢

缺點:
- 過度檢測(印章小字等)
- API 完全重寫,不兼容
- 仍無法替代 OpenCV Method 3

### 文件
- PP_OCRV5_RESEARCH_FINDINGS.md: 完整研究報告
- signature-comparison/: v4 vs v5 對比結果
- test_results/: v5 測試輸出
- test_*_pipeline.py: 完整測試腳本

### 建議
當前方案(v2.7.3 + OpenCV Method 3)已足夠穩定,
除非遇到大量漏檢,否則暫不升級到 v5。

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
2025-11-27 11:21:55 +08:00
parent 8f231da3bc
commit 21df0ff387
10 changed files with 3726 additions and 0 deletions

View File

@@ -0,0 +1,17 @@
PaddleOCR v2.7.3 (v4) 完整 Pipeline 測試結果
============================================================
1. OCR 檢測: 14 個文字區域
2. 遮罩印刷文字: 完成
3. 檢測候選區域: 4 個
4. 提取簽名: 4 個
候選區域詳情:
------------------------------------------------------------
Region 1: 位置(1211, 1462), 大小965x191, 面積=184315
Region 2: 位置(1215, 877), 大小1150x511, 面積=587650
Region 3: 位置(332, 150), 大小197x96, 面積=18912
Region 4: 位置(1147, 3303), 大小159x42, 面積=6678
所有結果保存在: /Volumes/NV2/pdf_recognize/signature-comparison/v4-current

View File

@@ -0,0 +1,20 @@
PP-OCRv5 完整 Pipeline 測試結果
============================================================
1. OCR 檢測: 50 個文字區域
2. 遮罩印刷文字: /Volumes/NV2/pdf_recognize/test_results/v5_pipeline/01_masked.png
3. 檢測候選區域: 7 個
4. 提取簽名: 7 個
候選區域詳情:
------------------------------------------------------------
Region 1: 位置(1218, 877), 大小1144x511, 面積=584584
Region 2: 位置(1213, 1457), 大小961x196, 面積=188356
Region 3: 位置(228, 386), 大小2028x209, 面積=423852
Region 4: 位置(330, 310), 大小1932x63, 面積=121716
Region 5: 位置(1990, 945), 大小375x212, 面積=79500
Region 6: 位置(327, 145), 大小203x101, 面積=20503
Region 7: 位置(1139, 3289), 大小174x63, 面積=10962
所有結果保存在: /Volumes/NV2/pdf_recognize/test_results/v5_pipeline