Complete PP-OCRv5 research and v4 vs v5 comparison

## 研究成果

### PP-OCRv5 API 測試
- 成功升級到 PaddleOCR 3.3.2 (PP-OCRv5)
- 理解新 API 結構和調用方式
- 驗證基礎檢測功能

### 關鍵發現
 PP-OCRv5 **沒有內建手寫分類功能**
- text_type 字段是語言類型,不是手寫/印刷分類
- 仍需要 OpenCV Method 3 來分離手寫和印刷文字

### 完整 Pipeline 對比測試
- v4 (2.7.3): 檢測 14 個文字 → 4 個候選區域
- v5 (3.3.2): 檢測 50 個文字 → 7 個候選區域
- 主簽名區域:兩個版本幾乎相同 (1150x511 vs 1144x511)

### 性能分析
優點:
- v5 手寫識別準確率 +13.7% (文檔承諾)
- 可能減少漏檢

缺點:
- 過度檢測(印章小字等)
- API 完全重寫,不兼容
- 仍無法替代 OpenCV Method 3

### 文件
- PP_OCRV5_RESEARCH_FINDINGS.md: 完整研究報告
- signature-comparison/: v4 vs v5 對比結果
- test_results/: v5 測試輸出
- test_*_pipeline.py: 完整測試腳本

### 建議
當前方案(v2.7.3 + OpenCV Method 3)已足夠穩定,
除非遇到大量漏檢,否則暫不升級到 v5。

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
This commit is contained in:
2025-11-27 11:21:55 +08:00
parent 8f231da3bc
commit 21df0ff387
10 changed files with 3726 additions and 0 deletions

View File

@@ -0,0 +1,58 @@
PP-OCRv5 檢測結果詳細報告
================================================================================
總數: 50
平均置信度: 0.4579
完整檢測列表:
--------------------------------------------------------------------------------
[ 0] 0.8783 202x100 KPMG
[ 1] 0.9936 1931x 62 依本會計師核閱結果,除第三段及第四段所述該等被投資公司財務季報告倘經會計師核閱
[ 2] 0.9976 2013x 62 ,對第一段所述合併財務季報告可能有所調整之影響外,並未發現第一段所述合併財務季報告
[ 3] 0.9815 2025x 62 在所有重大方面有違反證券發行人財務報告編製準則及金融監督管理委員會認可之國際會計準
[ 4] 0.9912 1125x 56 則第三十四號「期中財務報導」而須作修正之情事。
[ 5] 0.9712 872x 61 安侯建業聯合會計師事務所
[ 6] 0.9123 174x203 寶
[ 7] 0.8466 166x179 蓮
[ 8] 0.0000 36x 18
[ 9] 0.9968 175x193 周
[10] 0.0000 33x 69
[11] 0.2521 7x 12 5
[12] 0.0000 35x 13
[13] 0.0000 28x 10
[14] 0.4726 12x 9 vA
[15] 0.1788 9x 11 上
[16] 0.0000 38x 14
[17] 0.4133 21x 8 R-
[18] 0.4681 15x 8 40
[19] 0.0000 38x 13
[20] 0.5587 16x 7 GAN
[21] 0.9623 291x 61 會計師:
[22] 0.9893 213x234 魏
[23] 0.1751 190x174 興
[24] 0.8862 180x191 海
[25] 0.0000 65x 17
[26] 0.5110 27x 7 U
[27] 0.1669 10x 8 2
[28] 0.4839 39x 10 eredooos
[29] 0.1775 10x 24 B
[30] 0.4896 29x 10 n
[31] 0.3774 7x 7 1
[32] 0.0000 34x 14
[33] 0.0000 7x 15
[34] 0.0000 12x 38
[35] 0.8701 22x 11 0
[36] 0.2034 8x 23 40
[37] 0.0000 20x 12
[38] 0.0000 29x 10
[39] 0.0970 9x 10 m
[40] 0.3102 20x 7 A
[41] 0.0000 34x 6
[42] 0.2435 21x 6 专
[43] 0.3260 41x 15 o
[44] 0.0000 31x 7
[45] 0.9769 960x 73 證券主管機關金管證六字第0940100754號
[46] 0.9747 899x 60 核准簽證文號(88)台財證(六)第18311號
[47] 0.9205 824x 67 民國一〇二年五月二
[48] 0.9996 47x 46 日
[49] 0.8414 173x 62 ~3-1~

View File

@@ -0,0 +1,20 @@
PP-OCRv5 完整 Pipeline 測試結果
============================================================
1. OCR 檢測: 50 個文字區域
2. 遮罩印刷文字: /Volumes/NV2/pdf_recognize/test_results/v5_pipeline/01_masked.png
3. 檢測候選區域: 7 個
4. 提取簽名: 7 個
候選區域詳情:
------------------------------------------------------------
Region 1: 位置(1218, 877), 大小1144x511, 面積=584584
Region 2: 位置(1213, 1457), 大小961x196, 面積=188356
Region 3: 位置(228, 386), 大小2028x209, 面積=423852
Region 4: 位置(330, 310), 大小1932x63, 面積=121716
Region 5: 位置(1990, 945), 大小375x212, 面積=79500
Region 6: 位置(327, 145), 大小203x101, 面積=20503
Region 7: 位置(1139, 3289), 大小174x63, 面積=10962
所有結果保存在: /Volumes/NV2/pdf_recognize/test_results/v5_pipeline

2283
test_results/v5_result.json Normal file

File diff suppressed because it is too large Load Diff