## 研究成果 ### PP-OCRv5 API 測試 - 成功升級到 PaddleOCR 3.3.2 (PP-OCRv5) - 理解新 API 結構和調用方式 - 驗證基礎檢測功能 ### 關鍵發現 ❌ PP-OCRv5 **沒有內建手寫分類功能** - text_type 字段是語言類型,不是手寫/印刷分類 - 仍需要 OpenCV Method 3 來分離手寫和印刷文字 ### 完整 Pipeline 對比測試 - v4 (2.7.3): 檢測 14 個文字 → 4 個候選區域 - v5 (3.3.2): 檢測 50 個文字 → 7 個候選區域 - 主簽名區域:兩個版本幾乎相同 (1150x511 vs 1144x511) ### 性能分析 優點: - v5 手寫識別準確率 +13.7% (文檔承諾) - 可能減少漏檢 缺點: - 過度檢測(印章小字等) - API 完全重寫,不兼容 - 仍無法替代 OpenCV Method 3 ### 文件 - PP_OCRV5_RESEARCH_FINDINGS.md: 完整研究報告 - signature-comparison/: v4 vs v5 對比結果 - test_results/: v5 測試輸出 - test_*_pipeline.py: 完整測試腳本 ### 建議 當前方案(v2.7.3 + OpenCV Method 3)已足夠穩定, 除非遇到大量漏檢,否則暫不升級到 v5。 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
21 lines
837 B
Plaintext
21 lines
837 B
Plaintext
|
|
PP-OCRv5 完整 Pipeline 測試結果
|
|
============================================================
|
|
|
|
1. OCR 檢測: 50 個文字區域
|
|
2. 遮罩印刷文字: /Volumes/NV2/pdf_recognize/test_results/v5_pipeline/01_masked.png
|
|
3. 檢測候選區域: 7 個
|
|
4. 提取簽名: 7 個
|
|
|
|
候選區域詳情:
|
|
------------------------------------------------------------
|
|
Region 1: 位置(1218, 877), 大小1144x511, 面積=584584
|
|
Region 2: 位置(1213, 1457), 大小961x196, 面積=188356
|
|
Region 3: 位置(228, 386), 大小2028x209, 面積=423852
|
|
Region 4: 位置(330, 310), 大小1932x63, 面積=121716
|
|
Region 5: 位置(1990, 945), 大小375x212, 面積=79500
|
|
Region 6: 位置(327, 145), 大小203x101, 面積=20503
|
|
Region 7: 位置(1139, 3289), 大小174x63, 面積=10962
|
|
|
|
所有結果保存在: /Volumes/NV2/pdf_recognize/test_results/v5_pipeline
|