pdf_signature_extraction/paper/變更摘要_給Jimmy_20260623.md

# Paper A v13 修訂摘要（給 Jimmy）— 2026-06-23

**現行版本**：rev9.1（`Paper_full_v13_filled_rev9_20260623.docx` / PDF 同名）。源檔 `paper/v13_build/paper_v13_filled.md`，已 commit+push 至 `paper-a-v4-big4`。

**一句話**：用三份 AI 審稿（Gemini 3.1 + ChatGPT 5.5 + Opus 4.8 融合，共 29 點；另加兩輪 ChatGPT 5.5 敵意審稿）逐點修訂。所有新數字皆由資料庫實算、可重現，**未杜撰任何數據**。

---

## 一、核心宣稱「誠實化」（最重要，請確認你能接受降溫幅度）

- **撤回「139×」式比較**。原本「Firm A 觸發率 = 巧合率的 139 倍」是把「同一人重複」除以「不同人互撞」，方向高估。改為只報原始比率（A 82% vs B/C/D 24–35%），不再乘除。
- **specificity → specificity proxy**：我們沒有 labeled negatives，明說 ICCR 是「不同會計師間的巧合率」，**不是**真正的偽陽率、連上下界都不是。
- **新增 §III-F「What HC Means and Does Not Mean」**：白紙黑字寫「**HC 不是 reuse 標籤**」——HC 只代表「同一會計師極端重複、且在不相關會計師間罕見」。reuse 是其中一種詮釋，Firm A 由 byte-identical + 訪談另外支撐；**B/C/D 完全不作 reuse 宣稱**。
- **Firm A 改稱 known-positive / quasi-positive benchmark**，不再包裝成嚴格 blinded test（因為訪談早已知道它是 stamping firm）。
- **訪談降為 contextual / corroborative**，明說「非 validation、不可獨立重製」。

## 二、新增的實證強化（讓宣稱更站得住）

- **Table VI（any-pair vs same-pair）**：審稿質疑「cosine 與 dHash 來自不同配對、HC 是拼湊的」。實算反駁——改用嚴格 same-pair（同一配對需同時滿足兩條件），Firm A 仍 **57.3%**、B/C/D 跌到 5–9%，**A/其他的比值反而從 2.4–3.4× 升到 6.4–10.8×**。
- **F5 穩健性四連檢**（§IV-C）：pool-size 分層、會計師層 bootstrap（差距 53.7pp [49.5, 57.5]）、firm+year 固定效果、逐年剔除（53.1–54.9pp）——firm 差異穿透所有控制。
- **Table V — 影像管線審計（880 份 PDF）**：純掃描比例 2013 **82%** → 2021 **崩到 1%**，metadata 直接點名掃描機型（Fuji Xerox D125 等）。同時：(a) 坐實「事務所＝影像管線」混淆是真的；(b) 但 Firm A 在純掃描年代就已高 HC，反證其訊號**不是**數位化 artifact。
- **byte-identical 分期**：262 筆中 30 筆在掃描年代（18 在 Firm A，掃描雜訊無法偽造 → 重用鐵證）、232 筆在數位年代（誠實標註此暴增含「可偵測性」成分）。
- 其餘：Figure 3 換真實密度圖、新增 Figure 6 閾值敏感度面、G5 補「全庫期望巧合 HC ≈ 888 件」。

## 三、需要你知道／拍板的三個判斷

1. **Framing 採「rebalance 不 relabel」**：審稿建議把全文改寫成「無標籤校準方法（審計只是 case study）」。我**沒有照做最強版**——把方法升為主貢獻、但**保留審計發現當 headline**，且**不宣稱 "general framework"**（避免「一個案例憑什麼叫 general」的新攻擊）。請確認你同意這個定位。
2. **不做 within-CPA「真親簽」對照組**：理想上該比「真人親簽的 HC 誤觸率」，但我們沒有標記的親簽資料、公開資料集又是不同族群——硬借會引入新假設。已在 §III-E 主動說明「考慮過、刻意不做」。
3. **PDF 管線發現是雙刃**：它讓「事務所混淆」更嚴重（我們誠實寫出），但同時用掃描年代證據鞏固核心。兩面都寫了，沒挑對我們有利的講。

## 四、剩餘待辦（你／投稿前）

- 作者、機構、DOI、biography placeholder（double-blind，投稿前補）
- IEEE 模板最終排版；related work 可再收斂；表格 II-b/IV 是否整併
- 人工 review protocol 首次執行（未做，已列 future work）

---
*完整逐點對照見 `paper/fusion_review_todo.md`（29/29 已處理）。所有分析腳本在 `paper/v13_build/scripts/`，可一鍵重現。*