Paper A v13: add one-page Chinese change summary for co-author (Jimmy)

Standalone summary (md + docx) of the rev8->rev9.1 revisions for co-author review: claim-honesty changes (retract 139x, HC != reuse, specificity proxy, Firm A as known-positive, interviews as contextual), empirical additions (Table VI same-pair, F5 four-check suite, Table V pipeline audit, byte-id era split), three judgment calls needing sign-off (framing rebalance not relabel, no within-CPA hand-sign benchmark, pipeline finding is double-edged), and remaining author-only items. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com> Claude-Session: https://claude.ai/code/session_01Qn59FdF9JMyfFg3sjcUNNG
2026-06-23 15:56:50 +08:00
parent 2a13f0d985
commit dd7b0644d5
2 changed files with 38 additions and 0 deletions
@@ -0,0 +1,38 @@
+# Paper A v13 修訂摘要（給 Jimmy）— 2026-06-23
+
+**現行版本**：rev9.1（`Paper_full_v13_filled_rev9_20260623.docx` / PDF 同名）。源檔 `paper/v13_build/paper_v13_filled.md`，已 commit+push 至 `paper-a-v4-big4`。
+
+**一句話**：用三份 AI 審稿（Gemini 3.1 + ChatGPT 5.5 + Opus 4.8 融合，共 29 點；另加兩輪 ChatGPT 5.5 敵意審稿）逐點修訂。所有新數字皆由資料庫實算、可重現，**未杜撰任何數據**。
+
+---
+
+## 一、核心宣稱「誠實化」（最重要，請確認你能接受降溫幅度）
+
+- **撤回「139×」式比較**。原本「Firm A 觸發率 = 巧合率的 139 倍」是把「同一人重複」除以「不同人互撞」，方向高估。改為只報原始比率（A 82% vs B/C/D 24–35%），不再乘除。
+- **specificity → specificity proxy**：我們沒有 labeled negatives，明說 ICCR 是「不同會計師間的巧合率」，**不是**真正的偽陽率、連上下界都不是。
+- **新增 §III-F「What HC Means and Does Not Mean」**：白紙黑字寫「**HC 不是 reuse 標籤**」——HC 只代表「同一會計師極端重複、且在不相關會計師間罕見」。reuse 是其中一種詮釋，Firm A 由 byte-identical + 訪談另外支撐；**B/C/D 完全不作 reuse 宣稱**。
+- **Firm A 改稱 known-positive / quasi-positive benchmark**，不再包裝成嚴格 blinded test（因為訪談早已知道它是 stamping firm）。
+- **訪談降為 contextual / corroborative**，明說「非 validation、不可獨立重製」。
+
+## 二、新增的實證強化（讓宣稱更站得住）
+
+- **Table VI（any-pair vs same-pair）**：審稿質疑「cosine 與 dHash 來自不同配對、HC 是拼湊的」。實算反駁——改用嚴格 same-pair（同一配對需同時滿足兩條件），Firm A 仍 **57.3%**、B/C/D 跌到 5–9%，**A/其他的比值反而從 2.4–3.4× 升到 6.4–10.8×**。
+- **F5 穩健性四連檢**（§IV-C）：pool-size 分層、會計師層 bootstrap（差距 53.7pp [49.5, 57.5]）、firm+year 固定效果、逐年剔除（53.1–54.9pp）——firm 差異穿透所有控制。
+- **Table V — 影像管線審計（880 份 PDF）**：純掃描比例 2013 **82%** → 2021 **崩到 1%**，metadata 直接點名掃描機型（Fuji Xerox D125 等）。同時：(a) 坐實「事務所＝影像管線」混淆是真的；(b) 但 Firm A 在純掃描年代就已高 HC，反證其訊號**不是**數位化 artifact。
+- **byte-identical 分期**：262 筆中 30 筆在掃描年代（18 在 Firm A，掃描雜訊無法偽造 → 重用鐵證）、232 筆在數位年代（誠實標註此暴增含「可偵測性」成分）。
+- 其餘：Figure 3 換真實密度圖、新增 Figure 6 閾值敏感度面、G5 補「全庫期望巧合 HC ≈ 888 件」。
+
+## 三、需要你知道／拍板的三個判斷
+
+1. **Framing 採「rebalance 不 relabel」**：審稿建議把全文改寫成「無標籤校準方法（審計只是 case study）」。我**沒有照做最強版**——把方法升為主貢獻、但**保留審計發現當 headline**，且**不宣稱 "general framework"**（避免「一個案例憑什麼叫 general」的新攻擊）。請確認你同意這個定位。
+2. **不做 within-CPA「真親簽」對照組**：理想上該比「真人親簽的 HC 誤觸率」，但我們沒有標記的親簽資料、公開資料集又是不同族群——硬借會引入新假設。已在 §III-E 主動說明「考慮過、刻意不做」。
+3. **PDF 管線發現是雙刃**：它讓「事務所混淆」更嚴重（我們誠實寫出），但同時用掃描年代證據鞏固核心。兩面都寫了，沒挑對我們有利的講。
+
+## 四、剩餘待辦（你／投稿前）
+
+- 作者、機構、DOI、biography placeholder（double-blind，投稿前補）
+- IEEE 模板最終排版；related work 可再收斂；表格 II-b/IV 是否整併
+- 人工 review protocol 首次執行（未做，已列 future work）
+
+---
+*完整逐點對照見 `paper/fusion_review_todo.md`（29/29 已處理）。所有分析腳本在 `paper/v13_build/scripts/`，可一鍵重現。*