Files
pdf_signature_extraction/paper/變更摘要_給Jimmy_20260623.md
T
gbanyan dd7b0644d5 Paper A v13: add one-page Chinese change summary for co-author (Jimmy)
Standalone summary (md + docx) of the rev8->rev9.1 revisions for co-author
review: claim-honesty changes (retract 139x, HC != reuse, specificity proxy,
Firm A as known-positive, interviews as contextual), empirical additions
(Table VI same-pair, F5 four-check suite, Table V pipeline audit, byte-id era
split), three judgment calls needing sign-off (framing rebalance not relabel,
no within-CPA hand-sign benchmark, pipeline finding is double-edged), and
remaining author-only items.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
Claude-Session: https://claude.ai/code/session_01Qn59FdF9JMyfFg3sjcUNNG
2026-06-23 15:56:50 +08:00

39 lines
4.0 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# Paper A v13 修訂摘要(給 Jimmy)— 2026-06-23
**現行版本**rev9.1`Paper_full_v13_filled_rev9_20260623.docx` / PDF 同名)。源檔 `paper/v13_build/paper_v13_filled.md`,已 commit+push 至 `paper-a-v4-big4`
**一句話**:用三份 AI 審稿(Gemini 3.1 + ChatGPT 5.5 + Opus 4.8 融合,共 29 點;另加兩輪 ChatGPT 5.5 敵意審稿)逐點修訂。所有新數字皆由資料庫實算、可重現,**未杜撰任何數據**。
---
## 一、核心宣稱「誠實化」(最重要,請確認你能接受降溫幅度)
- **撤回「139×」式比較**。原本「Firm A 觸發率 = 巧合率的 139 倍」是把「同一人重複」除以「不同人互撞」,方向高估。改為只報原始比率(A 82% vs B/C/D 2435%),不再乘除。
- **specificity → specificity proxy**:我們沒有 labeled negatives,明說 ICCR 是「不同會計師間的巧合率」,**不是**真正的偽陽率、連上下界都不是。
- **新增 §III-F「What HC Means and Does Not Mean」**:白紙黑字寫「**HC 不是 reuse 標籤**」——HC 只代表「同一會計師極端重複、且在不相關會計師間罕見」。reuse 是其中一種詮釋,Firm A 由 byte-identical + 訪談另外支撐;**B/C/D 完全不作 reuse 宣稱**。
- **Firm A 改稱 known-positive / quasi-positive benchmark**,不再包裝成嚴格 blinded test(因為訪談早已知道它是 stamping firm)。
- **訪談降為 contextual / corroborative**,明說「非 validation、不可獨立重製」。
## 二、新增的實證強化(讓宣稱更站得住)
- **Table VIany-pair vs same-pair**:審稿質疑「cosine 與 dHash 來自不同配對、HC 是拼湊的」。實算反駁——改用嚴格 same-pair(同一配對需同時滿足兩條件),Firm A 仍 **57.3%**、B/C/D 跌到 59%**A/其他的比值反而從 2.43.4× 升到 6.410.8×**。
- **F5 穩健性四連檢**(§IV-C):pool-size 分層、會計師層 bootstrap(差距 53.7pp [49.5, 57.5])、firm+year 固定效果、逐年剔除(53.1–54.9pp)——firm 差異穿透所有控制。
- **Table V — 影像管線審計(880 份 PDF)**:純掃描比例 2013 **82%** → 2021 **崩到 1%**,metadata 直接點名掃描機型(Fuji Xerox D125 等)。同時:(a) 坐實「事務所=影像管線」混淆是真的;(b) 但 Firm A 在純掃描年代就已高 HC,反證其訊號**不是**數位化 artifact。
- **byte-identical 分期**262 筆中 30 筆在掃描年代(18 在 Firm A,掃描雜訊無法偽造 → 重用鐵證)、232 筆在數位年代(誠實標註此暴增含「可偵測性」成分)。
- 其餘:Figure 3 換真實密度圖、新增 Figure 6 閾值敏感度面、G5 補「全庫期望巧合 HC ≈ 888 件」。
## 三、需要你知道/拍板的三個判斷
1. **Framing 採「rebalance 不 relabel」**:審稿建議把全文改寫成「無標籤校準方法(審計只是 case study)」。我**沒有照做最強版**——把方法升為主貢獻、但**保留審計發現當 headline**,且**不宣稱 "general framework"**(避免「一個案例憑什麼叫 general」的新攻擊)。請確認你同意這個定位。
2. **不做 within-CPA「真親簽」對照組**:理想上該比「真人親簽的 HC 誤觸率」,但我們沒有標記的親簽資料、公開資料集又是不同族群——硬借會引入新假設。已在 §III-E 主動說明「考慮過、刻意不做」。
3. **PDF 管線發現是雙刃**:它讓「事務所混淆」更嚴重(我們誠實寫出),但同時用掃描年代證據鞏固核心。兩面都寫了,沒挑對我們有利的講。
## 四、剩餘待辦(你/投稿前)
- 作者、機構、DOI、biography placeholderdouble-blind,投稿前補)
- IEEE 模板最終排版;related work 可再收斂;表格 II-b/IV 是否整併
- 人工 review protocol 首次執行(未做,已列 future work
---
*完整逐點對照見 `paper/fusion_review_todo.md`29/29 已處理)。所有分析腳本在 `paper/v13_build/scripts/`,可一鍵重現。*