Paper A v13: add one-page Chinese change summary for co-author (Jimmy)
Standalone summary (md + docx) of the rev8->rev9.1 revisions for co-author review: claim-honesty changes (retract 139x, HC != reuse, specificity proxy, Firm A as known-positive, interviews as contextual), empirical additions (Table VI same-pair, F5 four-check suite, Table V pipeline audit, byte-id era split), three judgment calls needing sign-off (framing rebalance not relabel, no within-CPA hand-sign benchmark, pipeline finding is double-edged), and remaining author-only items. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com> Claude-Session: https://claude.ai/code/session_01Qn59FdF9JMyfFg3sjcUNNG
This commit is contained in:
Binary file not shown.
@@ -0,0 +1,38 @@
|
||||
# Paper A v13 修訂摘要(給 Jimmy)— 2026-06-23
|
||||
|
||||
**現行版本**:rev9.1(`Paper_full_v13_filled_rev9_20260623.docx` / PDF 同名)。源檔 `paper/v13_build/paper_v13_filled.md`,已 commit+push 至 `paper-a-v4-big4`。
|
||||
|
||||
**一句話**:用三份 AI 審稿(Gemini 3.1 + ChatGPT 5.5 + Opus 4.8 融合,共 29 點;另加兩輪 ChatGPT 5.5 敵意審稿)逐點修訂。所有新數字皆由資料庫實算、可重現,**未杜撰任何數據**。
|
||||
|
||||
---
|
||||
|
||||
## 一、核心宣稱「誠實化」(最重要,請確認你能接受降溫幅度)
|
||||
|
||||
- **撤回「139×」式比較**。原本「Firm A 觸發率 = 巧合率的 139 倍」是把「同一人重複」除以「不同人互撞」,方向高估。改為只報原始比率(A 82% vs B/C/D 24–35%),不再乘除。
|
||||
- **specificity → specificity proxy**:我們沒有 labeled negatives,明說 ICCR 是「不同會計師間的巧合率」,**不是**真正的偽陽率、連上下界都不是。
|
||||
- **新增 §III-F「What HC Means and Does Not Mean」**:白紙黑字寫「**HC 不是 reuse 標籤**」——HC 只代表「同一會計師極端重複、且在不相關會計師間罕見」。reuse 是其中一種詮釋,Firm A 由 byte-identical + 訪談另外支撐;**B/C/D 完全不作 reuse 宣稱**。
|
||||
- **Firm A 改稱 known-positive / quasi-positive benchmark**,不再包裝成嚴格 blinded test(因為訪談早已知道它是 stamping firm)。
|
||||
- **訪談降為 contextual / corroborative**,明說「非 validation、不可獨立重製」。
|
||||
|
||||
## 二、新增的實證強化(讓宣稱更站得住)
|
||||
|
||||
- **Table VI(any-pair vs same-pair)**:審稿質疑「cosine 與 dHash 來自不同配對、HC 是拼湊的」。實算反駁——改用嚴格 same-pair(同一配對需同時滿足兩條件),Firm A 仍 **57.3%**、B/C/D 跌到 5–9%,**A/其他的比值反而從 2.4–3.4× 升到 6.4–10.8×**。
|
||||
- **F5 穩健性四連檢**(§IV-C):pool-size 分層、會計師層 bootstrap(差距 53.7pp [49.5, 57.5])、firm+year 固定效果、逐年剔除(53.1–54.9pp)——firm 差異穿透所有控制。
|
||||
- **Table V — 影像管線審計(880 份 PDF)**:純掃描比例 2013 **82%** → 2021 **崩到 1%**,metadata 直接點名掃描機型(Fuji Xerox D125 等)。同時:(a) 坐實「事務所=影像管線」混淆是真的;(b) 但 Firm A 在純掃描年代就已高 HC,反證其訊號**不是**數位化 artifact。
|
||||
- **byte-identical 分期**:262 筆中 30 筆在掃描年代(18 在 Firm A,掃描雜訊無法偽造 → 重用鐵證)、232 筆在數位年代(誠實標註此暴增含「可偵測性」成分)。
|
||||
- 其餘:Figure 3 換真實密度圖、新增 Figure 6 閾值敏感度面、G5 補「全庫期望巧合 HC ≈ 888 件」。
|
||||
|
||||
## 三、需要你知道/拍板的三個判斷
|
||||
|
||||
1. **Framing 採「rebalance 不 relabel」**:審稿建議把全文改寫成「無標籤校準方法(審計只是 case study)」。我**沒有照做最強版**——把方法升為主貢獻、但**保留審計發現當 headline**,且**不宣稱 "general framework"**(避免「一個案例憑什麼叫 general」的新攻擊)。請確認你同意這個定位。
|
||||
2. **不做 within-CPA「真親簽」對照組**:理想上該比「真人親簽的 HC 誤觸率」,但我們沒有標記的親簽資料、公開資料集又是不同族群——硬借會引入新假設。已在 §III-E 主動說明「考慮過、刻意不做」。
|
||||
3. **PDF 管線發現是雙刃**:它讓「事務所混淆」更嚴重(我們誠實寫出),但同時用掃描年代證據鞏固核心。兩面都寫了,沒挑對我們有利的講。
|
||||
|
||||
## 四、剩餘待辦(你/投稿前)
|
||||
|
||||
- 作者、機構、DOI、biography placeholder(double-blind,投稿前補)
|
||||
- IEEE 模板最終排版;related work 可再收斂;表格 II-b/IV 是否整併
|
||||
- 人工 review protocol 首次執行(未做,已列 future work)
|
||||
|
||||
---
|
||||
*完整逐點對照見 `paper/fusion_review_todo.md`(29/29 已處理)。所有分析腳本在 `paper/v13_build/scripts/`,可一鍵重現。*
|
||||
Reference in New Issue
Block a user