pdf_signature_extraction/signature_analysis at 39575cef49ca78067ad8717e943b08a2a3cd5eb6 - pdf_signature_extraction - Gitea

gbanyan/pdf_signature_extraction

Files

T

History

gbanyan 39575cef49 Add script 39: signature-level convergence (SIG_CONVERGENCE_MODERATE)

Phase 1.7 follow-up to Script 38's per-CPA convergence. Tests
whether the convergence holds at signature granularity, preempting
"per-CPA aggregation washes out signal" reviewer attacks.

Three signature-level labels per Big-4 signature (n=150,442):
  L1 PaperA      non_hand iff cos > 0.95 AND dh <= 5
  L2 K=3 perCPA  hard assignment under per-CPA-fit components
  L3 K=3 perSig  hard assignment under fresh signature-level fit

Component comparison (per-CPA vs per-signature K=3):

  Component        Per-CPA cos/dh/wt     Per-Sig cos/dh/wt
  C1 hand-leaning  0.9457/9.17/0.143     0.9280/9.75/0.146
  C2 mixed         0.9558/6.66/0.536     0.9625/6.04/0.582
  C3 replicated    0.9826/2.41/0.321     0.9890/1.27/0.272

  Component drift modest: max |dcos| = 0.018, max |ddh| = 1.15.

Cohen kappa (binary, 1 = replicated):

  PaperA vs K=3 perCPA       kappa = 0.6616  substantial
  PaperA vs K=3 perSig       kappa = 0.5586  moderate
  K=3 perCPA vs K=3 perSig   kappa = 0.8701  almost perfect

Per-firm binary agreement PaperA vs K=3 perCPA:

  Firm A 86.13%, KPMG 77.46%, PwC 82.64%, EY 85.01%.

Verdict: SIG_CONVERGENCE_MODERATE (all kappas >= 0.40; per-CPA
aggregation captures most signature-level structure).

Implication for v4.0: per-CPA K=3 is robust to aggregation level
(kappa = 0.87 vs per-signature fit). The modest disagreement
between K=3 and Paper A's box rule (kappa 0.56-0.66) reflects
different decision geometries -- K=3 posterior soft boundary vs
Paper A rectangle box -- not a fundamental signal disagreement.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-12 15:07:48 +08:00

..

01_init_database.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

02_extract_features.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

03_similarity_analysis.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

04_generate_visual_report.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

05_extract_names_full.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

05_extract_names.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

07_cleanup_and_assign.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

08_accountant_similarity_analysis.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

09_pdf_signature_verdict.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

10_formal_statistical_analysis.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

11_compute_ssim_phash.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

12_generate_pdf_level_report.py

Add Paper A (IEEE TAI) complete draft with Firm A-calibrated dual-method classification

2026-04-06 23:05:33 +08:00

13_deloitte_distribution_analysis.py

Add Deloitte distribution & independent dHash analysis scripts

2026-04-20 21:34:24 +08:00

14_compute_independent_dhash.py

Add Deloitte distribution & independent dHash analysis scripts

2026-04-20 21:34:24 +08:00

15_hartigan_dip_test.py

Correct Firm A framing: replication-dominated, not pure

2026-04-20 21:57:16 +08:00

16_bd_mccrary_discontinuity.py

Correct Firm A framing: replication-dominated, not pure

2026-04-20 21:57:16 +08:00

17_beta_mixture_em.py

Add three-convergent-method threshold scripts + pixel-identity validation

2026-04-20 21:51:41 +08:00

18_accountant_mixture.py

Correct Firm A framing: replication-dominated, not pure

2026-04-20 21:57:16 +08:00

19_pixel_identity_validation.py

Paper A v3.18.2: address codex GPT-5.5 round-16 Minor-Revision findings

2026-04-27 20:23:08 +08:00

20_accountant_level_three_methods.py

Paper A v3.1: apply codex peer-review fixes + add Scripts 20/21

2026-04-21 01:11:51 +08:00

21_expanded_validation.py

Paper A v3.20.0: partner Jimmy 2026-04-27 review + DOCX rendering overhaul

2026-05-06 13:44:49 +08:00

22_partner_ranking.py

Paper A v3.2: partner v4 feedback integration (threshold-independent benchmark validation)

2026-04-21 01:59:49 +08:00

23_intra_report_consistency.py

Paper A v3.2: partner v4 feedback integration (threshold-independent benchmark validation)

2026-04-21 01:59:49 +08:00

24_validation_recalibration.py

Paper A v3.5: resolve codex round-4 residual issues

2026-04-21 12:23:03 +08:00

25_bd_mccrary_sensitivity.py

Paper A v3.7: demote BD/McCrary to density-smoothness diagnostic; add Appendix A

2026-04-21 14:32:50 +08:00

27_within_year_uniformity.py

Add script 27: within-auditor-year uniformity empirical check (A2 test)

2026-05-12 11:34:17 +08:00

28_byte_identity_decomposition.py

Paper A v3.18.4: address codex GPT-5.5 round-18 self-comparing review findings

2026-04-27 20:59:07 +08:00

29_firm_a_yearly_distribution.py

Paper A v3.19.0: address Gemini 3.1 Pro round-19 Major Revision findings

2026-04-27 21:40:42 +08:00

30_yearly_big4_comparison.py

Paper A v3.20.0: partner Jimmy 2026-04-27 review + DOCX rendering overhaul

2026-05-06 13:44:49 +08:00

31_within_year_ranking_robustness.py

Paper A v3.20.0: partner Jimmy 2026-04-27 review + DOCX rendering overhaul

2026-05-06 13:44:49 +08:00

32_non_firm_a_calibration.py

Add script 32: non-Firm-A calibration spike (verdict C with twist)

2026-05-12 12:05:18 +08:00

33_reverse_anchor_spike.py

Add script 33: reverse-anchor spike (PAPER_C_STRONG verdict)

2026-05-12 12:09:36 +08:00

34_big4_only_pooled_calibration.py

Add scripts 34 + 35: Big-4-only calibration foundation

2026-05-12 14:35:37 +08:00

35_big4_k3_cluster_names.py

Add scripts 34 + 35: Big-4-only calibration foundation

2026-05-12 14:35:37 +08:00

36_v4_calibration_and_loo.py

Add script 36: v4.0 calibration + LOOO validation (UNSTABLE verdict)

2026-05-12 14:54:54 +08:00

37_v4_k3_loo_check.py

Add script 37: K=3 LOOO check (P2_PARTIAL — v4.0 is salvageable with K=3)

2026-05-12 14:57:40 +08:00

38_v4_convergence_k3_and_reverse_anchor.py

Add script 38: v4.0 convergence (CONVERGENCE_STRONG, three lenses agree)

2026-05-12 15:03:55 +08:00

39_v4_signature_level_convergence.py

Add script 39: signature-level convergence (SIG_CONVERGENCE_MODERATE)

2026-05-12 15:07:48 +08:00

THRESHOLD_VALIDATION_OPTIONS.md

Add Deloitte distribution & independent dHash analysis scripts

2026-04-20 21:34:24 +08:00