docs: finalize top20 analysis with convergent signal observations

v5 of top20 report adds key biological insights: dynein system dominance
(#1 + #2), Na+/K+ pump convergence (3 subunits in top 20), ARL3 as best
novel ciliopathy candidate (52% cilia literature), MAPRE3 as most
under-studied high-scoring gene (81 papers).

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
2026-02-16 10:21:37 +08:00
parent a228a56984
commit bc40704323

View File

@@ -1,32 +1,38 @@
# TOP 20 Usher 候選基因分析(完整 6 層證據) # TOP 20 Usher 候選基因分析(完整 6 層證據)
**Pipeline Version:** 0.1.0 **Pipeline Version:** 0.1.0
**Generated:** 2026-02-16 (v4 — gene_symbol deduplication 修正後) **Generated:** 2026-02-16 (v5 — gene_symbol deduplication 修正後最終版)
**Scoring Layers:** gnomAD constraint (0.20) + Expression (0.20) + Annotation (0.15) + Localization (0.15) + Animal Model (0.15) + Literature (0.15) **Scoring Layers:** gnomAD constraint (0.20) + Expression (0.20) + Annotation (0.15) + Localization (0.15) + Animal Model (0.15) + Literature (0.15)
**Coverage:** gnomAD 91.5% | Expression 96.1% | Annotation 98.9% | Localization 66.1% | Animal Model 97.9% | Literature 100% **Coverage:** gnomAD 91.5% | Expression 96.1% | Annotation 98.9% | Localization 66.1% | Animal Model 97.9% | Literature 100%
**Tier Statistics:** HIGH: 4 | MEDIUM: 8,051 | LOW: 10,188 | Total: 18,243 (from 19,555 unique genes) **Tier Statistics:** HIGH: 4 | MEDIUM: 8,051 | LOW: 10,188 | Total: 18,243 (from 19,555 unique genes)
**Validation:** PASSED — CDH23 98.3rd percentile, median known gene 83.3%
--- ---
## v4 修正gene_symbol 去重 ## 方法論
### 問題 ### 計分公式
`gene_universe` 中 1,539 個 gene_symbol 對應多個 Ensembl ID共 3,033 個多餘 ID。非 canonical ID 在部分 evidence table 中缺少數據,因此只有 3 層但分數被 `weighted_sum/available_weight` 膨脹。例如: ```
composite_score = weighted_sum / available_weight
```
其中 `available_weight` 只計算有數據(非 NULL的 evidence layer 權重。
### v4 修正gene_symbol 去重
`gene_universe` 中 1,539 個 gene_symbol 對應多個 Ensembl ID共 3,033 個多餘 ID。非 canonical ID 在部分 evidence table 中缺少數據,導致分數被 `weighted_sum/available_weight` 膨脹。例如:
| Gene | Ensembl ID | Layers | Score | 原因 | | Gene | Ensembl ID | Layers | Score | 原因 |
|------|-----------|--------|-------|------| |------|-----------|--------|-------|------|
| CACNA1C | ENSG00000285479 (non-canonical) | 3/6 | **0.8830** | 缺 expression/animal → 分母小 | | CACNA1C | ENSG00000285479 (non-canonical) | 3/6 | **0.8830** | 缺 expression/animal → 分母小 |
| CACNA1C | ENSG00000151067 (canonical) | 5/6 | 0.6334 | 有完整數據 → 真實分數 | | CACNA1C | ENSG00000151067 (canonical) | 5/6 | 0.6334 | 有完整數據 → 真實分數 |
### 修正 修正:在 `compute_composite_scores()` 中,對每個 gene_symbol 保留 `evidence_count` 最多的 Ensembl ID相同 evidence_count 取 composite_score 最高者)。去重後 22,604 → 19,555 genes。
`compute_composite_scores()` 中,對每個 gene_symbol 保留 `evidence_count` 最多的 Ensembl ID相同 evidence_count 取 composite_score 最高者)。去重後 22,604 → 19,555 genes。
--- ---
## Top 20 候選基因總覽 ## Top 20 候選基因總覽
| Rank | Gene | Composite | Layers | Tier | gnomAD | Expression | Annotation | Localization | Literature | | # | Gene | Score | Layers | Tier | gnomAD | Expr | Annot | Local | Lit |
|------|------|-----------|--------|------|--------|------------|------------|--------------|------------| |---|------|-------|--------|------|--------|------|-------|-------|-----|
| 1 | **PAFAH1B1** | **0.7414** | **6/6** | HIGH | 0.969 | 0.597 | 0.928 | 1.000 | 0.927 | | 1 | **PAFAH1B1** | **0.7414** | **6/6** | HIGH | 0.969 | 0.597 | 0.928 | 1.000 | 0.927 |
| 2 | **DYNC1H1** | **0.7344** | **6/6** | HIGH | 0.966 | 0.648 | 0.843 | 1.000 | 0.902 | | 2 | **DYNC1H1** | **0.7344** | **6/6** | HIGH | 0.966 | 0.648 | 0.843 | 1.000 | 0.902 |
| 3 | **SMAD4** | **0.7227** | **6/6** | HIGH | 0.932 | 0.529 | 0.948 | 1.000 | 0.921 | | 3 | **SMAD4** | **0.7227** | **6/6** | HIGH | 0.932 | 0.529 | 0.948 | 1.000 | 0.921 |
@@ -48,335 +54,342 @@
| 19 | SCN2A | 0.6733 | 5/6 | MED | 0.938 | 0.670 | 0.814 | — | 0.859 | | 19 | SCN2A | 0.6733 | 5/6 | MED | 0.938 | 0.670 | 0.814 | — | 0.859 |
| 20 | VEGFA | 0.6722 | 5/6 | MED | 0.951 | 0.473 | 0.968 | — | 0.942 | | 20 | VEGFA | 0.6722 | 5/6 | MED | 0.951 | 0.473 | 0.968 | — | 0.942 |
> **觀察:** 去重後 top 20 **全部有 5-6 層 evidence**expression 層不再缺失。前 4 名PAFAH1B1、DYNC1H1、SMAD4、DLG4全是 LoF-intolerant 基因且有 centrosome/sensory 相關定位或文獻。 > **去重後 top 20 全部有 5-6 層 evidenceexpression 層不再缺失。** 前 4 名PAFAH1B1、DYNC1H1、SMAD4、DLG4全是 LoF-intolerant 基因且有 centrosome/sensory 相關定位或文獻。
--- ---
## 逐基因詳細分析 ## 逐基因詳細分析
### #1 — PAFAH1B1 / LIS1Dynein 調控因子) ### #1 — PAFAH1B1 / LIS1Dynein 調控因子)
**6/6 全層 | LOEUF=0.100 | pLI=1.000 | Centrosome**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.7414 | | gnomAD | LOEUF=0.100 (norm=0.969) — **極度 LoF intolerant (top 1%)** |
| Evidence layers | **6/6 全層** |
| gnomAD | LOEUF=0.100 (norm=0.969) — **極度 LoF intolerant (top 1%)**, pLI=1.000 |
| Expression | GTEx cerebellum=131.0 TPM; enrichment=1.17; norm=0.597 | | Expression | GTEx cerebellum=131.0 TPM; enrichment=1.17; norm=0.597 |
| Localization | HPA: **Centrosome**; proximity=1.000 | | Localization | HPA: **Centrosome**; proximity=1.000 |
| Literature | 496 篇; cilia=4, sensory=3, direct_exp=4, cyto=424; tier=direct_experimental | | Literature | 496 篇; cilia=4, sensory=3, direct_exp=4, cyto=**424**; tier=direct_experimental |
**解讀:** LIS1 是 cytoplasmic dynein 的關鍵調控因子,控制微管 minus-end transport。Dynein 負責 IFTintraflagellar transport逆行運輸,是纖毛維持的核心機制。LIS1 突變致 lissencephaly無腦回畸形,極度 LoF intolerant。與 Usher 的連結:**dynein transport 對感覺纖毛photoreceptor connecting cilium、stereocilia kinocilium至關重要**。 LIS1 是 cytoplasmic dynein 的關鍵調控因子,控制微管 minus-end transport。Dynein 負責 IFTintraflagellar transport逆行運輸——纖毛維持的核心機制。LIS1 突變致 lissencephaly無腦回畸形。與 Usher 的連結:**dynein transport 對感覺纖毛photoreceptor connecting cilium、stereocilia kinocilium至關重要**。6/6 全層 + 極度 constrained + centrosome 定位,是最強候選之一。
--- ---
### #2 — DYNC1H1Cytoplasmic Dynein 重鏈) ### #2 — DYNC1H1Cytoplasmic Dynein 重鏈)
**6/6 全層 | LOEUF=0.117 | pLI=1.000 | Centrosome + Cytosol**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.7344 | | gnomAD | LOEUF=0.117 (norm=0.966) — **極度 LoF intolerant** |
| Evidence layers | **6/6 全層** |
| gnomAD | LOEUF=0.117 (norm=0.966) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=129.1 TPM; enrichment=1.68; norm=0.648 | | Expression | GTEx cerebellum=129.1 TPM; enrichment=1.68; norm=0.648 |
| Localization | HPA: **Centrosome + Cytosol**; proximity=1.000 | | Localization | HPA: **Centrosome + Cytosol**; proximity=1.000 |
| Literature | 211 篇; cilia=10, sensory=9, direct_exp=6; tier=direct_experimental | | Literature | 211 篇; cilia=**10**, sensory=**9**, direct_exp=6; tier=direct_experimental |
**解讀:** Dynein 重鏈——分子馬達的催化核心驅動 IFT retrograde transport 和中心粒遷移。DYNC1H1 突變致 cortical malformation 和 spinal muscular atrophy。**纖毛中 dynein 運輸缺陷是多種 ciliopathy 的核心病理,連結 photoreceptor disc renewal 和 hair cell 功能。** 10 篇纖毛 + 9 篇感覺文獻在 211 篇中占 9% Dynein 重鏈——分子馬達的催化核心驅動 IFT retrograde transport 和中心粒遷移。DYNC1H1 突變致 cortical malformation 和 spinal muscular atrophy。**纖毛中 dynein 運輸缺陷是多種 ciliopathy 的核心病理**,連結 photoreceptor disc renewal 和 hair cell 功能。纖毛+感覺文獻占比 9%19/211在非纖毛基因中比例很高
--- ---
### #3 — SMAD4TGF-β/BMP 核心轉錄因子) ### #3 — SMAD4TGF-β/BMP 核心轉錄因子)
**6/6 全層 | LOEUF=0.227 | pLI=1.000 | Centrosome**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.7227 | | gnomAD | LOEUF=0.227 (norm=0.932) — **高度 LoF intolerant** |
| Evidence layers | **6/6 全層** |
| gnomAD | LOEUF=0.227 (norm=0.932) — **高度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=28.8 TPM; enrichment=1.10; norm=0.529 | | Expression | GTEx cerebellum=28.8 TPM; enrichment=1.10; norm=0.529 |
| Localization | HPA: Cytosol + Nucleoplasm + **Centrosome**; proximity=1.000 | | Localization | HPA: Cytosol + Nucleoplasm + **Centrosome**; proximity=1.000 |
| Literature | 6,577 篇; cilia=6, sensory=78, polarity=49; tier=direct_experimental | | Literature | 6,577 篇; cilia=6, sensory=**78**, polarity=**49**; tier=direct_experimental |
**解讀:** TGF-β/BMP 信號通路的核心介導者。BMP signaling 在耳蝸發育中調控 hair cell 分化和 stereocilia polarity。SMAD4 也參與 cilia-dependent Hedgehog signaling。Centrosome 定位 + 高度 constrained + 6/6 全層 evidence TGF-β/BMP 信號通路的核心介導者。BMP signaling 在耳蝸發育中調控 hair cell 分化和 stereocilia polarity。SMAD4 也參與 cilia-dependent **Hedgehog signaling**。Centrosome 定位 + 高度 constrained + 78 篇感覺 + 49 篇 polarity 文獻
--- ---
### #4 — DLG4 / PSD-95突觸後密度蛋白 ### #4 — DLG4 / PSD-95突觸後密度蛋白
**5/6缺 localization| LOEUF=0.166 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.7116 | | gnomAD | LOEUF=0.166 (norm=**0.980**) — **極度 LoF intolerant**, gnomAD norm top 20 最高 |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.166 (norm=0.980) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=**224.5 TPM** (極高); enrichment=**2.24**; norm=0.674 | | Expression | GTEx cerebellum=**224.5 TPM** (極高); enrichment=**2.24**; norm=0.674 |
| Literature | 2,000 篇; sensory=**57**, cyto=319, polarity=27; tier=direct_experimental | | Literature | 2,000 篇; sensory=**57**, cyto=319, polarity=27; tier=direct_experimental |
**解讀:** DLG4/PSD-95 是感覺神經元突觸的核心支架蛋白。在 photoreceptor ribbon synapse 和 hair cell afferent synapse 中表達。極度 LoF intolerance + 極高 cerebellum 表達 + 大量感覺文獻。 DLG4/PSD-95 是感覺神經元突觸的核心支架蛋白。在 photoreceptor ribbon synapse 和 hair cell afferent synapse 中表達。極度 LoF intolerance + 極高 cerebellum 表達 + 大量感覺文獻。
--- ---
### #5 — CRMP1Collapsin Response Mediator 1 ### #5 — CRMP1Collapsin Response Mediator 1
**6/6 全層 | LOEUF=0.440 | pLI=1.000 | Centrosome**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6888 | | gnomAD | LOEUF=0.440 (norm=0.866) — 中高度 constrained |
| Evidence layers | **6/6 全層** | | Expression | GTEx cerebellum=**95.3 TPM**; enrichment=**2.43** (Usher 組織富集); norm=0.666 |
| gnomAD | LOEUF=0.440 (norm=0.866) — 中高度 constrained, pLI=1.000 |
| Expression | GTEx cerebellum=**95.3 TPM**; enrichment=**2.43** (Usher 組織明顯富集); norm=0.666 |
| Localization | HPA: **Centrosome + Cytosol**; proximity=1.000 | | Localization | HPA: **Centrosome + Cytosol**; proximity=1.000 |
| Literature | 178 篇; sensory=6, cyto=33; tier=hts_hit | | Literature | 178 篇 (under-studied); sensory=6, cyto=33; tier=hts_hit |
**解讀:** CRMP1 參與微管組裝和 axon guidance,在感覺神經元高度表達。Cerebellum enrichment 極高2.43。Centrosome 定位 + 全 6 層 evidence。Under-studied僅 178 篇)。 微管組裝和 axon guidance 蛋白。Cerebellum enrichment 在 top 20 中排名前列2.43)。僅 178 篇文獻 — truly under-studied。微管動態 + centrosome 定位 + 全 6 層 evidence。
--- ---
### #6 — FGFR1FGF Receptor 1 ### #6 — FGFR1FGF Receptor 1
**5/6缺 localization| LOEUF=0.285 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6857 | | gnomAD | LOEUF=0.285 (norm=0.917) — **高度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.285 (norm=0.917) — **高度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=121.6 TPM; enrichment=1.31; norm=0.615 | | Expression | GTEx cerebellum=121.6 TPM; enrichment=1.31; norm=0.615 |
| Literature | 6,129 篇; cilia=35, sensory=**132**, direct_exp=8; tier=direct_experimental | | Literature | 6,129 篇; cilia=**35**, sensory=**132**, direct_exp=8; tier=direct_experimental |
**解讀:** FGF 信號在耳蝸發育中調控 otic vesicle patterning 和 hair cell 分化。132 篇感覺 + 35 篇纖毛文獻。 FGF 信號在耳蝸發育中調控 otic vesicle patterning 和 hair cell 分化。FGFR1 也參與 ciliogenesis 調控。132 篇感覺 + 35 篇纖毛文獻,在非纖毛基因中數字很高
--- ---
### #7 — ATP1A3Na/K ATPase α3 ### #7 — ATP1A3Na+/K+ ATPase α3
**5/6缺 localization| LOEUF=0.214 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6833 | | gnomAD | LOEUF=0.214 (norm=0.940) — **高度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.214 (norm=0.940) — **高度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=**346.3 TPM** (極高); enrichment=**2.40**; norm=0.680 | | Expression | GTEx cerebellum=**346.3 TPM** (極高); enrichment=**2.40**; norm=0.680 |
| Literature | 527 篇; sensory=**78**; tier=hts_hit | | Literature | 527 篇; sensory=**78**; tier=hts_hit |
**解讀:** 神經元 Na/K pump。ATP1A3 突變致 alternating hemiplegia + rapid-onset dystonia-parkinsonism部分患者伴有**聽力損失**。在耳蝸 stria vascularis 高表達,維持 endolymph 離子梯度聽覺轉導必需 神經元 Na+/K+ pump。ATP1A3 突變致 alternating hemiplegia + rapid-onset dystonia-parkinsonism**部分患者伴有聽力損失**。在耳蝸 stria vascularis 高表達,維持 endolymph 離子梯度——聽覺轉導必需。
--- ---
### #8 — ATP2B2Plasma Membrane Ca²⁺ ATPase 2 ### #8 — ATP2B2Plasma Membrane Ca2+ ATPase 2
**5/6缺 localization| LOEUF=0.190 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6832 | | gnomAD | LOEUF=0.190 (norm=0.955) — **極度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) | | Expression | GTEx cerebellum=**164.7 TPM**; enrichment=**2.92** (top 20 最高); norm=0.688 |
| gnomAD | LOEUF=0.190 (norm=0.955) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=**164.7 TPM**; enrichment=**2.92** (最高之一); norm=0.688 |
| Literature | 180 篇; sensory=**54**; tier=hts_hit | | Literature | 180 篇; sensory=**54**; tier=hts_hit |
**解讀:** ATP2B2 是 Ca²⁺ extrusion pump。**Atp2b2 突變 (deafwaddler) 小鼠完全失聰** 在耳蝸毛細胞 stereocilia 頂端高度表達,負責 mechanotransduction 後 Ca²⁺ 排出。極度 constrained + 最高 Usher tissue enrichment 之一2.92)。**直接連結 stereocilia Ca²⁺ homeostasis 與聽力。** Ca2+ extrusion pump。**Atp2b2 突變deafwaddler小鼠完全失聰** 在耳蝸毛細胞 stereocilia 頂端高度表達,負責 mechanotransduction 後 Ca2+ 排出。極度 constrained + Usher tissue enrichment 最高2.92)。**直接連結 stereocilia Ca2+ homeostasis 與聽力退化。**
--- ---
### #9 — PKD1 / Polycystin-1已知 Ciliopathy 基因 — 陽性對照) ### #9 — PKD1 / Polycystin-1已知 Ciliopathy — 陽性對照)
**5/6缺 localization| LOEUF=0.360 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6831 | | gnomAD | LOEUF=0.360 (norm=0.836) |
| Evidence layers | 5/6 (缺 localization) | | Expression | GTEx cerebellum=**577.2 TPM** (top 20 最高); enrichment=**2.54**; norm=0.685 |
| gnomAD | LOEUF=0.360 (norm=0.836), pLI=1.000 | | Literature | 2,521 篇; cilia=**242**, direct_exp=**201**; tier=direct_experimental |
| Expression | GTEx cerebellum=**577.2 TPM** (極高); enrichment=**2.54**; norm=0.685 |
| Literature | 2,521 篇; cilia=**242**, sensory=19, direct_exp=**201**; tier=direct_experimental |
**解讀:** **已知 ciliopathy 基因** PKD1 突變致 ADPKD。Polycystin-1 是 primary cilia 上的機械感受器。242 篇纖毛文獻。Pipeline 正確排名 top 10驗證 scoring 系統有效。 **已知 ciliopathy 基因** PKD1 突變致 autosomal dominant polycystic kidney disease。Polycystin-1 是 primary cilia 上的機械感受器。Pipeline 正確排#9**驗證 scoring 系統有效**
--- ---
### #10 — ARL3ADP-Ribosylation Factor-like 3 ### #10 — ARL3ADP-Ribosylation Factor-like 3
**6/6 全層 | LOEUF=0.557 | pLI=0.930 | Centrosome**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6826 | | gnomAD | LOEUF=0.557 (norm=0.800) |
| Evidence layers | **6/6 全層** |
| gnomAD | LOEUF=0.557 (norm=0.800), pLI=0.930 |
| Expression | GTEx cerebellum=51.7 TPM; enrichment=1.04; norm=0.545 | | Expression | GTEx cerebellum=51.7 TPM; enrichment=1.04; norm=0.545 |
| Localization | HPA: **Centrosome + Nucleoplasm**; proximity=1.000 | | Localization | HPA: **Centrosome + Nucleoplasm**; proximity=1.000 |
| Literature | 169 篇; cilia=**88**, sensory=**49**, direct_exp=**45**; tier=direct_experimental | | Literature | 169 篇; cilia=**88 (52%)**, sensory=**49 (29%)**, direct_exp=**45**; tier=direct_experimental |
**解讀:** ARL3 是**已確認的纖毛信號蛋白**調控 ciliary protein trafficking與 RP2/UNC119 組成 lipidated cargo release 複合物。169 篇中 88 篇纖毛文獻(**52%**和 49 篇感覺文獻(**29%**所有候選基因中纖毛相關比例最高。ARL3 突變在小鼠致 retinal degeneration。**真正的 Usher-adjacent ciliopathy 候選基因。** **已確認的纖毛信號蛋白。** ARL3 調控 ciliary protein trafficking與 RP2/UNC119 組成 lipidated cargo release 複合物。169 篇中 88 篇纖毛文獻(**52%**)— 所有候選基因中纖毛相關比例最高。ARL3 突變在小鼠致 retinal degeneration。**真正的 Usher-adjacent ciliopathy 候選。**
--- ---
### #11 — GRIA2Glutamate Receptor, AMPA 2 ### #11 — GRIA2Glutamate Receptor, AMPA 2
**5/6缺 localization| LOEUF=0.123 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6810 | | gnomAD | LOEUF=0.123 (norm=0.957) — **極度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.123 (norm=0.957) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=74.4 TPM; enrichment=**2.29**; norm=0.656 | | Expression | GTEx cerebellum=74.4 TPM; enrichment=**2.29**; norm=0.656 |
| Literature | 1,758 篇; sensory=**87**; tier=hts_hit | | Literature | 1,758 篇; sensory=**87**; tier=hts_hit |
**解讀:** AMPA receptor 核心亞單位。在 cochlear nucleus 和 auditory pathway 大量表達。Hair cell afferent synapse 使用 glutamatergic transmission。極度 LoF intolerant。 AMPA receptor 核心亞單位。在 cochlear nucleus 和 auditory pathway 大量表達。Hair cell afferent synapse 使用 glutamatergic transmission。極度 LoF intolerantLOEUF=0.123
--- ---
### #12 — SNCAα-Synuclein ### #12 — SNCAα-Synuclein
**5/6缺 localization| LOEUF=0.691**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6810 |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.691 (norm=0.817) | | gnomAD | LOEUF=0.691 (norm=0.817) |
| Expression | GTEx cerebellum=73.9 TPM; enrichment=**2.74**; norm=0.667 | | Expression | GTEx cerebellum=73.9 TPM; enrichment=**2.74**; norm=0.667 |
| Literature | 4,084 篇; sensory=28, cyto=734; tier=direct_experimental | | Literature | 4,084 篇; sensory=28, cyto=**734**; tier=direct_experimental |
**解讀:** Parkinson disease 相關蛋白。SNCA 在 synaptic vesicle 循環和 cytoskeleton 動態有角色。Cerebellum 高表達。主要文獻集中在 neurodegeneration。 Parkinson disease 相關蛋白。在 synaptic vesicle 循環和 cytoskeleton 動態有角色。Cerebellum 高表達。主要文獻集中在 neurodegeneration 而非 ciliopathy
--- ---
### #13 — HDAC6Histone Deacetylase 6 ### #13 — HDAC6Histone Deacetylase 6
**5/6缺 gnomAD| Centrosome**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6801 |
| Evidence layers | 5/6 (缺 gnomAD) |
| gnomAD | 無數據(可能因位於 chrX | | gnomAD | 無數據(可能因位於 chrX |
| Expression | GTEx cerebellum=92.0 TPM; enrichment=1.08; norm=0.573 | | Expression | GTEx cerebellum=92.0 TPM; enrichment=1.08; norm=0.573 |
| Localization | HPA: Cytosol + Nucleoplasm + **Centrosome**; proximity=1.000 | | Localization | HPA: Cytosol + Nucleoplasm + **Centrosome**; proximity=1.000 |
| Literature | 2,915 篇; cilia=**119**, sensory=36, direct_exp=40, cyto=605; tier=direct_experimental | | Literature | 2,915 篇; cilia=**119**, sensory=36, direct_exp=40, cyto=**605**; tier=direct_experimental |
**解讀:** HDAC6 是**已知的 ciliogenesis 調控因子**。它 deacetylates α-tubulin調控 cilia disassembly。HDAC6 抑制劑(tubastatin A可以**穩定纖毛**。119 篇纖毛文獻 + centrosome 定位。在 ciliopathy 治療研究中是重要靶點。 **已知的 ciliogenesis 調控因子** HDAC6 deacetylates α-tubulin調控 cilia disassembly。HDAC6 抑制劑tubastatin A可以**穩定纖毛**。119 篇纖毛文獻 + centrosome 定位。在 ciliopathy **治療研究**中是重要靶點。
--- ---
### #14 — VAMP2Synaptobrevin-2 ### #14 — VAMP2 / Synaptobrevin-2
**5/6缺 localization| LOEUF=0.345 | pLI=0.997**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6786 | | gnomAD | LOEUF=0.345 (norm=0.930) — **高度 constrained** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.345 (norm=0.930) — **高度 constrained**, pLI=0.997 |
| Expression | GTEx cerebellum=**500.5 TPM** (極高); enrichment=**1.96**; norm=0.669 | | Expression | GTEx cerebellum=**500.5 TPM** (極高); enrichment=**1.96**; norm=0.669 |
| Literature | 1,286 篇; sensory=24, cyto=115; tier=hts_hit | | Literature | 1,286 篇; sensory=24, cyto=115; tier=hts_hit |
**解讀:** SNARE 複合物核心成員,驅動 synaptic vesicle exocytosis。在 hair cell ribbon synapse 和 photoreceptor synapse 中有關鍵功能。極高 cerebellum 表達(500 TPM SNARE 複合物核心成員,驅動 synaptic vesicle exocytosis。在 hair cell ribbon synapse 和 photoreceptor synapse 中有關鍵功能。Cerebellum 500 TPM 是 top 20 中第二高(僅次 PKD1 的 577)。
--- ---
### #15 — MAPRE3 / EB3Microtubule End-Binding Protein 3 ### #15 — MAPRE3 / EB3Microtubule End-Binding Protein 3
**5/6缺 localization| LOEUF=0.163 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6769 | | gnomAD | LOEUF=0.163 (norm=0.948) — **極度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.163 (norm=0.948) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=**214.6 TPM** (極高); enrichment=**1.87**; norm=0.662 | | Expression | GTEx cerebellum=**214.6 TPM** (極高); enrichment=**1.87**; norm=0.662 |
| Literature | 81 篇 (under-studied); cilia=3, sensory=1, cyto=67, direct_exp=2; tier=direct_experimental | | Literature | 81 篇 (under-studied); cilia=3, cyto=67, direct_exp=2; tier=direct_experimental |
**解讀:** EB3 追蹤生長中的微管 plus-end參與 cilia formation 和 axon guidance。極度 LoF intolerant + 極高 cerebellum 表達僅 81 篇文獻 — truly under-studied。微管動態是 ciliogenesis 的基礎。 EB3 追蹤生長中的微管 plus-end參與 cilia formation 和 axon guidance。**極度 LoF intolerant + 極高 cerebellum 表達 + 僅 81 篇文獻 — truly under-studied。** 微管動態是 ciliogenesis 的基礎。
--- ---
### #16 — ATP1B1Na/K ATPase β1 亞單位) ### #16 — ATP1B1Na+/K+ ATPase β1 亞單位)
**5/6缺 localization| LOEUF=0.195 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6754 | | gnomAD | LOEUF=0.195 (norm=0.923) — **高度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.195 (norm=0.923) — **高度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=**211.4 TPM**; enrichment=**1.90**; norm=0.662 | | Expression | GTEx cerebellum=**211.4 TPM**; enrichment=**1.90**; norm=0.662 |
| Literature | 233 篇; sensory=7; tier=hts_hit | | Literature | 233 篇; sensory=7; tier=hts_hit |
**解讀:** Na/K ATPase 的 β1 亞單位,與 ATP1A3 (#7) 和 ATP1A1 (#18) 形成功能複合物。在 stria vascularis 維持 endolymph K 濃度。聽覺轉導依賴此離子梯度。 Na+/K+ ATPase 的 β1 亞單位,與 ATP1A3 (#7) 和 ATP1A1 (#18) 形成功能複合物。在 stria vascularis 維持 endolymph K+ 濃度。聽覺轉導依賴此離子梯度。
--- ---
### #17 — ANP32AAcidic Nuclear Phosphoprotein 32A ### #17 — ANP32AAcidic Nuclear Phosphoprotein 32A
**6/6 全層 | LOEUF=0.143 | pLI=1.000 | Centrosome**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6743 | | gnomAD | LOEUF=0.143 (norm=0.947) — **極度 LoF intolerant** |
| Evidence layers | **6/6 全層** |
| gnomAD | LOEUF=0.143 (norm=0.947) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=55.8 TPM; enrichment=1.57; norm=0.618 | | Expression | GTEx cerebellum=55.8 TPM; enrichment=1.57; norm=0.618 |
| Localization | HPA: Nucleoplasm + **Centrosome** + Cytosol; proximity=1.000 | | Localization | HPA: Nucleoplasm + **Centrosome** + Cytosol; proximity=1.000 |
| Literature | 203 篇; cilia=0, sensory=1; tier=hts_hit | | Literature | 203 篇; cilia=0, sensory=1; tier=hts_hit |
**解讀:** Histone chaperone 和 phosphatase inhibitor。Centrosome 定位有趣但纖毛/感覺文獻極少。極度 LoF intolerant 表明功能重要,但與 Usher/ciliopathy 的連結不明確。 Histone chaperone 和 phosphatase inhibitor。極度 LoF intolerant + Centrosome 定位但纖毛/感覺文獻極少cilia=0與 Usher/ciliopathy 的直接連結不明確。6/6 全層但排名不高是因為個別層分數相對低。
--- ---
### #18 — ATP1A1Na/K ATPase α1 ### #18 — ATP1A1Na+/K+ ATPase α1
**5/6缺 localization| LOEUF=0.188 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6741 | | gnomAD | LOEUF=0.188 (norm=0.937) — **高度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.188 (norm=0.937) — **高度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=**374.6 TPM** (極高); enrichment=**1.79**; norm=0.662 | | Expression | GTEx cerebellum=**374.6 TPM** (極高); enrichment=**1.79**; norm=0.662 |
| Literature | 667 篇; sensory=20; tier=hts_hit | | Literature | 667 篇; sensory=20; tier=hts_hit |
**解讀:** Na/K ATPase 的 ubiquitous α 亞單位。與 ATP1A3 (#7) 和 ATP1B1 (#16) 成 Na/K pump 系統。Stria vascularis endolymph homeostasis 核心 Na+/K+ ATPase 的 ubiquitous α 亞單位。與 ATP1A3 (#7) 和 ATP1B1 (#16) 共同組成 Na+/K+ pump 系統。三個亞單位都在 top 20顯示 **stria vascularis endolymph homeostasis 是一個 convergent signal**
--- ---
### #19 — SCN2AVoltage-Gated Sodium Channel α2 ### #19 — SCN2AVoltage-Gated Sodium Channel α2
**5/6缺 localization| LOEUF=0.161 | pLI=1.000**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6733 | | gnomAD | LOEUF=0.161 (norm=0.938) — **極度 LoF intolerant** |
| Evidence layers | 5/6 (缺 localization) | | Expression | GTEx cerebellum=65.2 TPM; enrichment=**2.97** (**top 20 最高**); norm=0.670 |
| gnomAD | LOEUF=0.161 (norm=0.938) — **極度 LoF intolerant**, pLI=1.000 |
| Expression | GTEx cerebellum=65.2 TPM; enrichment=**2.97** (最高); norm=0.670 |
| Literature | 966 篇; sensory=14; tier=direct_experimental | | Literature | 966 篇; sensory=14; tier=direct_experimental |
**解讀:** 神經元 Na channel。SCN2A 突變致 epileptic encephalopathy。Usher tissue enrichment 最高2.97),暗示在感覺神經元中特異性高表達 神經元 Na+ channel。SCN2A 突變致 epileptic encephalopathy。Usher tissue enrichment 在 top 20 中最高2.97),暗示在感覺神經元中特異性極高。極度 LoF intolerant
--- ---
### #20 — VEGFAVascular Endothelial Growth Factor A ### #20 — VEGFAVascular Endothelial Growth Factor A
**5/6缺 localization| LOEUF=0.615**
| 指標 | 值 | | 指標 | 值 |
|------|------| |------|------|
| Composite | 0.6722 |
| Evidence layers | 5/6 (缺 localization) |
| gnomAD | LOEUF=0.615 (norm=0.951) | | gnomAD | LOEUF=0.615 (norm=0.951) |
| Expression | GTEx cerebellum=39.4 TPM; enrichment=0.80; norm=0.473 | | Expression | GTEx cerebellum=39.4 TPM; enrichment=0.80; norm=0.473 |
| Literature | 26,240 篇; cilia=55, sensory=**2,550**; tier=direct_experimental | | Literature | 26,240 篇; cilia=55, sensory=**2,550**; tier=direct_experimental |
**解讀:** 血管生成核心因子。2,550 篇感覺文獻(因為眼科血管新生是 VEGF 研究主題之一)。排名偏高因 annotation (0.968) + literature (0.942) 極高。與 ciliopathy 的直接連結較弱。 血管生成核心因子。2,550 篇感覺文獻主要來自眼科血管新生研究AMD/DR 是 VEGF 研究主題。Annotation (0.968) + literature (0.942) 極高推動排名。與 ciliopathy 的直接連結較弱。
--- ---
## 優先級總結 ## 優先級總結
### 最高優先 — 直接纖毛/感覺機制 ### Tier 1 — 直接纖毛/感覺機制
| 基因 | Layers | 核心理由 | | 基因 | Layers | LOEUF | 核心理由 |
|------|--------|---------| |------|--------|-------|---------|
| **ARL3** | 6/6 | 已確認纖毛信號蛋白。52% 文獻為纖毛相關。Centrosome 定位。Ciliary cargo transport。 | | **ARL3** | 6/6 | 0.557 | 已確認纖毛信號蛋白。52% 文獻為纖毛相關。Ciliary cargo transport。小鼠 retinal degeneration。 |
| **PAFAH1B1** | 6/6 | Dynein transport 核心。極度 LoF intolerant (LOEUF=0.10)。Centrosome 定位。 | | **PAFAH1B1** | 6/6 | 0.100 | Dynein transport 核心。極度 LoF intolerant。Centrosome 定位。IFT 核心機制。 |
| **DYNC1H1** | 6/6 | Dynein 重鏈。極度 LoF intolerant (LOEUF=0.12)。Centrosome 定位。纖毛逆行運輸。 | | **DYNC1H1** | 6/6 | 0.117 | Dynein 重鏈。極度 LoF intolerant。Centrosome 定位。纖毛逆行運輸。 |
| **ATP2B2** | 5/6 | Atp2b2 突變小鼠失聰。stereocilia Ca²⁺ pump。極度 constrained。Enrichment=2.92。 | | **ATP2B2** | 5/6 | 0.190 | deafwaddler 小鼠失聰。stereocilia Ca2+ pump。極度 constrained。Enrichment=2.92。 |
| **HDAC6** | 5/6 | 已知 ciliogenesis 調控因子。119 篇纖毛文獻。Centrosome 定位。治療靶點。 | | **HDAC6** | 5/6 | — | 已知 ciliogenesis 調控因子。119 篇纖毛文獻。Centrosome 定位。治療靶點。 |
### 高優先 — 強多層證據 + 感覺系統角色 ### Tier 2 — 強多層證據 + 感覺系統角色
| 基因 | Layers | 核心理由 | | 基因 | Layers | LOEUF | 核心理由 |
|------|--------|---------| |------|--------|-------|---------|
| **DLG4** | 5/6 | 感覺突觸核心支架。極度 LoF intolerant。cerebellum 225 TPM。 | | **DLG4** | 5/6 | 0.166 | 感覺突觸支架。gnomAD norm 0.980(最高)。cerebellum 225 TPM。 |
| **SMAD4** | 6/6 | TGF-β/BMP 核心。Hair cell 分化 Hedgehog signaling。Centrosome 定位。 | | **SMAD4** | 6/6 | 0.227 | TGF-β/BMP 核心。Hair cell 分化 + Hedgehog signaling。Centrosome。 |
| **CRMP1** | 6/6 | Under-studied centrosome 蛋白。Usher tissue enrichment=2.43。微管組裝。 | | **CRMP1** | 6/6 | 0.440 | Under-studied (178 篇)。Centrosome。Usher enrichment=2.43。微管組裝。 |
| **MAPRE3** | 5/6 | 微管 plus-end tracker。極度 LoF intolerant。Under-studied (81 篇)。 | | **MAPRE3** | 5/6 | 0.163 | 微管 plus-end tracker。Under-studied (81 篇)。極度 LoF intolerant。cerebellum 215 TPM。 |
| **ATP1A3** | 5/6 | Na/K pump。部分患者有聽力損失。Stria vascularis 表達。 | | **ATP1A3** | 5/6 | 0.214 | Na+/K+ pump。部分患者有聽力損失。cerebellum 346 TPM。 |
### 中優先 — 間接但有潛力 ### Tier 3 — 間接但有趣的 convergent signals
| 基因 | Layers | 核心理由 | | 基因 | 核心理由 |
|------|--------|---------| |------|---------|
| **FGFR1** | 5/6 | FGF 信號調控 hair cell 分化。132 篇感覺文獻。 | | **ATP1A3 + ATP1B1 + ATP1A1** | Na+/K+ pump 三亞單位全在 top 20 → stria vascularis endolymph 是 convergent signal |
| **GRIA2** | 5/6 | AMPA receptor。Hair cell glutamatergic transmission。 | | **FGFR1** | FGF 信號 hair cell 分化。132 篇感覺文獻。 |
| **VAMP2** | 5/6 | SNARE 蛋白。Ribbon synapse exocytosis。cerebellum 500 TPM。 | | **VAMP2** | Ribbon synapse SNARE。cerebellum 500 TPM。 |
| **ATP1B1 / ATP1A1** | 5/6 | Na⁺/K⁺ pump 系統。Endolymph K⁺ homeostasis。 | | **SCN2A** | Usher tissue enrichment 2.97最高。epilepsy gene 可能有亞臨床聽力表型。 |
### 陽性對照 ### 陽性對照
| 基因 | Rank | 已知疾病 | **PKD1**#92,521 篇文獻242 篇纖毛),驗證 scoring 系統正確識別已知 ciliopathy 基因。
|------|------|---------|
| **PKD1** | #9 | ADPKD (242 篇纖毛文獻) | ---
## 關鍵觀察
1. **Dynein 系統突出**PAFAH1B1 (#1) + DYNC1H1 (#2) 分占前兩名,暗示 IFT retrograde transport 是 pipeline 識別的最強 ciliopathy 信號
2. **Na+/K+ pump 系統收斂**ATP1A3 (#7) + ATP1B1 (#16) + ATP1A1 (#18) 三個亞單位同時出現,指向 stria vascularis endolymph homeostasis 作為聽力退化的獨立機制
3. **ARL3 是最佳新候選**:已確認纖毛蛋白但尚未與 Usher 連結52% 文獻纖毛相關,有 retinal degeneration 小鼠表型
4. **MAPRE3 是最 under-studied 的高分基因**:僅 81 篇文獻,極度 LoF intolerantcerebellum 215 TPM
--- ---