项目执行与结果汇报 · 2026-06-17

子痫前期胎盘多组学整合分析

基于客户交付的胎盘 5 组学数据,对子痫前期(PE)发病机制做跨组学整合。项目 2605136 · 对照组 Z2/Z3/Z4/Z5、子痫前期组 C1/C2/C3/C5。
8 例配套样本 单细胞 5 大组学 ~1.3 TB 原始数据 蛋白定量基因

01 执行摘要

一句话结论:在样本级严谨统计下,PE 胎盘的「分泌 / 抗血管生成」程序(sFlt-1/FLT1、ENG、INHBA、FSTL3、CRH、LEP、PAPPA2 等)被一致、显著上调——这是 PE 公认核心机制,在本数据中获跨细胞类型确证。设计中两条「创新主线」(脂质/铁死亡、Retromer)在当前数据与功效下未获支持,如实报告。

① 已确认 FDR<0.05

分泌/抗血管轴 GSEA 在多种细胞一致富集上调:EVT NES 1.63 (q=0.009)、VCT 1.61 (q=0.004)、Hofbauer 1.58 (q=0.01)、全体 1.53 (q=0.04)。pseudobulk 中 CRH、LEP 显著上调(PE 经典标志物)。

② 方法严谨性 自算

样本级 pseudobulk DESeq2 + GSEA 为主统计(适配 8 例样本结构);并经 MOFAcell 样本级整合留一稳健性检验交叉验证:两条轴对离群样本稳健,IFN 轴为最稳健的整合信号(详见跨组学整合)。

③ 诚实阴性 未支持

主线1(GPX4/AGPS/GNPAT 铁死亡)与主线2(VPS35/SNX1 Retromer):样本级 per-gene 效应量极小(GPX4 +0.10、VPS35 +0.08)、GSEA 不显著(q>0.14)。当前数据不支持这两条假设,避免据此误导后续。
⚠️ 功效与缺失数据:仅 8 例样本 → 仅最强效应(log2FC>3 的 CRH/LEP)过 FDR;更细机制需更多样本或更深设计。招牌交付物仍被缺数据阻断:药物外植体转录组(从未交付,无法做药物逆转打分)、空转切片图像(缺失,无法 Spot 级原位制图/RCTD)。

02 项目执行报告

需求来源:企业微信沟通(2026-05-13 起)、腾讯会议转写(2026-06-09)、需求分析报告(2026-06-12)。

🎯 目标与需求

  • 跨组学整合解析 PE 胎盘机制,筛选转化靶点。
  • 双轨:假设驱动(脂质/铁死亡、Retromer/sFlt-1)+ 无偏数据驱动;收敛门禁 Jaccard>0.15 & Fisher p<0.01。
  • 细胞亚群精细化(EVT/SCT/VCT + 免疫/基质/内皮)。
  • 关联药物干预(外植体处理 → CMap 逆转打分)。
  • 导出可发表级矢量图(SVG/PDF,≥300 DPI)。

🧪 方法与环境

  • 单细胞:Scanpy(QC/Leiden/UMAP/注释);差异用 pydeseq2(pseudobulk DESeq2,样本级)为主,逐细胞 Wilcoxon 作探索。
  • 通路:gseapy GSEA pre-rank(机制基因集 + Hallmark/KEGG)。
  • 蛋白质组:DIA-NN 基因矩阵(n=4/组)Welch t。
  • 空转/空代:整合厂商已交付差异/富集结果。

🗓️ 执行时间线

05-13 ~ 06-02 需求对接 → 硬盘交付 1.3 TB,MD5 校验(血清代谢组 003/004 百度网盘补传)。
06-09 / 06-12 首次会议锁定方案;客户百度网盘补充单细胞矩阵、空转报告。
06-16 ~ 06-17 单细胞再分析 + 分组核验 + pseudobulk DESeq2 + GSEA + 蛋白/空转/空代整合。
06-17 完整 GO/KEGG/Reactome 富集、全 7 类细胞机制 GSEA、KEGG 通路级共定位、矢量出图(SVG/PDF)。
待数据 药物 CMap 逆转、空转 Spot 级制图、原始血清代谢组处理。

03 客户提供资料清单

原始数据经硬盘邮寄(2026-06-02 收讫)并完成 MD5 校验,约 1.3 TB。

组学内容规模厂商批次状态
临床元数据标本采集记录表(8 例)~46 KB已用
单细胞转录组FASTQ + Cell Ranger 矩阵≈613 GBDZOE2023121956已分析
空间转录组10x Visium FASTQ + 报告≈479 GBDZOE2023121143差异已整合 图像缺失
空间代谢组MALDI-MSI 原始+差异+报告≈107 GBDZOE2024041979差异已整合
Bulk 蛋白质组DIA-NN 定量(8 样本)≈4.0 GBDZOE2024081145已分析
血清代谢组母血/脐血 非靶向 LC/GC-MS(.D)≈51 GBDZOE2024081148待 MS 处理
外植体药物转录组对照胎盘外植体药物处理待定待客户提供

04 分析状态看板

✅ 已完成

  • 单细胞 QC / 聚类 / 12 类注释
  • 分组标注与核验(对照=Z、PE=C)
  • pseudobulk DESeq2 差异(全体 + 各细胞类型)
  • GSEA 通路/机制检验
  • Bulk 蛋白质组差异
  • 空转 & 空间代谢组差异整合
  • 完整 GO/KEGG/Reactome 富集(全细胞类型)
  • MOFAcell 整合 + 留一稳健性
  • 通路级 (KEGG) 代谢×转录共定位
  • 可发表级矢量出图 (SVG/PDF)

🔄 进行中

  • 候选靶点 → 实验验证选点清单
  • 结题报告与方法学文档整理
  • 样本量扩充后复核(受 n=8 功效所限)

⏳ 待客户数据 / 阻断

  • 药物外植体转录组 → CMap 逆转打分
  • 空转切片图像 → Spot 级制图 / RCTD
  • 原始血清代谢组 .D → 专用 MS 处理
  • 专家方案签字确认

05 单细胞转录组结果 自算

分组核验:样本分组依标本采集记录表,并经 PE 标志物独立验证(对照=Z2/Z3/Z4/Z5、PE=C1/C2/C3/C5),方向正确:
图1. 65,828 细胞 UMAP,12 类细胞(含 EVT/SCT/VCT 滋养层)。
图2. 细胞组成(组内占比):PE 中 SCT 升高(0.9%→14.4%)。注:组成差异部分可能受解离/取材影响。

差异表达(主统计:pseudobulk DESeq2,样本级 n=4 vs 4)

图3. 全体细胞 pseudobulk 火山图。显著上调以 CRH/LEP/PLAC4/KRT5 等为主;FLT1/FSTL3/PAPPA2 虽上调但未过 FDR(功效所限)。

各细胞类型显著基因数 padj<0.05 & |log2FC|>1

细胞类型显著↑PE↓PE
数量普遍较少,反映 8 例样本的真实统计功效;样本级统计可避免细胞级伪重复带来的假阳性。
展示性图件:逐细胞 Wilcoxon DE、score_genes 评分图等为可视化展示,显著性以样本级统计为准;分组验证:

06 机制假设评估(GSEA + 多组学) 自算

对设计的机制主线,用 pseudobulk 排序做 GSEA pre-rank(低功效下检验通路协同变化的稳健方法),并逐基因汇总三层证据。

图4. 机制基因集 GSEA NES(PE vs 对照,全部 7 类细胞/总体);* = FDR<0.05。「分泌/抗血管」在 6/7 类一致显著上调(SCT 较弱);两条"创新主线"均不显著。

分泌/抗血管 确认

EVT/VCT/Hofbauer/全体 NES 1.5–1.6,FDR<0.05。PE 公认核心机制,本数据稳健支持。

主线1 脂质/铁死亡 未支持

GSEA 不显著(全体 NES 1.03, q=0.62);GPX4/AGPS/GNPAT 样本级效应量极小。

主线2 Retromer 未支持

NES 方向不一致、均不显著;VPS35/SNX1 几无变化。原“Retromer 下调”假设未获证。

机制基因 · 多组学证据表

PE 上调PE 下调未检出/不显著
基因单细胞 pseudobulk log2FCpseudobulk padj蛋白 log2FC空转判读
📌 读法:分泌轴基因(FLT1/ENG/INHBA/FSTL3/PAPPA2/CRH/LEP)方向一致上调(GSEA 集体显著);脂质/Retromer 基因样本级 padj 多不显著、效应量小——单个基因看“都在动”,但严格统计下不成立。蛋白层 n=4,按方向+nominal 解读。

07 通路富集与候选靶点 自算

在已确认方向的基础上给出:(A)数据驱动发现的另一条显著通路;(B)聚焦分泌/抗血管轴的候选靶点优先级(透明打分)。

第二条确认轴(GSEA 发现):PE 胎盘 干扰素 / 炎症 / 抗原呈递程序显著上调——全体 IFN-α 反应 NES 1.88、IFN-γ 1.86(FDR 0.001);EVT 抗原加工呈递 1.91、TLR 信号 1.78、胞质 DNA 感知 1.79。提示无菌性炎症 / 天然免疫激活,亦为 PE 公认特征。
GO / KEGG / Reactome 通路富集(全体细胞,PE 上调,FDR<0.25;点大小=前沿基因数,颜色=−log10 FDR)——三大数据库一致指向 I 型干扰素 / 抗病毒信号(IFN-α/β、ISG15、JAK-STAT),独立印证炎症轴。
各细胞类型 PE 上调通路(GO/KEGG/Reactome 前 6,FDR<0.25):干扰素/免疫程序贯穿多类细胞;VCT 偏激素分泌、Hofbauer 偏血小板/整合素,呈细胞类型特异性。

发现通路(GSEA,FDR 最低)

细胞通路NESFDR
Hallmark + KEGG,pseudobulk 排序 GSEA;正 NES = PE 上调。
图6. 分泌/抗血管轴候选靶点优先级。标注:LE=GSEA 前沿基因、Prot↑=蛋白同向、ST↑=空转同向、FDR✓=样本级显著。

分泌 / 抗血管轴 — 候选靶点优先级

#基因pseudobulk log2FC
(最强细胞类型)
全体 padj蛋白空转前沿已知 PE 角色评分

干扰素 / 炎症轴 — 候选靶点优先级

图7. 干扰素/炎症轴候选靶点优先级;前沿基因取自已确认的 IFN / 抗原呈递 GSEA 通路(180 个前沿基因)。
#基因log2FCpadj蛋白空转免疫角色评分
⚠️ 定位:两轴均为假设生成式优先级——通路集水平已由 GSEA 确认(前沿 q=0.001),但多数单基因受 n=8 功效限制未达 per-gene FDR;评分综合效应量 + 多组学一致性 + 已知生物学,用于指导后续验证选点。药物逆转(CMap)打分仍因外植体数据未交付而无法进行。

08 跨组学整合

蛋白质组定量基因数(DIA-NN, 8 样本) · 自算
空间转录组 PE vs 对照 区域比较 · 厂商
空间代谢组 差异代谢物(PE vs 对照,早+晚) · 厂商

Bulk 蛋白质组 自算

图5. 蛋白质组 PE vs 对照火山图(DIA-NN)。ENG/INHBA/FSTL3 等分泌轴蛋白上调(nominal)。

空间转录组(厂商差异)厂商

区域比较 (PE vs 对照)
机制基因空间上调:CRH/ENG/FLT1/FSTL3/HTRA4/INHBA/PAPPA2(分泌轴,与上方一致)。

空间代谢组差异(厂商)厂商

PE vs 对照(早期切片)火山图
PE vs 对照(晚期切片)火山图
🧬 脂质相关: 提示 PE 胎盘存在代谢物层面的脂质重塑;但需注意:转录层面的脂质酶/铁死亡假设(主线1)并未获支持——两者层级不同,勿混为一谈。真正的 Spot 级「代谢×转录」原位共定位需空转切片图像(缺失),列为后续。

通路级共定位(KEGG · 代谢 × 转录) 自算 厂商

空间代谢组差异代谢物所属 KEGG 通路(30 个差异物,19 个可映射);红=同时在转录组富集。

结论(诚实)

  • 代谢层最强为脂质/代谢通路(甘油磷脂代谢、胆汁分泌、ABC 转运体、氨基酸代谢)。
  • 转录层最强为干扰素/免疫程序——两者多处不同通路空间通路级重叠有限(仅胆碱代谢交叠)。
  • 真正的 Spot 级原位共定位仍被阻断(缺空转切片图像),列为待客户数据。

样本级多组学整合(MOFAcell) 自算

按项目设计的"无偏整合"轨,对 6 类细胞 pseudobulk + 蛋白质组共 7 个视图做 MOFA 因子分析(mofapy2)。诚实定位:n=8(4v4)远低于 MOFA 建议的 >15,结果为探索性——n=4v4 的最小双侧 MWU p 即为 0.0286。

因子 × 样本热图。F1 几乎完全由单个 PE 样本 C5 驱动、F3 由单个对照 Z3 驱动(n=8 的"单样本离群因子");最能区分组别的 F2 也仅 perm p=0.086。

整合结论(诚实)

  • 无任何因子显著区分 PE / 对照(最佳 F2:MWU p=0.11、置换 p=0.086;受 n=8 下限所限)。
  • 偏向 PE 的 F2 由干扰素/炎症程序主导且方向一致(CXCL9/CXCL10/HLA-G/CD74/IDO1 在 6 类细胞正向、蛋白层 CD74 居 97 百分位)——与 IFN 结论方向吻合,但仅为探索性佐证(F2 本身不显著)。
  • 分泌/抗血管轴在整合因子上载荷符号不一致、未成形——它由 GSEA(各细胞排序)支持,但在样本级整合上弱于 IFN 轴。
MOFA 因子 2 基因级载荷(行=基因,列=细胞类型/蛋白)。左:干扰素/炎症基因在多数细胞类型与蛋白层一致正向(CXCL9/CXCL10/HLA-G/CD74/IDO1);右:分泌轴基因符号不一致(尤其 SCT 多为负)——直观印证 IFN 轴在整合因子上成形、分泌轴未成形。

稳健性检验:留一法(剔除离群样本) 自算

剔除 MOFA 识别的离群样本后重算 GSEA:两条轴在剔除 C5 或 Z3 后仍显著(FDR<0.05)、方向不变

结论:核心结论稳健

  • 基线(8):IFN NES 1.62 (FDR .011)、分泌 1.57 (.008)。
  • 剔除 C5(PE 离群,驱动 MOFA-F1):IFN 1.50 (.049)、分泌 1.49 (.025)。
  • 剔除 Z3(对照离群,驱动 MOFA-F3):IFN 1.51 (.018)、分泌 1.57 (.010)。
  • 两条确认轴并非离群样本的假象——核心结论稳健成立。
分细胞类型的留一法 GSEA NES(* = FDR<0.05)。IFN 轴在全部 6 类细胞、所有剔除条件下均稳健显著;分泌轴在 EVT/VCT/Hofbauer/内皮/成纤维稳健,唯在 SCT 较弱且剔除 Z3 时翻负——如实呈现该细胞类型的不确定性。
稳健性小结:核心结论的稳健性来自样本级 GSEA + 留一检验(剔除任一离群样本后两条轴仍 FDR<0.05、方向不变)。跨组学整合层另经三种方法严格检验(MOFAcell 无监督 / AJIVE 小样本稳健 / DIABLO 监督)一致表明:n=8 下整合无法稳健建立疾病判别因子——故整合仅作探索性佐证,疾病结论以样本级 DESeq2 + GSEA 为准

09 局限与下一步

诚实的局限

  • 样本量小(n=4/组):FDR 功效有限,仅最强信号显著;细机制需更多样本。
  • 逐细胞统计已纠偏:改用 pseudobulk/GSEA,避免伪重复夸大。
  • 组成差异(SCT 升高)可能受解离/取材影响,非纯生物学结论。
  • 蛋白/空代为 nominal/厂商结果,跨层一致性为方向性证据。
  • 缺数据:药物外植体、空转图像、原始血清代谢组未到位。

下一步

  • 本团队(已完成本轮):完整 GO/KEGG/Reactome 富集、全 7 类细胞机制 GSEA、KEGG 通路级共定位、SVG/PDF 矢量出图均已完成;后续为候选靶点实验验证选点与结题报告。
  • 需客户/上游:① 药物外植体转录组(解锁 CMap 逆转);② 空转切片图像(解锁 Spot 级制图/RCTD);③ 血清代谢组定量表或授权处理 .D;④ 专家方案确认。

10 候选靶点文献佐证 已核实

为候选靶点附真实文献依据;每条引用均经 NCBI E-utilities 独立核实(PMID ↔ 标题/年份一致),点击跳转 PubMed,无编造。共 条。注:HLA-G / IDO1 / CD74 等在 PE 中多为下调或方向有争议,按「失调」理解(见各条)。

分泌 / 抗血管轴

干扰素 / 炎症轴

数据溯源与方法: 自算 单细胞(Scanpy;pseudobulk DESeq2 via pydeseq2;GSEA via gseapy)与蛋白质组差异由本团队计算;厂商 空转、空间代谢组差异为测序厂商交付。主统计为样本级;逐细胞结果仅作探索。本页不含任何占位/推测数字;未交付数据对应模块均明确标注;所有自算图件提供 SVG + PDF 矢量版(≥300 DPI)。
项目 2605136 · 子痫前期胎盘多组学整合 · 报告生成 2026-06-17 · pe.sinogenomics.com