马竞直播

您好,欢迎来到马竞直播!

青莲干货 | 一文详解基于蛋白质组学的疾病分子分型研究

异质性是恶性肿瘤等疾病的重要特征,是精准医学需破解的难题。疾病异质性可表现为不同的病理类型以及不同的基因突变谱、转录组表达谱和蛋白质组表达谱等,是恶性肿瘤等疾病发生发展领域长期关注的科学问题。

异质性的存在使得对疾病进行分型成为精确医学的关键步骤。疾病分型的传统方法基于形态学特征,依赖对病理切片的观察与分析。随着分子检测技术的不断成熟,基于分子特征的疾病分型方法受到广泛关注。二十世纪末美国国立癌症研究所首次提出了肿瘤分子分型的概念。研究人员利用组学技术深入剖析疾病分子水平的异质性,从而指导疾病的精准诊断与治疗。

目前基因分型已实现临床转化,然而尚无真正意义的基因治疗药物,且基于基因检测的靶向治疗药物的受益人群占比极低。2021年发表于Cell 期刊的观点文章[1]指出了在精准肿瘤学领域基因组学的局限性与蛋白质组学的重要作用。相较而言,蛋白质组学更接近表型,且基于蛋白质组学的靶向治疗能够实现精准施策。

利用蛋白质组数据将疾病样本划分多个亚型,剖析不同亚型蛋白质水平的异质性,有助于理解疾病的发生机制,从而指导针对不同亚型的精准治疗。下面就让我们一起来看看基于蛋白质组学的疾病分子分型研究是如何实现的吧~

图片14.png

基于蛋白质组学的疾病分子分型研究总览[2]


磨刀不误砍柴工,样本收集是基础

收集合适的样本对于基于蛋白质组学的疾病分子分型研究的科学性至关重要,文章中常见的样本为临床组织样本或体液样本。

临床组织样本是疾病分子分型研究中样本收集的经典选择。这种样本选择策略能够更好地保证生物学意义,为相应疾病提供宝贵的数据资源,获得更准确的分子分型结果。2024年发表于Cell 期刊的文章[2]以小细胞肺癌为研究对象,收集了来自临床队列的肿瘤组织和配对癌旁组织,基于组学数据将小细胞肺癌分为四个亚型,系统表征各亚型独特的分子特征并提出潜在治疗策略。

临床体液样本也可作为疾病分子分型研究中的样本选择。2023年发表于Arthritis Rheumatol期刊的文章[3]以白塞病为研究对象,收集了来自临床队列的血浆样本,基于组学数据将白塞病分为三个亚型,推动了个体化治疗策略建立。


不会代码怎么破,青莲报告打包走

作为国内领先的蛋白质组学平台,马竞直播针对疾病分子分型研究开发了完整解决方案,下面就来看看基于蛋白质组学数据的疾病分子分型解决方案是怎么实现的吧~


数据预处理

数据分析前需要对数据进行标准化处理,对数据依次进行样本剔除、蛋白剔以及缺失值填补,处理方法和标准如下:

  • 样本剔除:剔除鉴定到的蛋白个数小于100个的样本。

  • 蛋白剔除:剔除在50%的样本中存在缺失值的蛋白。

  • 缺失值填补:缺失值采用全局最小值进行填补。

 

特征选择

预处理后的蛋白表达矩阵,首先进行分型分子特征筛选。常见的特征筛选指标包括基于变异系数(CV)、绝对中位差(MAD)、标准差(SD),筛选在不同样本间存在差异的特征。

分子分型

蛋白表达矩阵筛选分子特征后,采用非负矩阵分解(Non-Negative Matrix Factorization,NMF)算法进行分子分型。NMF是一种无监督学习技术,相较于传统层次聚类更准确。通过NMF聚类,可以发现差异蛋白矩阵中存在的亚组结构,并了解不同亚组之间的差异。

Cophenetic值是一种衡量聚类质量的指标,用于评估聚类算法产生的聚类结果与原始数据之间的相似程度,显示了聚类的拟合优度。

  • 分子分型结果热图:根据Cophenetic值判断最佳聚类个数K,选取Cophenetic值变化的最大变动的前点为最佳聚类个数,绘制聚类热图,并计算轮廓(Silhouette)系数来评估聚类的好坏。

  • 分子分型结果评估:Silhouette准则是一种用于聚类分析中的评价方法。Silhouette系数的取值范围在–1到1之间,其中负值表示数据点更容易被分类到错误的簇中,而正值则表示数据点更容易被正确分类。因此,Silhouette准则的目标是最大化Silhouette系数的平均值,从而找到最佳的聚类数量。

 图片15(1).png

亚型分子特征

得到分子分型结果后,通过整合分型结果与临床指标的关联,实现对分子分型结果进行临床解释。通过分析亚型特征和功能分析,可以实现针对不同亚型的精准化治疗方案制定。

  • 亚型差异蛋白热图:根据分型结果筛选各亚型间具有显著差异表达的蛋白(筛选条件:Mann Whitney U-test P-value<0.05且 |Log2(Fold-Change)| >1),联合临床指标绘制热图。

  • 亚型差异蛋白富集分析:对不同亚型间具有显著差异表达的蛋白进行KEGG富集分析,探究不同亚型的分子功能。

  • 亚型预后分析:若有临床预后信息,则可根据分子分型结果,进行Log-rank检验,绘制生存曲线,比较组间生存差异。

  • 临床信息与亚型关联的预后分析:根据分子分型结果以及临床信息,进行多因素Cox回归分析,并以森林图的形式进行可视化。

图片16(1).png

通过以上流程,能够实现可靠的基于蛋白质组学的疾病分子分型研究。此外,马竞直播针对队列样本研究瓶颈,还独家推出疾病生物标志物筛选、预后标志物筛选高级分析报告。步骤虽繁必不敢省人工,试剂虽贵必不敢减物力,疾病生物标志物筛选、预后标志物筛选解决方案已在过去两天与大家见面,之后的推送也将为大家带来更多的干货解读,敬请期待~

 图片13.png

联系我们
  • 电话:010-53395839
  • 邮箱:service@qinglianbio.com
  • 地址:北京市海淀永捷南路2号院1号楼
    中关村科学城·乡创中心
留言
您好,现在客服不在线,请留言。
如果没有留下您的联系方式,客服将无法和您联系!
留下以下信息,方便与您及时联系
Sitemap