生信分析干货强势来袭
随着蛋白质组学、代谢组学、基因组学的研究逐渐增多,生信分析的作用也越来越大。鹿明生物作为创新多组学研究的先锋,我们的生信部门专业人员将手把手教你进行生信数据分析!
本次的干货主题为:云平台分析小工具之时间序列、趋势分析,后续会有更多生信分析干货内容,记得关注收藏哦~
趋势分析概念介绍
Mfuzz能够识别表达谱的潜在时间序列模式,并将相似模式的特征聚类,以帮助我们了解特征之间的动态模式和它们功能的联系。
Mfuzz模糊聚类原理是将一个特征物质(代谢物、蛋白、基因)对应到几个簇,通过计算各个簇下该特征物质(代谢物、蛋白、基因)membership值,直观感受特征物质在某个聚类的归属程度,对时间序列这种逐渐变化,并且会频繁的出现聚类重叠类型的数据进行聚类分析。模糊聚类通过算法来确定每个数据隶属于各个簇的程度,而不是将一个数据对象硬性地归类到某一簇中。
算法流程:
(1)标准化数据矩阵;
(2)聚类簇的数量的确定;
(3)建立模糊相似矩阵,初始化隶属矩阵;
(4)算法开始迭代,直到目标函数收敛到极小值;
(5)根据迭代结果,由最后的隶属矩阵确定数据所属的类,显示最后的聚类结果。
趋势分析教学
那么作为新手,我想使用时间序列、趋势分析方法来了解生物学分子的动态模式与功能间的聚类联系,我该如何操作呢?
今天我们会推荐生信分析的网站:云平台,并对其中的操作和结果解读进行详细说明,现在就让我们开始这趟生信之旅吧~
云平台使用攻略
云平台官网地址:
https://cloud.oebiotech.cn/task/detail/mfuzzAnalyst/
STP 1.数据准备
时间序列、趋势分析一般采用差异特征物质(代谢物、蛋白、基因)的并集进行分析。将各个分组分别筛选出差异特征物质,获得每组差异特征物质并计算每组对应特征物质表达值的均值进行分析。
将数据保存成第一列为基因、蛋白、代谢物名称,其余各列为各样品分组中均值表达量,表头为样本分组名。如果表达量矩阵文件中存在空值的情况,请填充0后再上传运行。
STP 2.数据上传
提示:上传文件格式为xlsx格式,且分析适用于组别为3组及以上的数据集。
STP 3.结果说明
在时间序列、趋势分析之前会对数据进行标准化,将所有的数据处于同一标度。以下表为例,其中.expression Abundance(Z-score)表示经过标准化的数据,标准化基于原始数据的均值和标准差对数据进行标准化。.raw表示未经处理的数据。
为了更直观的展示组之间的关系及特征物质在不同组之间的表达差异,对所有差异特征物质的表达量进行层次聚类。
如果想要了解每个Cluster匹配到的特征物质有哪些及表达情况细节的数据时,可以查看结果中对应的Cluster的热图结果及折线图结果。
▲当前簇的热图展示
颜色从蓝到红表示特征物质的表达丰度从低到高,即越红表示差异特征物质的表达丰度越高。
▲特征物质在簇中趋势的展示
黄色和绿色的线表示低membership值的基因,红色和紫色的线表示高membership值。
Tips
运行结束后,
以上就是这期的干活内容了,快使用欧易生物云平台工具自己动手免费分析吧!如果还有不清楚的,或者操作中遇到问题,可以扫描下方微信,联系我们哦~
小鹿推荐
➧2023空间代谢组技术与实践培训班
鹿明生物第35期空间代谢组(线下)培训班报名中:包含2023空间代谢组技术与实践培训,为期3天;
时间:4月19日(周三)至4月21日(周五)
地点:欧易集团总部
还有早鸟价(4月5日前报名即可享),同时还有团报优惠价哦,快来参加吧~
关注
鹿明生物提供优质的空间代谢组服务
空代仪器平台
已搭建2套AFADESI-MSI质谱成像系统
项目执行
已落地执行项目百余项、检测组织样本类型20+;
定性算法经过多维校准
定性结果同时考虑物质表达空间情况、加和离子及同位素峰表达强度相似性、同位素表达空间分布相似性、非靶向质谱数据和空代自建数据库进行校准。
项目实测结果
可实现定性代谢物数量:1000-3000个代谢物
无偏好性检测代谢物::70%为700Da以下的小分子物质,30%为脂质类物质,更加适合代谢组学研究方向;
猜你还想看
◆厉害了!顶刊看好,打破传统维度的空间代谢组学如何「尽快去学」
◆项目文章 | AFADESI空间代谢组学探究小麦颖果氨基酸和有机酸对多基因响应~
◆当我问ChatGPT怎么学习空间代谢组时,它竟然直接告诉我应该这么做~