R语言分析蛋白质组学数据:飞行时间质谱(MALDI-TOF)法、峰值检测、多光谱比较

最近我们被客户要求撰写关于蛋白质组学的研究报告。

 

由Kaizong Ye,Liao Bao撰写

研究生物体产生的全部蛋白质。

Foci:鉴定、结构测定、生物标志物、通路、表达。

基质辅助激光解吸飞行时间质谱(MALDI-TOF)法示例频谱

研究动机

只有相对较少的开源软件解决方案可用,而R平台则很少。

• 处理技术和生物复制的必要性。

• 相对强度的定量令人不满意

• 研究光谱校准对临床预后的影响。

• 模块化且易于定制的分析程序

示例数据

血清肽多姆分析显示血小板因子 4 是与胰腺癌相关的潜在鉴别肽


课程

R语言数据分析挖掘必知必会

从数据获取和清理开始,有目的的进行探索性分析与可视化。让数据从生涩的资料,摇身成为有温度的故事。

立即参加

G.M. Fiedler, A.B. Leichtle, J. Kase et al Clin Cancer Res June 1, 2009 15:3812-3819

“两个显著峰(m/z 3884;5959)对区分患者和健康对照的敏感性为86.3%,特异性为97.6%。”

“基于MALDI-TOOF MS的血清肽球分析允许发现和验证血小板因子4 [m / z 3884,7767;S.G.]作为胰腺癌的新鉴别标志物。

动手操作:文件导入

> spectra[[1]]

动手操作:画图

> abline(v=3884, col="blue")

R语言主成分回归(PCR)、 多元线性回归特征降维分析光谱数据和汽车油耗

阅读文章


动手操作:画图m/z 3884

> plot(spectra[[1]]

随时关注您喜欢的主题


动手操作:方差稳定和平滑 

> spea <- lapply(sptra, transfensty, fun=moAvg)

动手实践:基线校正


> plot(spea[[1]] > lines(b, col="red");

动手操作:基线校正 – SNIP 

> bl <- estiline(specta[[1]]

动手操作:基线校正 – SNIP 

> speca <- lapply(spe, remoeline)
> lines(specra[[1]])

实践:峰值检测

> peas[[1]]
> top <- intnsity(p) %in% sort(int
> labePeak

单光谱工作流程

> peaks <- lapply(spetra, detecPeaks)

多光谱比较


可下载资源

关于作者

Kaizong Ye拓端研究室(TRL)的研究员。在此对他对本文所作的贡献表示诚挚感谢,他在上海财经大学完成了统计学专业的硕士学位,专注人工智能领域。擅长Python.Matlab仿真、视觉处理、神经网络、数据分析。

本文借鉴了作者最近为《R语言数据分析挖掘必知必会 》课堂做的准备。

​非常感谢您阅读本文,如需帮助请联系我们!

 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498