数据挖掘肿瘤预测_科研套路不嫌多,数据挖掘发3分

06a283fc56e866e99f9a05fb38367e0c.png

解螺旋公众号·陪伴你科研的第2003天

如何复现一篇3分生信研究做科研需要先学习套路,才能超越套路。今天给大家介绍的套路文献是今年发表在《Oncology reports》(IF= 3.041)上的一篇文章。558018c7f993ba4695e0a1e49a4946a1.png文章的标题虽然看上去比较泛,但也让读者一眼就能知道主题了,“molecular mechanism”、“potential drugs”、“papillary renal cell carcinoma(PRCC)”,所用的研究数据就是“TCGA and Cmap datasets”了。当然,也有一些同学看到TCGA这几个字母,就敬而远之了,大家可以翻翻我们之前写的文章,抑或学习下我们的课程,让这些同学们不再只是“远观”,而且可以“亵玩”。首先,给大家简单介绍下文章method的主要内容:1. 作者首先用GEPIA做了个差异表达(没错,就是那个网页工具);2. 用MetaScape进行GO的富集分析,用Webgestalt进行KEGG通路富集分析;3. 根据上面得到的差异表达基因用Cmap和Drug Pair Seeker进行药物分子预测,前者是Broad下的网页工具,后者是需要下载使用的工具,不过两者都是基于Connectivity Map;4. 构建药物-通路网络:基于Cmap的数据找到受药物影响的差异表达基因,然后将这些基因做基因富集分析;5. 构建药物-靶标网络:作者从DrugBank里弄到了潜力位于top10的药物的分子结构,然后去STITCH数据库里找他们的靶基因;6. 进一步探索PRCC的潜在药物:作者首先用STRING的数据和差异表达的基因,然后在Cytoscape里的CentiScape插件寻找其中的hub基因,再用GEPIA确认hub基因的表达水平。然后在Human Protein Atlas数据库里找了C3和ANXA1的免疫组化结果。最后作者用systemsDock(也是个网页版工具)做了个hub基因蛋白与药物之间的分子对接。

对于新手或者不太熟悉的同学,笔者建议将上述工具和数据库都去学一学用一用,技多真的不压身!(基本都是网站和一些简单的工具)

下面我们来看看文章的主要结果:1. Table1和Table2分别展示了PRCC中差异表达基因的GO和KEGG的富集分析结果e633d08cde4732f80afcf852efbb19c1.png4db58776875637702a17c6949d25a698.png2. Figure1和Figure2也是展示PRCC中差异表达基因的GO和KEGG的富集分析结果5b0ee2e60f8f21c70bcadc90a496e5f3.pngc628adf7c035cad05af1a8ad817cab76.png3. 展示了打分最高最有潜力靶向RPCC的10个药物分子bc8890ad57489bdf358c5a06eef73308.png4. 展示了潜在的靶向药物与信号通路之间的网络关系。蓝色的表示药物,红色的表示受药物影响的通路。43e2e7f57b45a696be631fdc0db7016a.png5. 然后作者展示了基于STITICH数据库构建药物分子和靶点之间网络关系的结果。3e4c29aba567d8c43d6aceb52d9ee3d2.png6. 作者在Cytoscape里找到了hub基因,并展示了这些hub基因之间的PPI网络:2f6df9ceafa4d303046cfc6524fe00d2.png7. 然后作者用GEPIA验证了上面的hub基因在PRCC和癌旁组织中存在差异表达(没错,就是GEPIA!)8e27f7e2eee34715814cb131ba29b358.png8. 然后作者在TCPA中用C3和ANXA1的蛋白数据做了个生存分析(然而两者都不显著啊,为什么不在GEPIA里也做一个mRNA的生存分析呢?)37e9466c691d4fe60dbb3322ea2aad72.png9. 作者用Protein Atlas的数据验证了C3和ANXA1两个基因的蛋白在肿瘤中表达比较高,在60%以上的病人中都检测到了,位列前茅。e60548daf7b36d22664c845520114f4b.png10. 然后作者展示了免疫组化的结果比较了正常组织和肿瘤组织中的差异(数据挖掘真好,抗体的费用都省了)39ced98fb0c4994bc79cb4d085bc5982.png11. 随后作者秀了下C3和ANXA1两个蛋白与药物分子的对接效果图,展示了药物能结合的氨基酸残基和空间距离。75d69b3846e0b661e5862848970e2c5d.png以上就是这篇文章的主要结果,这篇文章对于想要学习数据挖掘的小白们来说,还是值得学习的,至少其中所涉及到的工具还是有不少的,推荐大家去看看学习。笔者也随手给大家提两个建议,如果大家对生信技能稍微熟悉一点,这篇文章里前面的GO和KEGG可以用GSEA来作,这样的结果会更靠谱一点,结果图也可以更多一些。然后就是可以用TCIA或者TIMER里的免疫细胞浸润数据分析比较一下正常和肿瘤组织间的免疫浸润差异嘛。祝大家都能有所收获,多发文章,发高分文章!d2439d4191fa25540e2afe7ed769cb74.png—END—

相关文章

9772626bad2fc39b859ca6b04ffd2285.png

看看这个套路,低分论文你可以发一打

90bb2415742822417d2cf0c43b1a4b16.png

9分期刊提出的“癌王”治疗新思路

b3fc3ab47c49eda8d9e7e9402b33713c.png

骨髓细胞一定有免疫抑制功能吗?

c2e983e93a6358ad4485c461bc1ac2a0.png

点下“在看”,多根头发8ab545dc6da6717b138355708ed1e40a.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/260674.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Jupyter notebook 导出PDF的3种方法

很多用Jupyter notebook的都想导出PDF,但是我们点击Download as PDF via LaTex. 然后呢? Ohzzzzzzzzz 出现下图的错误,看到这里感觉糟糕透啦。虽然可以根据提供的方法解决这个问题。下面我说说我的方法吧。 方法1 打开jupyter notebook&a…

mybatis中的#{value}和${value}的区别

2019独角兽企业重金招聘Python工程师标准>>> 1. #{value}将传入的数据都当成一个字符串,会对自动传入的数据加一个双引号。 2. ${value}将传入的数据直接显示生成在sql中。 3. #{value}方式能够很大程度防止sql注入。  4.${value}方式无法防止Sql注入。…

数据库备份失败问题

备份对于服务器“服务器名”失败。(Microsoft.SqlServer.Smo) 其他信息:System.Data.SqlClient.SqlError:无法打开备份设备c:\abc.bak。出现操作系统错误5(拒绝访问。)。(Microsoft.SqlServer.Smo) 解决办法: Sql Serv…

重写setTimeout扩展参数

1 //判断函数行参长度来决定是否需要重写setTimeout,ie8以下为undefined2 if(window.setTimeout.length undefined){3 var __sto window.setTimeout;4 window.setTimeout function(callback,timeout,param){5 var args Array.prototype.slice.c…

针对access数据库的增删改查

1、执行查询操作:(ExecuteReader方法) string myConnectionString "Provider Microsoft.Jet.OLEDB.4.0;Data Source "Server.MapPath("~/") "App_Data/access.mdb"; //使用相对路径连接数据库 string mySel…

pandas 在jupyter notebook时候能用,但在vscode, pycharm不能用

先看错误。 AttributeError: partially initialized module ‘pandas’ has no attribute ‘Series’ (most likely due to a circular import) 分一下这种错误 ‘…’ has no attribute ‘…’ 库没有 ’…’ 这种问题,要么库没有装好,或者装的库的…

解决 IDEA 调用其他类的时候自动加上包路径和类名的情况_idea 快捷键汇总(转)...

1.IDEA常用快捷键Alt回车 导入包,自动修正CtrlN 查找类CtrlShiftN 查找文件CtrlAltL 格式化代码CtrlAltO 优化导入的类和包AltInsert 生成代码(如get,set方法,构造函数等)CtrlE或者AltShiftC 最近更改的代码CtrlR 替换文本CtrlF 查找文本CtrlShiftSpace 自动补全代码Ctrl空格 代…

8位可控加减法器_自主可控:QTouch在军工道系统上的应用

自主可控:QTouch在军工道系统上的应用一、系统介绍"道系统"操作系统是一款面向各领域的嵌入式实时操作系统,支持单核及多核CPU硬件配置,可替换相关领域的VxWorks 6.8/6.9操作系统二、产品特性 具备自主知识产权的嵌入式实时操作系统…

截获所有以太网帧数据并进行具体分析

/* capture_packet.c - 截获所有以太网帧数据并进行具体分析 *//* 常用函数的头文件 */ #include <stdio.h> #include <stdlib.h> #include <string.h> #include <strings.h> #include <unistd.h> #include <signal.h>/* 与网络相关…

Spark启动程序:Master

临时笔记def main(argStrings: Array[String]) {//读取以spark.开头的配置属性val conf new SparkConf//检查环境变量&#xff1a;SPARK_MASTER_HOST、SPARK_MASTER_PORT、SPARK_MASTER_WEBUI_PORT //再检查配置属性&#xff1a;master.ui.port //检查其他master配置&am…

iOS - Frame 项目架构

前言 iOS 常见的几种架构&#xff1a; 标签式 Tab Menu列表式 List Menu抽屉式 Drawer瀑布式 Waterfall跳板式 Springborad陈列馆式 Gallery旋转木马式 Carousel点聚式 Plus1、标签式 优点&#xff1a; 1、清楚当前所在的入口位置2、轻松在各入口间频繁跳转且不会迷失方向3、直…

Windows 10下,anaconda (conda) 虚拟环境的创建,jupyter notebook如何使用虚拟环境

手把手教您创建conda 虚拟环境 1 安装好anaconda后&#xff0c;会出现如下所示&#xff0c;这些都是anaconda集成啦&#xff0c;不需要再安装了。我们在如下所指的anaconda Prompt右键&#xff0c;以管理员运行 2 打开后&#xff0c;这就是prompt&#xff0c;我们输入pyth…

python下载文件传到服务器_python实现FTP文件传输的方法(服务器端和客户端)

用python实现FTP文件传输&#xff0c;包括服务器端和客户端&#xff0c;要求 &#xff08;1&#xff09;客户端访问服务器端要有一个验证功能 &#xff08;2&#xff09;可以有多个客户端访问服务器端 &#xff08;3&#xff09;可以对重名文件重新上传或下载 FTP&#xff08;F…

oracle数据库主键自增序列_Oracle数据库序列详解

前言&#xff1a;做过web开发的人员基本上都知道&#xff0c;数据库表中的主键值有的时候我们会用数字类型的并且自增。这样mysql、sql server中的都可以使用工具创建表的时候很容易实现。但是oracle中没有设置自增的方法&#xff0c;一般情况我们会使用序列和触发器来实现主键…

一步步学习微软InfoPath2010和SP2010--第十三章节--SharePoint视图和仪表板(9)--基于表单库的仪表板...

现在你已经知道了如何将服务台网站和表单与自定义视图放在一起&#xff0c;最后一步是使用SharePoint创建仪表板&#xff0c;以呈现表单中的信息的基本报表。表单设计者经常致力于表单以至于他们忘记了SharePoint的力量来聚合表单的属性&#xff0c;并建立KIPs和其他类型的报表…

SQL常用语句积累

SQL 常用语句积累&#xff1a;一、 SQL 基本语句SQL 分类&#xff1a;DDL —数据定义语言 (Create &#xff0c; Alter &#xff0c; Drop &#xff0c; DECLARE)DML —数据操纵语言 (Select &#xff0c; Delete &#xff0c; Update &#xff0c; Insert)DCL —数据控制语言 …

vscode 里 Import “numpy“ count not be resolved

问题如下&#xff1a; 我们分析一下这个问题&#xff0c;这里的问题。问题的翻译是&#xff1a;导入"numpy"不能被解决。 这可能有几个问题&#xff0c;1&#xff1a;vscode的python插件没有安装&#xff0c;2: vscode的python的解析器没有设置好。 按照这个思路&…

xdocument查找节点值_二叉查找树(java)

一棵二叉查找树(BST)是一颗二叉树&#xff0c;其中每个节点都含有一个Comparable的键且每个节点的键(以及相关的值)都大于其左子树中的任意节点的键而小于右子树的任意结点的键。数据表示和链表一样&#xff0c;我们嵌套定义了一个私有类来表示二叉查找树上的一个节点。每个节点…

三角形 画_CAD入门基础第3节:直角三角形的圆及如何修剪

这个软件&#xff0c;仔细想想&#xff0c;无非就两个命令&#xff0c;一是直线命令&#xff0c;二&#xff0c;就是圆。直线&#xff0c;无非也就是两种&#xff0c;一&#xff0c;是水平直线和垂直于水平直线的竖线&#xff0c;二&#xff0c;就是各种斜线。第一种直线&#…

【转】系统缓存全解析二:动态缓存(4)-第三方分布式缓存解决方案 Memcache(2)...

缓存系统MemCached的Java客户端优化历程&#xff08;转载自http://code.google.com/p/memcache-client-forjava/。&#xff09;Memcached是一种集中式Cache&#xff0c;支持分布式横向扩展。这里需要解释说明一下&#xff0c;很多开发者觉得Memcached是一种分布式缓存系统&…