怎么批量将excel内容输入到网页进行查核酸并导出结果?

nt库和nr库大家都比较熟悉,一个核酸库,一个蛋白库,两者既可以通过NCBI进行在线BLAST,也可以在/html/5769.html 来更加深入的了解KEGG数据库,在这里,仅针对老师一些序列的kegg注释为老师提供一个在线提交的方法:

2. 待任务上传完成,邮箱会收到一份邮件告知任务被受理:

3. 按照邮件提示操作即可,完成后会收到一封邮件。

4. 打开邮件中链接,点击对应任务的 html:

这样就会得到序列的KEGG注释结果了,一般来说,对于1万条左右序列,1-6小时即可完成。

genomes(真核生物蛋白相邻类的聚簇)的缩写。构成每个KOG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或者是paralogs。Orthologs是指来自于不同物种的由垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。Paralogs是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。数据库链接:ftp://ftp.ncbi.nih.gov/pub/COG/KOG/kyva。

该数据库,目前没有在线提交的注释方法,但是如果你仔细看上文的话,会发现其实可以通过swissprot来获得KOG注释信息,没有发现的话,请回头再仔细看看。

STRING数据库(https://string-db.org/)是一个搜寻已知蛋白质之间和预测蛋白质之间相互作用关系的系统。这种作用关系既可以是蛋白质之间的物理作用,也可以是间接的功能相关性。它基于染色体临近、系统进化谱、基因融合和基因芯片数据等生物学信息来计算基因或者蛋白的共表达。

最新的string数据库为10.5版本,包含2031个物种9'643'763种蛋白1'380'838'440种相互作用关系。您可以通过下载收录物种蛋白序列的方法进行本地blast比对,点击download

对于在线比对,string使用起来还是非常方便的,如下图

可以使用基因名或者蛋白序列进行查询,蛋白序列查询方法我们在此不多做说明,基因名查询的方法对我们来更为常用,以人为例,输入gene symbol(一行一个),如下图,点击search

String网站会将输入的gene name与数据库中该物种的基因进行匹配,输出匹配最好的一条画钩,一般来说,在这里可以检查一下是否匹配正确,绝大多数情况下,是没有问题的,有些时候输入的基因名和收录的基因名可能稍有出入,实际输出的时候,是以sring网站为准。确认无误后,点击CONTINUE(输入越多,这一步越慢,后面的图和表也越复杂,因此不建议输入过多基因)。

在弹出的如下网页中,上半部分是蛋白互作图,中间是一些设置参数等,如下图:

对于上图的互作关系图片,可以直接使用,也可以导出数据之后用Cytoscape自己绘图。

是以不同的方法去查看结果,一般默认是Network,对于其他感兴趣的可以点击查看一下。

是一些说明,包括图标说明,线条说明以及输入说明。

是进行一些设置,比如用互作关系或者可信度展示线条,图片保存格式(png或者svg矢量图),以及最低可信度等,如图所示使用0.4会显示所有打分值在0.4之上的nodes,最高可以设置为0.9以减少低可信度nodes,也可以是图片使加简单美观。

可以对这些输入基因进行GO和KEGG注释及富集,并输出结果。

可以将结果文件输出,包括图片和表格信息,如前面所说如果需要自己用 Cytoscape绘图的话可以点击TSV输出格式,得到互作用excel表格。

是对输入进行聚类,其实如果用Cytoscape也是可以进行聚类的,使用的是MCODE,可以查看小编上一篇文章详细了解。如下图所示,是对TSV输出结果进行绘图并聚类的结果,不同的cluster用不同的颜色显示。

关于string还有一个文件想再说明一下,就是download中的species.v10.5.txt 文件,该文件是以taxon_id进行排序的,大家可以在其中查找相应物种进行检索,到这里,关于string的介绍就结束了。

AnimalTFDB(http://www.bioguo.org/AnimalTFDB/)是一个动物转录因子数据库,该数据库收录了大部分动物模式物种,包括人,猪,蟾蜍、果蝇等50个物种的71个转录因子家族,他们的注释信息是基于ensemble 6.0

}

本文由微科盟技均根据实践经验而整理,希望对大家有帮助。

微科盟原创微文,欢迎转发转载。

在上篇技术贴“”中,我们通过Excel进行了相关性热图的制作,留下一个问题:Excel是表格数据,如何将Excel中的热图导出为高清图片其实,这种情况我们常常遇见。比如,当我们的核酸序列较长时,我们想要以图片的形式展现核酸序列一般会采用截图(图1)、或者先复制到PPT再以图片形式保存(图2),但我们如果以Adobe Illustrator (AI)为媒介,就能让Excel文件数据以图片形式呈现出来的质量得到极大提升(图3)。本文将为上篇技术贴做补充,在此基础上作应用延伸。

如果对您有帮助,请三连一波哦~

点赞,在看,转发!!!

上篇技术贴“”,我们得到如下Excel表格数据(图4,见“示例”文件)。通过文字调整位置、去网络线(视图工具)、文字加粗等方式,我们可以得到处理后的图片(图5)。

  之后,准备好Adobe Illustrator (AI):打开AI→新建→设置基本参数(单位:像素;宽度:3000px;高度:2000px;颜色模式:RGB;栅格效果:高)(图6)。

   之后,复制(Ctrl+C)Excel表中非星号数据(图7)至AI(Ctrl+V),注意如果复制内容有线框,一定要多复制线框外的单元格区域,否则最外圈的线框不会显示。复制到AI后可裁剪工具裁剪至最适大小(图8),双击“抓手”工具(图9)。

  之后,按同样的方法复制Excel表中星号数据(图10)至AI(图11)。此时不需要裁剪,只需复制粘贴。点击选择工具,通过键盘移动键(↓→↑←)将星号与对应热图格子对齐(图12)。

  之后,打开Excel条件格式(图13,具体操作参照上篇“”),将注释图截屏粘贴到AI,通过文字工具和缩放工具调整(图14)。

  熟练以上步骤后可以快速大批量地进行扩增子热图相关性制作。同时,还可以简单的方式快速解决Excel数据以图片形式呈现清晰度低的问题。

   有时候我们会遇到将Excel表以图片形式呈现的情况。以核酸序列数据为例,通过以上方法,我们可以实现Excel表格数据以高清图片形式呈现(图3)。

本文来源于微科盟原创作者技均,仅用于学术分享,如有侵权,请联系删除!


关注《微生态》公众号,扫码联系微生态老师22(微信号M),备注《技术贴∣Excel:手把手教你如何用AI实现Excel数据高清图片生成》,即可获得示例文件

}

我要回帖

更多关于 如何把网页内容保存成excel 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信