研究蛋白互作的网络资源

目前,互联网已成为科学家们的重要工具。本文将为初学者提供一些与研究蛋白质-蛋白质相互作用相关的有价值的免费网络资源。在每一步会列出需要访问的网站。尽管没有提供每个网址的细节性指导,但是给出每次访问的目的和预期的信息。
一、准备
1.简单开始
如果你还不是熟悉你要研究的蛋白质,那么你可能需要对它现有的知识有个简单的了解。回顾文献是个很好的方法,你可以从PubMed上获得文献,此外互联网上还有许多其他选择。
(1)BioCarta(http://www.biocarta.com/genes/index.asp)上搜集了很多经典蛋白质的信号通路图,并附有简要的说明。
(2)NCBI Bookshelf(http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Books)是一个全文以及可进行检索的参考书的扩展数据库。
2.进一步了解
一旦你已经对研究对象有了基本认识,那么下一步就是获得一些细节性的信息。这些信息有助于进行实验设计并评估其潜在效果,提示可能的缺陷以及避免现有工作的重复。 PubMed (http://www. ncbi. nlm. nih. gov/ entrez/ query. fcgi?db= PubMed)是检索MEDLINE的杂志文章的一一种方式, 它能提供摘要,许多情况下还能链接到全文。
3.搜集序列信息
许多情况下你会需要了解蛋白质的序列。尝试收集多个物种的序列信息。如果你观察到一个在各个物种中都保守的特征,你可能希望进一步研究这个特性。你可以很方便地把这个序列用通用的FASTA格式保存在你的电脑上。用Readseq工具可以将其他序列格式转换成FASTA。你可以从多个网址获得这个工具,包括:
http://iubio.bio.indiana.edu/soft/molbio/readseq,它可以使你的计算机拥有独立的程序。而http://searchlauncher. bcm. tmc. edu/seq-util/readseq. html则是一个基于网页的界面。
二、挖掘数据库资源
随着高通量技术应用于检测蛋白质蛋白质相互作用,检索传统的书目式的数据库比如MEDLINE已经不足以弄清两个蛋白质是否有已知的相互作用。随着越来越多的蛋白质蛋白质相互作用被鉴定出来,获取和分析这些信息也变得越来越困难。一些数据库已经着手解决这些难题。目前主流数据库之间的内容重复不多,所以应当进行多个数据库的检索。
当搜索目标蛋白质的时候,数据库会列出与靶蛋白质相互作用的蛋白质并列出这些相互作用的性质。一般情况下,你可以找到关于基因的不同的名称、序列数据库的人口的链接和一些对蛋白质功能和亚细胞定位的描述。此外,标准的数据库还列出确认这个蛋白质相互作用的方法和确认这个相互作用的源文献的MEDLINE链接。不过,目前有关这方面的信息还不是很全面。多数网站都有图形工具帮助你通过交互的链接所构建的“路径”浏览数据库。对这些网络资源的检索是十分重要的。首先,你可以确定你要检测的蛋白质相互作用是否已经有报道。另外,有关蛋白质的相互作用的知识可以引导你提出蛋白质功能的假设和提示可能的配体。
(1)分子相互作用数据库(MINT; http://cbm.bio.uniroma2.it/mint/index.html)适宜于初始检索。它的页面选项较少,图形界面简单易用,容易操作。它还提供翻译后修饰的信息,以及与已知相互作用相关的蛋白质信息。
(2)生物分子相互作用网络数据库(BIND; http://bind.ca/index.phtml)不像MINT那么容易操作。和MINT一样,BIND也提供翻译后修饰以及一些蛋白质对的相互作用结构域的信息。BIND最大的特点在于它提供了非常详细的实验条件。
(3)蛋白质相互作用数据库集(GRID; http://biodata.mshri.on.ca/grid/servlet/index)更关注于酵母系统中的蛋白质-蛋白质相互作用。它的图形界面相当优秀,并可作为独立的软件建立路径图表。
(4)蛋白质相互作用数据库(DIP; http://dip.doe-mbi.ucla.edu/)最显著的特点在于其尝试了评估文献中支持每个相互作用的证据的可靠性。DIP 具有较全面的与其他数据库链接的列表,包括不同蛋白质结构域的列表。安装附加的JDIP图形界面可以更好地帮助你浏览DIP(http://dip.dor-mbi.ucla.edu/dip/jdip.cgi)。
三、蛋白质结构域检索和相互作用预测
结构域是一种功能性的亚单位,可以给其所在的蛋白质赋予某种特性。其中一个性质就是与其他结构域的相互作用。比如,SH2结构域可以结合含磷酸化的酪氨酸的结构域。互联网上有一些很好的数据库提供多种结构域的特征基序。在其中检索目标蛋白质可以帮助你了解蛋白质的可能功能和可能与其相互作用的蛋白质。
(1)InterPro Scan (http://www.ebi.ac.uk/interpro/index.html)可以帮助你在多种基序数据库中同时检索目标蛋白质的序列,包括Pfam和PROSITE,这是两个最大和最常用的基序数据库。每个数据库定义和归纳基序的方法各不相同,所以搜索多个数据库可以提高检索的敏感性。搜索结果都有超链接连接到一些页面,这些页面包含每个结构域的定义及已知功能意义的总结,并且便于检索具有相同结构域的其他蛋白质。
(2)iSpot (http://cbm.bio.uniroma2.it/ispot/) 主要涉及介导蛋白质蛋白质相互作用的三个常见的结构域。它应用已经发表的多肽结合的研究结果来预测含有PDZ, SH3和WW不同结构域的蛋白质与靶序列的结合程度如何。
(3)Interdom (http://interdom.lit.org.sg)可以预测和目标蛋白质结合的结构域。给出你的蛋白质序列,Interdom 会先确认该蛋白质所含的结构域并给出能够与之相互作用的其他结构 域。Interdom有很多方法完成这些预测,并根据其可能性将这些相互作用分级。通过点击Pfam的超链接可以找到含有这些可能结合结构域的蛋白质。
(4)ScanSite (http://scansite.mit.edu)可以帮助查找蛋白质中是否含有结构域和可能的翻译后修饰位点。
四、实验过程中
在初步的信息收集结束后开始准备实验的时候,互联网仍然能给研究者提供帮助。一些网站能提供试剂信息、实验步骤和问题解决方案。另外,通过布告栏和讨论列表你还可以获得其他研究者的建议。
(1)BioSupplyNet (http://www.biosupplynet.com)可以帮助你议查找试剂和仪器。网站提供了一个可检索的目录化的科研设备供应商的列表。
(2)Site like Protocol Online (http://www.protocol-online.org/)是解决实验问题的很有用的资源。正如网站的名字所表明的,你可以在这个网站检索实验方案。另外,网站还设有讨论板,你可以提出问题或者回答其他研究者的问题。