生物信息学

本文参照生物信息学数据库大全进行了整理和归类,重新进行了发布
notion image
第一大类:综合数据库、DNA数据库、RNA数据库、蛋白数据库
综合数据库
  1. INSD:国际核酸序列数据库(International Nucleotide Sequence Databank)。由日本的DDBJ、欧洲的EMBL和美国的GenBank三家各自建立和共同维护。
  1. EMBL库:欧洲分子生物学实验室的DNA和RNA 序列库。
  1. GenBank :美国国家生物技术信息中心 (NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库。
  1. DDBJ :日本核酸数据库。
  1. GSDB:美国国家基因组资源中心(NCGR)维护的DNA序列关系数据库(Genome Sequence DataBase)。
  1. TIGR DATAbase:世界上最大的cDNA数据库,还有大量的EST序列和人类基因索引(HGI)。
DNA序列数据库
包括与DNA的复制、转录、修复等有密切关系的蛋白质因子。
  1. BioSino:中国自主开发的核酸序列公共数据库。
  1. CUTG,MM子使用频度表。
  1. EPD:真核生物启动子数据库(Eukaryotic Promotor Database)。
  1. TRANSFAC:真核生物基因表达调控因子的数据库。
  1. TRRD:真核生物基因组转录调控区数据库。
  1. OOTFD:转录因子和基因表达数据库。
  1. RepBase真核生物DNA中重复序列数据库。
  1. MicroSatellite:微卫星重复序列数据库。
  1. ALU数据库:是人及其他灵长类代表性的Alu重复片段。
  1. Simple Repeats:简单重复序列库。
  1. COMPEL:复合元件数据库。
  1. MPDB:分子探针数据库。
  1. HvrBase:灵长类mtDNA调控区序列库,主要是人的HVI和HVII两个高变异区的序
  1. PlantCARE:植物顺式作用(cis-acting)调控因子数据库。
  1. PLACE:从文献中搜集的植物顺式作用调控元件DNA模体的数据库,只涉及维管植物
  1. Mendel数据库:搜集植物STS和EST序列。
  1. HOX Pro:同源异型盒(homeobox)基因数据库。
  1. OPD:寡核苷酸探针数据库。
  1. dbSTS:序列标记位点数据库。这是GenBank的重要组成部分,它包含若干物种的已表达的序列标记信息。
  1. AmmtDB:后生动物线粒体DNA多序列联配数据库,搜集了脊椎动物线粒体中编码蛋白质和tRNA的多DNA序列对比数据,以及哺乳动物mtDNA主调控区序列联配数据。
  1. HOVERGEN:脊椎动物同源基因数据库(HOmologous VERtebrate GENes)。
  1. DNA结构参数库
  1. NUCLEOSOME数据库:收集实验测定的核小体数据,用于预测DNA中与组蛋白八聚体结合的位点.
  1. SELEX_DB:随机化序列库。
  1. ASDB:交替剪接基因的数据库。
  1. Intronerator:秀丽线虫内含子和交替剪接数据库。
  1. IDB和IEDB:前者是内含子序列数据库,后者是内含子演化数据库。
  1. EID:外显子、内含子数据库。
  1. NDB:核酸晶体结构数据库。
  1. VectorDB:载体数据库。
RNA序列和核糖体数据库
  1. snoRNA:小核仁RNA数据库。
  1. Small RNA数据库。
  1. tmRDB:已经联配好的、加有注释的、按亲缘关系排列的tmRNA序列数据。
  1. gRNA:导引RNA数据库。
  1. SRPDB:信号识别粒子数据库。
  1. TransTerm:信使RNA的组分和翻译控制信号数据库。
  1. ncRNA:非编码RNA数据库。
  1. lncRNAdb:真核生物长非编码RNA。
  1. lncRNAwiki:人类长非编码RNA数据库。
  1. RNAmods:RNA修饰数据库。
  1. AARSDB:酰氨基tRNA合成酶数据库。
  1. tRNA序列和基因、结构与功能数据库
  1. PLMItRNA:基于FastA的绿色植物线粒体tRNA分子和tRNA基因的数据库。
  1. 16SMDB、16S-likeMDB 、16SMDBexp 、23SMDB、 23S-likeMDBexp数据库:是一批16S和23S核糖体RNA突变数据库。
  1. SSU rRNA:欧洲核糖体小亚基RNA结构数据库。
  1. LSU rRNA:欧洲核糖体大亚基RNA结构数据库。
蛋白质结构和分类数据库
  1. PDB:蛋白质结构数据库。
  1. RCSB:结构生物信息学信息学合作研究组织。
  1. FAMBASE:是每个蛋白质家族的代表序列的集合,它有助于加速同源性搜索。
  1. ProtFam:蛋白质超家族的序列联配数据库。
  1. SCOP:蛋白质结构分类数据库。
  1. CATH:蛋白质结构与功能关系分类数据库。
  1. PIR-ALN:蛋白质序列联配数据库。
  1. 3Dee:蛋白质结构域定义的数据库。
  1. PROMISE:数据库。 MMDB:蛋白质分子模型数据库。
  1. DSSP:PDB库中所有蛋白质条目的二级结构归属数据库。
  1. HSSP按同源性导出的蛋白质二级结构数据库。
  1. INFOGENE:Sanger中心计算基因组学小组维护的、各基因组测序计划所提供的序列中已知的蛋白质和预测出的基因与蛋白质的数据库。
  1. TMBase:跨膜蛋白数据库。
  1. PRESAGE:是关于结构基因组学的一个数据库,它为库中每个蛋白质搜集了反映当前实验状况、结构、模型和研究建议的注释。
  1. PFAM:高质量的蛋白质结构域家族数据库。
  1. ProDom:自动产生的蛋白质结构域家族数据库。
  1. DOMO:蛋白质结构域数据库。
  1. GRBase:这是参与基因调控的蛋白质的数据库。
第二大类:按照物种来分
人类基因组测序中心
  1. HUGO:人类基因组组织。
  1. 美国能源部支持的人类基因组计划
  1. 世界上主要人类基因组测序中心的名单。
  1. NCBI的GenBank数据库从1999年10月起,建立了智人基因组子目录,其下按染色体编号设子目录。
  1. Human Genomics Studio:日本的DDBJ和信息生物学中心(CIB)联合建立了一个,可以按染色体编号检索和查找基因序列。
  1. Sanger 中心:是世界上最大的DAN测序中心之一。
  1. LBNL:Lawrence Berkeley 国家实验室。
  1. LLNL:Lawrence Livermore 国家实验室。
  1. LANL:美国洛斯阿拉莫斯国家实验室。
  1. JGI:由美国能源部支持的,依托LBNL、LLNL和LANL三个国家实验室的人类基因组研究部门建的联合基因组研究所。
  1. UWGC:华盛顿大学基因中心,是国际上最活跃的测序中心之一。
  1. SHGC:斯坦福大学人类基因中心,主要做高分辨率辐射杂交图谱,以及人类第四号染色体BAC克隆的测序。
  1. DOGS:基因组尺寸数据库。
  1. EuGenes:真核生物基因综合知识库,目前包括果蝇、人、小鼠、拟南芥、线虫、酵母、和斑马鱼的数据。
原核生物基因组
  1. 细菌基因组计划的进展情况
  1. MOT :欧洲生物信息研究所EBI的基因组测序进展表。 GIB:日本DDBJ设立的Genome Information Broker for microbial genomes 的缩写。 MAGPIE测序计划清单也可以参考。
  1. EMGLib:增补微生物基因组库。 大肠杆菌K12菌株的完全基因组序列:可由GenBank的子目录/genomes/获取,或从华盛顿大学大肠杆菌基因组中心,即Blattner实验室的网页读取。
  1. ECDC:大肠杆菌菌株K12的基因序列库,包括基因、读框、调控区、启动子、终止子、tRNA和rRNA等。
  1. EcoGene和EcoWeb:大肠杆菌K12菌株基因组数据库,包括基因、蛋白质、基因间蛋白质组信息。 RegulonDB:大肠杆菌转录调控和操作子数据库。
  1. NRSub:非冗余枯草芽孢杆菌DNA数据库,包括完全基因组、MM子使用表、基因图谱和基因家族。
  1. HIDB:流感嗜血菌完全基因组的原始数据库。
  1. HIDC:流感署血菌基因序列库。
  1. CyanoBase:蓝细菌数据库,实际上是集胞蓝细菌的基因组数据库。蓝细菌具有氧化和光合作用所需的全套基因。
  1. MJDB:詹氏甲烷球菌基因组数据库。
原生生物和线虫基因组
  1. 欧洲生物信息研究所EBI的原生生物网页
  1. AceDB:线虫综合数据库。
  1. 关于线虫发育特别是化学感觉神经的研究。
真菌基因组
  1. SGS:酿酒酵母基因组数据库。
  1. MYGD:酵母基因组、蛋白质和同源关系的数据库。
  1. YIDB:酵母内含子数据库。
  1. MNCDB:由德国MIPS所维护的粗糙链孢霉基因组数据库。
  1. 真菌基因组资源的网址。
  1. FGSC:真菌遗传学信息中心。
昆虫基因组
  1. 斯坦福大学的果蝇基因组中心
  1. FlyBase:果蝇胚胎发育过程中基因相互作用的数据库。
  1. 哈佛大学的果蝇网页
  1. MsqDB:蚊子基因数据库。
鱼类数据库
  1. 美国国家卫生署1997年建立的斑马鱼网页
  1. ZFIN:斑马鱼基因组、发育突变和野生种系数据库。
  1. Fugu:河豚的数据库。
  1. RainMap:彩虹鳟鱼基因图谱数据库。
啮齿动物基因组(小鼠)
  1. M.Musculus基因组库。
  1. MGD:家鼠基因组库,现在又称MGI即家鼠基因组信息库。
  1. Cre转基因家鼠系的数据库
  1. RatMap:大鼠基因图谱数据库。
家畜和家禽
  1. ChickGBASE:鸡基因图谱计划,搜集全世界鸡基因图谱信息。
  1. Swimemap:猪基因图谱计划,染色体图谱和标记。
  1. PiGBASE:猪基因图谱信息库。
  1. SheepBase:已发表的绵羊基因位点数据库。
  1. Goatmap:山羊基因图谱数据库。
  1. HorseMap:马基因图谱数据库。
  1. Bovmap:法国的牛基因图谱数据库。
  1. BovBase:英国的牛基因图谱数据库。
  1. BovGBASE:美国农业部的家畜基因组图谱计划中的牛基因数据库。
  1. Buffmap:水牛基因图谱数据库
  1. DogMap:狗基因图谱数据库。
  1. CatMap:猫基因图谱数据库。
农作物
  1. UK CropNet:英国农作物植物生物信息网络。
  1. INE:水稻基因数据库。
  1. NCGR:我国水稻基因组计划针对水稻的籼稻亚种。
  1. TIGR/rice:美国TIGR研究所维护着几个与水稻基因组有关的数据库,包括基因组注释库、重复序列库,以及基因索引。
  1. RiceGenes:美国康奈尔大学的水稻基因组数据库。
  1. GrainGenes:美国农业部和国家农业图书馆的植物基因组计划支持的麦、燕麦和甘蔗遗传数据库。
  1. riceweb:关于世界范围的水稻生产和市场等情况
  1. WHEAT:小麦基因图谱数据库。
  1. KOMUGI:日本小麦网。是由6所大学和研究所联合维护。
  1. MaizeDB:玉米基因组数据库。
  1. ZmDB:玉米基因组数据库。
  1. ILDIS国际豆科植物数据库和信息服务。
  1. 豆类基因图谱
  1. 豆科苜蓿属植物:MGI,NCGR和Samuel Roberts Noble基金会联合开展的豆科苜蓿属植物Medicago truncatula的基因组研究,在2000年4月已经提交15000多条。
  1. cottonDB:美国南方平原农业研究中心所维护的棉花数据库。
  1. TreeGenes:树木遗传图谱数据库。
拟南芥基因组数据库
  1. DatA:拟南芥基因组注释库。
  1. TAIR:拟南芥信息资源。
  1. AGR:拟南芥基因组资源。
  1. TIGR-AT:TIGR研究所的似南芥EST和基因序列数据库。
第三大类:按照功能领域来分
序列比对
  1. Blast:Blast系列
  1. EBI集合:多序列比对
细胞器数据库
  1. MitBASE:线粒体DNA数据库,集成所有已知线粒体基因信息。
  1. MitBASE Pilot:酵母线粒体中核基因数据库。
  1. 植物和藻类线粒体数据库
  1. 原生生物线粒体数据库
  1. 脊椎动物线粒体数据库
基因表达数据库
  1. Flyview:果蝇基因表达数据库。
  1. Flybrain:果蝇神经系统图谱和数据库。
  1. NEXTDB:线虫基因表达模式数据库。
  1. BodyMap:人类和家鼠基因表达数据库。
  1. Axeldb:非洲爪蟾基因表达数据库。
  1. TRIPLES:酵母基因功能数据库,设在耶鲁大学医学院的基因组分析中心。
  1. MGEIR:集成的家鼠基因表达信息资源。
  1. GXD:家鼠基因表达数据库。
  1. EpoDB:脊椎动物红细胞生成基因表达分析数据库。
  1. KidneyDB:肾脏发育数据库。
  1. toothExp:牙齿基因表达数据库。
基因突变、病理和免疫数据库
  1. HGMD:人类基因突变数据库,可用于预测基因疾病。
  1. Marfan:人类FBN1基因突变数据库及分析软件。
  1. Collagen人类胶原数据库。
  1. 人类PAX2等位基因变异数据库。
  1. 人类PAX6等位基因突变数据库。
  1. Androgen:雄激素受体突变数据库,包含与男性性器官发育不良、前列腺癌等有关图谱,密度、频度以及基因型和表现型关联数据。
  1. ALFRED:这是由耶鲁大学K.K.Kidd实验室维护的一个针对人口多样性和DNA多态性的等位基因数据库。
  1. KMDB:由日本庆应义塾大学医学院建立的一组与人类疾病有关的基因突变数据库
  1. KMeyeDB人类疾病和眼病基因突变人类心脏病基因突变数据库。
  1. KMearDB:人类耳病基因突变数据库。
  1. KMbrainDB:人类脑病基因突变数据库。
  1. KMcancerDB:人类癌症基因突变数据库。
  1. OMIA:是一大批动物的孟德尔遗传、疾病、基因型和表现型的数据库。
  1. Atlas:法国建立的针对肿瘤学和血液学的遗传与细胞遗传交互数据库。
  1. HAMSTeRS:凝血因子VIII结构和突变位点数据库。
  1. HaemB:B型血友病凝血因子IX点突变和短插入或删除序列的数据库。
  1. TTMD:转基因动物和靶突变数据库。
  1. FIMM:功能分子免疫学数据库。
  1. MTB:家鼠肿瘤生物学数据库。
  1. BCGD:人类乳腺癌基因数据库。
  1. PAH:是导致人类苯丙酮尿症的苯丙氨酸羟化酶特异位点数据库。
  1. CFTR:囊性纤维变跨膜调控子突变数据库。
  1. NRR:核受体资源计划,包括糖类皮酯激素、矿质肾上腺皮质激素、甲状腺激素、维生素D受体、类固醇受体等信息的数据库。
  1. IMGT:1989年建立的国际免疫遗传学数据库。
  1. HIG:Anthony Nolan 骨髓和白血病基金会的人类白细胞抗体HLA住处30年前由E.A.Kabat建立的具有免疫学意义的蛋白质序列数据库。
  1. PEDB:前列腺表达数据库。
  1. HIV:艾滋病分子免疫学数据库。
代谢途径和细胞调控数据库
  1. WIT:是美国阿贡国家实验室的一个集成的重构代谢途径和模型的系统。
  1. MPW:代谢途径数据库,是EMP库的一个子集。
  1. PathDB:代谢途径数据库。
  1. KEGG:京都基因与基因组百科全书,它包含核酸分子、蛋白质序列、基因表达、基因组图谱、代谢途径图等。
  1. SMILES:是一个辅助性数据库,它搜集与代谢途径有关的化合物名称。
  1. LIGAND:酶反应化学数据库,由日本京都大学化学研究所维护。
  1. CSNDB:细胞中信号网络的数据库。
  1. Biocatalysis/Biodegradation:生物催化和生物降解数据库。
基因组信息分析
  1. 基因组序列信息的提取和分析: dbEST 、UniGene 、Transcription factor database 。
  1. 功能基因组相关信息分析:NCBIEntrez 、OMIM 。
蛋白质组学相关信息分析SWISS-2DPAGE、 SIENA-2DPAGE 、Human 2D-PAGE Databases 、PROSITEPRINTS 、PfamBlocksSWISS-PROT:蛋白质序列库 。核酸序列的预测分析
  1. 重复序列分析CENSOR 、RepeatMasker 、XBLAST
  1. 核酸序列的预测分析1)数据库搜索NCBI的BLAST2)编码区统计特性分析:GRAILGenMARK
  1. 蛋白质结构和功能的预测分析1)预测蛋白质的物理性质ExPASyPROPSEARCHSAPSNnPredictPredictProteinTmpredSignalPSWISS-MODELPSI-BLAST
    1. 2)蛋白质二级结构预测
      3)蛋白质三维结构预测
生物医学文献数据库
  1. MEDLINE:美国国家医学图书馆的文献摘要库,反映美国及其他国家3800多种医学和生物期刊的作者摘要和引用情况。最为方便的查询MEDLINE的方式,是通过NCBI的PubMed服务。
  1. SeqAnalRef:A.Bairoch个人维护的有关序列分析的文献目录。
  1. SCI:设在美国费城的科学信息研究所所提供的文献引用情况的检索服务。
  1. CancerWeb:癌症网页。
  1. HUMAT:人体解剖学数据库。
  1. KeyNet:按生物序列功能组织的基因和蛋白质名称关键字库。
  1. BioABACUS:生物学与生物技术以及计算机科学缩写字表