生物信息学-李霞第二版-绪论

绪论

第一节 生物信息学的兴起

一. 名词:

  1. 第二代测序技术:边合成边测序;
  2. 第三代测序技术:单分子测序;
  3. 新一代测序技术:the next generation sequencing,NGS;

二. 英文与缩写:

  1. 美国国立生物技术信息中心: National Center for Biotechnology Information,NCBI;
  2. 欧洲生物信息学研究所:European Bioinformatics Institute,EBI;
  3. 人类基因组计划:human genome project,HGP;
  4. 人类单体型图计划:the international hapmap project,HapMap;
  5. 单核苷酸多态性:single nucleotide polymorphysm,SNP;
  6. 基因组范围关联分析:genome-wide association study,GWAS;
  7. 非编码基因:non-coding gene;
  8. 高清傅里叶转化质谱:high-resolution Fourier-transform mass spectrometry;
  9. 反相蛋白质芯片:reverse-phase protein arrays;
  10. 人类蛋白质组草图:the draft map of the human proteome;

第二节 生物信息学的内涵及其在生命科学中的应用

一. 名词:

  1. 生物信息学:是研究生物医学资源中蕴含的重要信息的学科,其核心是解决生物医学问题,其常规的研究内容可以简单概括为生物大分子的序列,结构和功能,以及它们之间的相互关系;
  2. 生物信息学的内涵:
    • 研究领域:
      • 序列对比:alignment,比较两个或两个以上分子序列的相似程度,包括核酸序列和蛋白质序列的对比过程;
      • 序列装配:sequence assembling, 目前广泛应用的核算测序技术一般只能测出几十到几百个碱基对序列,技术的限制决定了测序过程需要对基因组进行打碎,并在测序后进行重新拼接的过程。 逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程,即为序列装配;
      • 基因识别:gene identification,基因识别的基本问题是在给定的基因组序列基础上,正确识别蛋白质组编码基因在基因组序列中的序列和精确定位;
      • 多态和基因间区分析:基因多态的识别和功能鉴定是研究物种进化、种群多样性、人类疾病易感和药物敏感性的关键技术。而基因间区的基因组序列组织形式既有多态(重复片段)性,又具有不规则特性,既可能是重要的未知基因的潜伏区域、重要的功能调控子,也可能是真正意义上的“垃圾”片段,对它们的深入理解是解释华因组功能复杂性的关键因素。
      • RNA表达分析:这里的RNA表达分析主要包括编码RNA和非编码RNA的表达分析。
      • 分子进化:分子进化和比较基因组学研究是从生物大分子的角度考虑的物种之间的垂直进化关系(建立系统发生树)或同一物种内不同亚种之间的迁移进化关系;既可以用DNA序列、遗传多态,也可以用蛋白质序列来开展相应的研究,甚至于可通过结构和分子网络层面的对比分析。
      • 结构预测:structure prediction,主要针对蛋白质序列和RNA序列进行分析,包括2级和高级结构的预测过程;
      • 分子互作:是细胞行使功能过程汇总最主要的作用形式,既包括最早认识到的蛋白质与蛋白质之间的互作关系,也包括蛋白质与核酸、核酸与核酸之间的相互作用。 分子互作是定性与定量相结合的分析过程,阐明分子互作不仅有利于了解整个细胞活动过程,也将对各种分子的功能和作用方式产生深刻的理解。

二. 英文及缩写

  1. 高通量组学:high-throughput omics;
  2. 生物标记:biomarker;
  3. 模式:pattern;

第三节 大数据时代的生物信息学与医学

一. 名词:

  1. 遗传图谱:genetic map,又称为连锁图谱linkage map。以遗传多态性标记位点为“路标”,以遗传学距离为图距的基因组图谱。
  2. 物理图谱:physical map,HGP DNA物理图谱的构建是基因组DNA测序的基础。
  3. 序列图谱:sequence map。
  4. 基因图谱:gene map。
  5. 组学与生物信息学:组学(X-Omics)概念是参照基因组概念,针对不同层面的生物大分子数据的产生演化而来的描述高通量分子生物数据资源的词汇。
    • 基因组学:genomics
      基因组学、结构基因组学、功能基因组学是三个紧密相连的生物信息学重点研究内容。 基因组学的目标是测定和分析某个(些)物种的全部DNA序列特征。 结构基因组学可为基因组学提供大量DNA及蛋白质数据,是基因组学的有力支撑及基础。 功能基因组学的主要任务是充分、合理利用基因组学及结构基因组学提供的信息,系统地研究基因及其产物的功能。
      • 基因组学:研究生物体基因组的组成情况,以及各基因的结构,彼此间关系及表达调控的科学。
      • 结构基因组学: structure genomics,是一门用结构生物学方法在生物体整体水平上(如全生物体、全细胞或整个基因组)对全部蛋白质(受体蛋白质、酶、通道以及与基因调控密切相关的核酸结合蛋白质)、相关蛋白质复合物(如酶和底物,酶与抑制剂,作用源与受体,DNA与其结合蛋白等)、RNA及其他生物大分子进行分析,精细测定其三维结构的学科。
      • 功能基因组学:functional gemomics,代表基因组学分析的新阶段,主要利用结构基因组学提供的信息,发展和应用新的实验以及计算方法,通过在基因组或系统水平上全面分析基因功能。其研究内容主要有如下几个方面:
        • 基因组表达及调控的研究;
        • 基因信息的识别;
        • 基因功能信息的鉴定;
        • 基因多样性分析;
        • 比较基因组学comparative genomics
    • 转录组学:transcriptomics
      所谓转录组,就是转录后的所有mRNA的总称,这些能被翻译成蛋白质的编码部分以及非编码部分的功能及相互关系的研究就是转录组的任务。
    • 蛋白质组学:proteomics
      是研究一个生命体在其整个生命周期中发挥作用的全部蛋白质,或者参与特定时间和空间(如特定类型的细胞在某一时期经历特定刺激时)范围相关功能的全体蛋白质的情况,包括表达水平、翻译后的修饰、蛋白质-蛋白质互作关系等特征,从而在蛋白质水平上获得对于有关生物体生理、病理等过程的全面认识。
Avatar
Dr.二哈
在读苦逼科研狗

研究方向:脂质营养,业余时间自学R。