基因组学
一.名词解释
1)稀有切点限制酶
在基因组范围内又较少的酶切识别位点的限制性酶,经酶切处理可以得到较大的片段。
2)重组热点(recombination hot spot)
染色体的某些位点之间比其他位点之间有更高的交换频率。
3)C值
指一个单倍体基因组中DNA的总量,一个特定的种属具有特定的C值。
4)辐射杂种群
含有另一种生物染色体片段的啮齿类细胞的集合体。
5)基因组
生物所具有的携带遗传信息的遗传物质总称。
6)可变剪切
指转录的mRNA前体的一种加工方式,通过不同外显子组合,使mRNA前体形成多种成熟的mRNA编码不同蛋白质,是形成蛋白质多样性的重要前提。
7)共线性
不同生物的基因组中基因排列顺序的一致性。
8)重叠群
由限制性内切酶技术或其他克隆方法获得大量DNA片段,根据DNA片段间片段间彼此重叠的序列构建的物理图谱。
9)RNA编辑
通过化学修饰改变转录物的编码性质,使其指令的蛋白质发生氨基酸顺序的变化,mRNA这类修饰
10)蛋白质组
由一个细胞或一个组织的基因组所表达的全部相应的蛋白质
11)遗传图谱
是以遗传距离表示基因组内座位相对位置的图谱。
12)comparative genomics
是基因组学与生物信息学的一个重要分支,通过模式生物基因组或模式生物基因组与人类组之间的比较与鉴别,为分离重要的候选基因,预测新的基因功能,研究生物进化提供依据。
13)链终止法
DNA测序最常用的方法,通过合成与单链DNA互补的多核苷酸链来读取待测DNA分子的顺序,在合成的互补单链过程中由于加入少量的双脱氧核苷酸(ddNTP)可在不同位置终止终止反应,形成仅有一个碱基差异的DNA复制链,通过电泳可读出DNA碱基顺序。
14)CpG岛
人类基因组中某些DNA区段的CG比例显著高于基因组平均水平,CpG岛的长度约1kb。
15)共分离
在有性繁殖的后代中,分子标记与连锁的基因有最大的可能同时出现在同一个体中,这一现象被称为共分离。
二、回答问
1.新基因产生的途径有哪些?
a)部分或全部现有的基因加倍
b)基因重排
c)从其他物种获取基因
d)基因突变
2.为什么水稻能成为禾本科植物基因组研究的模式生物?
a)重要的粮食作物
b)基因组小,重复序列比例相对低;禾本科植物分子生物学的模式
。
c)遗传转化系统已成熟,能大规模进行基因功能分析
d)禾本科植物基因组存在共线性
3.高等生物基因组甲基化具有那些生命学功能?
a)调控基因表达
b)引起表观(后生)遗传
c)抑制转座因子
d)染色体重建
e)基因组印记
4.为什么说蛋白质组比基因组更复杂?
1)基因组由4种核苷酸组成,而蛋白质由20种氨基酸组成。
2)基因组是相对稳定的实体,蛋白质通过与基因组的相互作用而不断发生变化,不同组织/发育时期存在差异
3)DNA到蛋白质的信息流,许多环节受到调控,如mRNA就、可变剪切、编辑,一个基因并不对应一种蛋白质;
4)蛋白质由有许多修饰方式,如磷酸化,糖基化等200多种;
5)蛋白质行使生物学功能,具备一定立体结构,存在蛋白质互作;
6)蛋白质承担更多的生物学功能。
5.基因组时代基因的定义是什么?判断一段DNA序列是否包含基因有哪些
?
Gene:a complete chromosomal segment resposible for making a functional product.
Open reading frames(ORFs)
Sequence features.
Sequence conservation.
Evidence for transcription.
Gene inactivation.
三、论述题
1.Science、Nature杂志将“Small RNA&RNAi”评为2002年度重大科技成果之一,是RNA研究的突破性进展,是生物科学近20年来,可与HGP相提并论的最重大成果之一,你认为这种评价合适吗?为什么?
答:
1)small RNA& RNAi可以调节和关闭基因的表达,能调控细胞的各种高级生命活动。
2)small RNA& RNAi的发现大大地提升了人们对RNA分子的认识,开辟了RNA分子功能研究的新领域。
3)小RNA和RNA干扰研究具有广泛的应用前景,它有可能掀起一场生物革命,首先RNAi是一项快速、高效、便于操作的使靶基因失活的技术,因此它可以象基因敲除一样非常有效地鉴定特定基因的功能。随着各种模式生物的基因组计划的完成,生物学家们已经可以方便的从数据库中获得全基因组序列,从而找到研究者感兴趣的基因的序列,据此设计出dsRNA就可以使该基因沉默,这是研究疾病机理和鉴定候选药靶的关键步骤,也为将来可控地打开或者关闭某一特定基因这一目标奠定了基础。
4)small RNA& RNAi的发现大大推进基因功能的研究,更为各种传染病的防治、肿瘤等医学顽症的根治,开辟了一条新的有效的途径,如RNA干涉能减少肝炎病毒感染所需的蛋白质,以达到减少病毒数量的目的;也可以用来减少某些遗传疾病的不正常基因的蛋白质制造量,以治疗该疾病。
5)小RNA的出现重新唤起了科学家们对“RNA世界”的重视及对“生命起源与RNA分子”这一命题的兴趣,有的科学家认为成千上万非编码蛋白质的RNA分子组成了巨大的分子网络调节着细胞中的生命活动,它们与蛋白质-蛋白质相互作用网络相对应。
2.请论述模式生物基因组研究给生物科学的发展带来了那些重大影响?
答:
1)提供对复杂生命体进行深入研究的平台,生物学研究总是由简如难,例如研究老鼠的基因组比人类的要简单,人类遗传家系的局限性,可以通过老鼠相关同源基因的研究,帮助人类基因组的研究,同理,比较基因组学的发展,正是建立在模式生物基因组的研究上的。
2)发现新现象,新机制,加深对生命本质(基因、基因组、生命网络)的认识。
3)推进技术革命。
4)有助于分析不同物种间的亲缘关系,了解生命进化的历程,例如可通过比较基因组相似性判断亲缘关系,可通过植物染色体中大量的重复及业内判断可能经历的染色体加倍,等等。
5)改变了人们思维方式和先前的认知,例如对基因数目和非编码DNA的认识,对RNA的认识等,整个基因组的研究,也使生物学研究脱离了以前单个,静态基因的研究,从而转变了系统地整合性的研究,也带动了生物信息学,功能基因组学,蛋白质组学,蛋白质组学等的发展,激发了以生物医学和生物技术为核心的生物产业的发展。
6)推进生物
技术和产业。
生物信息学
一、填空
1.生物信息学的“信息学内涵”体现在两个方面,一个是 方法上借助信息技术 ,一个是 内容上研究生物信息 。
2.算法分析的内容主要分为两个方面,一个是算法的 正确性 ,另一个是算法的 效率。
3.序列相似性分析可以用来进行 进化关系 推测、结构推测和 功能 推测。
4.在三种基本构树方法的选用策略方面,一般来说,如果序列间的相似性极高则用 简约 法;次之,如果序列间的相似性较高则用 距离矩阵 法;再次之,如果序列间的相似性并不很明显则用 最大似然 法。
5.目前为止,最著名的三个基因组数据库是__NCBI-Genome_, ___UCSC_和__Ensembl_。
6.蛋白质组分析的两个支撑技术是_双向凝胶电泳_和______质谱___,二者都离不开计算机的辅助,各有各的软件。
二、单项选择
1.(B)生物信息学最常用的平台(操作系统)是:
A.MS-windows/Dos B.Unix/Linux C.MacOS D.Perl
2.( B ) 以下_______是蛋白质序列复合数据库。
A.PROSITE B.UniProt C.BLASTx D.tBLASTn E.tBLASTx
3.( C )用核苷酸序列搜索蛋白质序列数据库用__
A.BLASTn B.BLASTp C.BLASTx D.tBLASTn E.tBLASTx
4.( B )Entrez是一个生物信息学_________
A.基因数据库 B跨库检索平台 C.相似性检索工具 D.商业软件
5(C).ExPASy是一个综合性的_______服务器。
A.基因信息 B.基因组信息 C.蛋白组信息 D.RNA信息
6.( A )Swiss-model是一个著名的_________.
A.蛋白质结构预测软件 B.进化树模型 C.生物数据模型 D.生物信息检索平台
三、判断
1.(X)“生物信息学(Bioinformatics)”这个概念大约在1950s就已经形成
2.(X)文件系统的出现,是数据和程序之间的依赖关系得以根本改变,数据无论从内容还是格式上都完全独立于程序,计算机的应用开始走向各行各业乃至普通家庭。
3(X)Internet是WWW(万维网)上的一种信息服务。
4.(V)Bioperl是一组Perl模块,它主要目的在于利用Perl解决生物信息学中的各种实际问题。
5.(X)目前最著名的蛋白质数据库是Protein Data Bank(PDB)。
6.(V)概念性翻译时,如果选用序列很长,六框翻译中可能不止一框含有正确的(对应CDS的)ORF。
7.(X)CLUSTALW是一个著名的EST聚类软件。
8.(V)P还有礼品格式是一种多序列比对格式,可以用于后续的分子进化分析。
9.(V)一个STS由一对PCR引物来定义,它在相应的基因组中只出现一次。
10.(V)直系同源体簇(COG)中也可能包含并系同源的基因。
四、名词解释(用中文)
1.二次库(Secondary databases)
基于元酷暑具体链分析的结果,如非冗余化、序列模式、结构分类和进化关系等,而组织形成的数据库称为二次库。
2.FASTA格式(FASTA format)
FASTA格式是描述核酸或蛋白质系列信息的著名格式,很多分析软件都能识别这种格式,其特点是比较简洁,第一行是以一个大于符号开始的注释行,第二行开始以下都是序列信息。
3.序列对位排列(Sequence alignment)
源序列与目标序列之间按碱基(或氨基酸)位置相对排列。其目标是使序列之间的相似程度最大。
4.开放读码框(ORF)
起始于起始密码子、终止于终止密码子的“中间没有终止密码子”的读码框,称作开放读码框,又称可读框。
5.表达序列标签(EST)
通过自动测序仪对一个cDNA克隆单次测序很难产生整个克隆序列信息,往往只能产生一个片段序列信息,成为一个EST。它们代表在特定组织或发育阶段表达的基因,其相关分析是一种发现新基因和定位基因的有效方法。
6.单系类群(Monophyletic group)
一个祖先类群的所有子裔类群的集合,或称为“进化枝”。
五、英汉互译
1. A phylogenetic analysis of a family of related nucleic acid or protein sequence is a determination of how the family might have been derived during evolution. Two sequences that are very much alike will be located as neighboring outside branches and will be joined to a common branch beneath them. The object of phylogenetic analysis is to discover all of the branching relationships in the tree and the branch lengths.
评分点:基本语义正确3分,专业单词正确1分,翻译流畅1分。
2.在推动生物信息学前进的竞赛中,一部分高度概括的提倡者和很有影响力的人已共谋将生物信息学从一个科学分支降格为“购买了合适工具包就能完成的一个功能”。而维护这个领域地位的正是生物信息学的学术应用群体,无论其成员来自私立大学还是政府资助的研究中心。
评分点:基本语义正确3分,基本语法正确1分,翻译流畅1分。
六、问答
1试述构树方法中基于“置换”和基于“相异性”的原理的关系。
答:在所有构树方法中,其原理或基于核苷酸(或氨基酸)在进化过程中的置换,或基于核苷酸(或氨基酸)序列的相似性,相异性肯定来源于置换,然而,置换的结果在序列中并不一定能以相异性显现,因为可能会有平行置换、趋同置换和反转置换。一般来说,基于相异性院里的构树方法比基于置换原理的构树方法在计算速度上更快。
2.请叙述肽质指纹图谱分析的基本原理。
答:肽质指纹图谱分析的基本原理:特异酶解拟鉴定蛋白质,测定实际肽段质谱图;从蛋白质数据库中随机挑选一段蛋白质序列,理论水解之,并计算出各个肽段的分子量,从而构建出理论质谱图;将实际肽段质谱图与此蛋白序列理论质谱图进行比较,进行相似性计分,从数据库中重新挑选一段序列,重复以上两步;最后,根据相似性计分确定最可能的蛋白序列。
3.什么是蛋白质结构的“比较建模(Comparative Modeling)"?试述其原理,基本步骤和特点。
答:"比较建模”又称“同源建模或模建(Homology Modeling)”,它是基于和“目标蛋白质”具有较高序列相似性的结构已知的“参考蛋白质”的结构特征来推测目标蛋白质结构的一种方法,其基本步骤是:将目标蛋白质Blast已知结构的蛋白质序列库,寻找参考蛋白质;根据序列比对,一参考蛋白质为模板结构确定目标蛋白质的基本构架(氨基酸a碳原子定位),然后定位氨基酸侧链,最后精炼模型(可以基于能量最小化原理)。目前,它是蛋白质结构预测的最主要方法之一,和其他方法相比具有较高的精确性,其最大的局限性在于需要有参考蛋白质的结构信息。
4.为什么生物信息学分析的结果往往需要试验验证?
答:生物信息学分析属于一种理论分析,往往要先引入一些假说或假设,所以我们要注意到它在现代生物学研究中发挥的重要作用时,需要意识到其预测或分析结果需要最终的实验来进行验证。(相关描述,据其质量,酌情给分)。
5.已知来自某物种的一段DNA的序列信息,如何运用生物信息学的方法,尽可能多的得到其他各种相关信息?请结合图示说明。
答:评分点:BLASTn搜索同源核酸序列2分,据此推测基因1分,推测进化关系1分,e-PCR基因组定位1分,BLASTx搜索相关蛋白质序列2分,据此推测相关信息(模式、结构、功能等)1分;图示清晰2分,其他大体内容酌情加分。
基因工程:
一
1. 强启动子
2. 终止子:有效的转录终止子的必要性:
a) 转录产物越长,所需时间就多,外源基因本身的转录效率下降
b) 转录通读进入质粒功能区,可能干扰质粒的复制和其它生物功能,甚至导致重组质粒的不稳定性
c) 转录终止子能增强mRNA分子的稳定从而大大提高了蛋白质产物的水平
d) 转录产物过长影响翻译效率
3. SD序列:外源基因在大肠杆菌中的高效表达不仅取决于转录启动频率,而且在很大程度上还与mRNA的翻译其实效率密切相关
4. 密码子:由于原核生物和真核生物基因组中密码子的使用频率具有不同程度的差异性,因此,外源基因尤其是哺乳动物基因在大肠杆菌中高效翻译的一个重要因素是密码子的正确选择.
5. 重组子的稳定性
6. 质粒拷贝数:提高产量除了使用强启动子以提高转录效率外,还可以增加质粒拷贝数以增加基因的剂量.者可以通过构建高拷贝载体而实现.治理的稳定性对工程菌株高效表达产物非常重要.在寄主细胞快速生长期间质粒易于丢失,出现无质粒细胞.
7. 不同蛋白表达方式
二
转移DNA以后将胶重新染色,看是否还有DNA在胶上.片断太大,转移时毛细管作用失败即溶液不是通过胶上移等.Southern Blot可用来检测基因序列的同源性,可以分析转基因动植物的转基因在基因组上出现的情况等
三
碱性磷酸酶处理载体,噬菌体包装蛋白包装下限的限制,利用某些基因(存在时不能在一定菌株中存在,而这些基因为外源DNA取代时则能存在)等预防
.区分方法包括双抗性法,lacZ基因显色法,发光法,PCR法等.
四
单纯以噬菌体为基础构建的载体:装载量大,能获得单链DNA,转染效率高;操作较难,DNA不稳定
单纯以质粒为基础构建的载体:有天然的抗性选择标记,操作容易(宜于分离和纯化),较稳定;装载量小,转化效率较低
五
1. 切口平移标记:控制DNaseI的浓度,就可以在双链DNA分子的一条链的有限位置上打开切口,形成3-OH末端(这条链即成为引物),DNA聚合酶I把一个带有标记物的dNTP就加在此引物的3-OH末端,而它的5-3的核酸外切酶活性将切除5-单核苷酸,同时一次添加新的核苷酸到3一侧,其结果合成的DNA带有标记物.
2. PCR:标记物的dNTP,dNTP,引物(插入片段两端的序列)等扩增合成新的带有标记物的DNA.
3. 用碱性磷酸酶去掉DNA末端磷酸,再用磷酸激酶将32P加入DNA末端标记DNA
4. 随机引物标记:标记物的dNTP,dNTP,Klenow大片断,随机引物合成新的带有标记物的DNA
六
又称为聚合酶链式反应,能在体外特异快速扩增DNA片断.组成:DNA单链模板,引物,DNA聚合酶(包括缓冲液)
1. PCR扩增,外源DNA制备,加接头及限制性核酸内切酶切割
2. 载体DNA制备及相应限制性核酸内切酶切割,如pUC19
3. 用DNA连接酶连接外源DNA和载体DNA
4. 通过转化或转染的方法将上述重组DNA转入受体细胞中
5. 筛选和鉴定转化细胞
6. 蓝白菌落鉴定,双抗生素选择等
七
脓杆菌介导法的优点:
1. 转化效率高
2. 能够插入非重排的外缘DNA长片断
3. 外缘转化DNA主要以单拷贝或是低拷贝形式插入
4. 不需要特殊的专用设备
缺点:
1. 转化的寄主范围有限,特别是对许多单子叶植物不适用
2. 外源的转基因只能以T-DNA插入的方式被导入寄主细胞
生物弹击法的优点:
1. 基因转移不受物种界限的约束
2. 可适用于不同的转化样品,如根,镜,叶培养细胞愈伤组织,甚至种子等
3. 很有可能用于培育转基因的禾谷类作物
缺点:
1. 需要复杂的专用设备
2. 外源转化DNA重排频率高,并经常以多拷贝形式插入
八
1. 对环境的安全性
2. 对人类健康的安全性
3. 宗教以及伦理问题