华文慕课 生物信息学导论与方法综合考试答案
期末考试答案
1、(2分)
不同物种的同源序列间相似性越大说明这段序列
A、越容易引发突变
B、越活跃
C、越保守
D、越有物种特异性
E、越不容易进行比对
F、越难以研究
正确答案:C
2、(2分)以下变异和疾病数据库中创建时间最晚的是
A、1000Genome
B、LSDB
C、HGMD
D、OMIM
E、dbGAP
F、HapMap
正确答案:A
3、(2分)'vitamintransporteractivity'属于GO分类的哪一类?
A、MolecularFunction
B、MolecularRegulation
C、BiologicalFunction
D、BiologicalComponent
E、CellularFunction
F、CellularComponent
正确答案:A
4、(2分)蛋白质结构域方面的信息可以从下列哪个中查到?
A、KOBAS
B、MEGA
C、DAMBE
D、InterPro
E、KEGG
F、GeneMANIA
正确答案:D
5、(2分)下面哪个不是UCSC提供的工具?
A、GenomeBrowser
B、BioProject
C、Blat
D、In-SilicoPCR
E、TableBrowser
F、VariantAnnotationIntegrator
正确答案:B
6、(2分)GO的拓扑结构是下列中的?
A、有向无环图
B、无向树
C、无向有环图
D、有向树
E、网状网
F、星形
正确答案:A
7、(2分)20世纪90年代至21世纪初对生物信息学和整个生命科学领域产生深远影响的科研项目是下列中的
A、阿波罗计划
B、人类基因组计划
C、曼哈顿计划
D、人类补完计划
E、国际千人基因组计划
F、推进创新神经技术脑研究计划
正确答案:B
8、(2分)下列哪个生物信息学方法可以用来评判变异的危害程度?
A、BWA
B、KOBAS
C、SIFT
D、Blast
E、Cuffdiff
F、TopHat
正确答案:C
9、(2分)利用关联距离判断,下图蓝点与哪种颜色的点距离更近:
A、红点
B、灰点
C、无法判断
D、一样近
正确答案:A
10、(2分)BLAT和BLAST相比有什么优势?
A、支持比对同源性更低的同源序列
B、能支持含有很多序列的数据库
C、能同时对多个物种基因组进行搜索
D、运行速度快,且支持较大gap
E、可以进行多序列比对
F、比对准确度更高
正确答案:D
11、(2分)你想查询一个已知的蛋白质是的三维结构否已经被解析出来了,应该去访问的数据库是
A、KOBAS
B、OMIM
C、PDB
D、RefSeq
E、SRA
F、GenBank
正确答案:C
12、(2分)下列关于Smith-Waterman算法和Needleman-Wunsch算法的说法中法哪个是错误的
A、单独使用Smith-Waterman算法和Needleman-Wunsch算法均不适合用于高通量测序数据分析
B、Needleman-Wunsch算法更适用于长度相似的同源序列
C、单独使用Needleman-Wunsch不适合用于高通量测序数据分析,Smith-Waterman则适合
D、同时使用Smith-Waterman算法和Needleman-Wunsch算法不适合用于高通量测序数据分析
E、Smith-Waterman算法可以用于小段序列向大段序列的比对
F、Smith-Waterman算法更适用于寻找两个蛋白序列之间相似的功能域
正确答案:C
13、(2分)是下面哪个因素决定了k阶马尔科夫链下一时刻的状态:
A、由且仅由前k个时刻的状态决定
B、由且仅由第k个时刻的状态决定
C、由且仅由前1个时刻的状态决定
D、由且仅由第1个时刻的状态决定
E、由且仅由前k+1个时刻的状态决定
F、由且仅由前k-1个时刻的状态决定
正确答案:A
14、(2分)利用BonferroniCorrection使得对于比较10000个基因的实验,第一类错误的概率低于0.05,则每个具有统计显著性的基因的p-value应小于
A、5.0e-6
B、0.05
C、0.1
D、5.0e-10
E、500
F、5.0e-4
正确答案:A
15、(2分)根据KEGG数据库,threoninedehydratase在Glycine,serineandthreoninemetabolism代谢通路中发挥什么作用?
http://www.genome.jp/kegg/
A、催化Phosphoserine转变为Glycine
B、催化Serine和Glycine相互转变
C、催化Threonine和Glycine相互转变
D、催化Threonine和Pyruvate相互转变
E、催化Serine和Phosphoserine相互转变
F、催化Serine和Pyruvate相互转变
正确答案:F
16、(2分)以下测序质量中,代表测序错误率最低的是(单字以phred33形式记录)
A、:
B、G
C、@
D、B
E、A
F、i
正确答案:A
17、(2分)
BAM格式中包括的信息有
A、读段(read)比对程序的名字
B、读段的结构信息
C、读段比对的染色体名字
D、实验者的名字
E、实验室的名字
F、测序试剂的名字
正确答案:C
18、(2分)对同一序列进行tblastx时,其运算量理论上是blastn的几倍
A、1/4
B、1/36
C、4
D、36
E、12
F、8
正确答案:C
19、(2分)对以下几个物种基因组中含有的蛋白编码基因数目排序正确的是
A、人>葡萄>鸡>大肠杆菌
B、葡萄>人>鸡>大肠杆菌
C、鸡>人>葡萄>大肠杆菌
D、葡萄>鸡>人>大肠杆菌
E、人>鸡>大肠杆菌>葡萄
F、鸡>葡萄>人>大肠杆菌
正确答案:B
20、(2分)如下哪些技术可以用来提供蛋白组数据:
A、RNA-seq
B、cDNAmicroarray
C、Massspectrometry
D、SNPchip
E、ChIP-seq
F、Hi-C
正确答案:C
21、(2分)如下哪个计算方法不能对一个之前未知的从头起源基因提供有用的信息?
A、蛋白物理性质(如空间结构)预测
B、从RNA-Seq数据得到的mRNA表达特点
C、蛋白二级结构预测
D、基于已知功能基因的同源注释
E、蛋白质化学性质(如等电点)预测
F、蛋白质生物学性质(如分子结合性)预测
正确答案:D
22、(2分)
如下图,转录本1的表达量为20,转录本2的表达量为30,则基因外显子1和2的表达量分别为
A、50,30
B、30,50
C、40,30
D、20,30
E、10,40
F、60,20