亚洲精品综合日韩中文字幕网站_精品综合久久久久97_中文在线天堂网www_久久精品免费一区二区三区_91久久国产综合精品女同国语_久久资源总站在线国产成人

您好, 欢迎来到化工仪器网

| 注册| 产品展厅| 收藏该商铺

13224517959

news

首页   >>   公司动态   >>   Nature:人类基因究竟多少个?近20年学界“大争议”带来新结论|

上海希言科学仪器有限公司

立即询价

您提交后,专属客服将第一时间为您服务

Nature:人类基因究竟多少个?近20年学界“大争议”带来新结论|

阅读:1968      发布时间:2018-6-21
分享:
导读

早在2000年,人类基因组序列草图还在制作中时,遗传学家们就开始对人类基因数目进行估算。近20年后,拥有真实数据的他们仍然无法就这一数量达成一致,这一知识差距阻碍了他们在发现与突变相关疾病上的努力。直至近,科学家们又发布了新数据:他们认为人类共有超过2.1万个蛋白质编码基因。

gnosticwarrior

新结果使用了数百份人体组织样本的数据,并于5月29日发布在BioRxiv预印本服务器上。它包含了近5000个以前未被发现的基因,其中近1200个携带了制造蛋白质的指令(carry instructions for making proteins)。总的来说,与先前估计的约2万个蛋白质编码基因数目相比,本次统计有所上升,总数为超过2.1万个

DOI

然而,许多遗传学家并不确信,所有新提出的基因都将经得起严密的审查。他们的批评也凸显了识别并定义新基因的难度之大。

领导本次基因数目统计的生物学家Steven Salzberg说:“人们在这方面已经努力了20年,但我们仍然没有答案。”

终答案?

2000年,随着基因组学界对人类基因数量的争论, Ewan Birney(目前为英国Hinxton欧洲生物信息学研究所[EBI]所长)发起了基因竞赛。他在每年一度的遗传学会议上于一个酒吧里进行了次tou注,这次比赛终吸引了1000多名参赛者和3000美元的奖金。对基因数量的押注从超过312,000个到略低于26,000个不等,平均约为40,000个。之后,估计的范围在缩小,大致范围在19000到22000之间,但仍然存在分歧。

Source: M. Pertea & S. L. Salzberg

基因计数可以根据被分析的数据、使用的工具和剔除假阳性的标准而变化。新的统计使用了更大的数据集和不同于先前的计算方法,以及更广泛的基因定义标准。

 

Salzberg的研究小组使用了来自基因型组织表达( GTEx )项目的数据,该项目对数百具人体的30多个不同组织的RNA进行了测序(RNA是DNA和蛋白质之间的中介)。为了鉴定编码蛋白质的基因和那些在细胞中不编码但仍起重要作用的基因,他们组装了GTEx的9000亿个微小RNA片段,并将其与人类基因组对齐。

 

然而,仅仅因为一段DNA表达为RNA,并不一定意味着它就是一个基因。所以这个小组试图用各种标准滤除噪音。例如,他们将研究结果与其他物种的基因组进行了比较,认为远亲生物共享的序列很可能由于进化而得以保留(因为它们具有功能性),而且很可能是基因。

 

终,研究小组留下了21,306个蛋白质编码基因和21,856个非编码基因,远远超过两个广泛使用的人类基因数据库(由EBI维护的GENCODE基因组包括19,901个蛋白质编码基因和15,779个非编码基因以及由美国国家生物技术信息中心管理的数据库RefSeq列出的20,203个蛋白质编码基因和17,871个非编码基因)。

 

前RefSeq负责人Kim Pruitt认为,造成这种差异的原因一部分是由于Salzberg团队分析的大数据量;另外一个主要的区别是,GENCODE和RefSeq都依赖人工处理——人为查看每个基因的证据并做出终决定,而Salzberg的小组则*依靠计算机程序来筛选数据。

“如果人们喜欢我们的基因列表,那么也许几年后我们将成为人类基因的仲裁者。” Salzberg说。

Illustrated by Jeremy Dimmock. via Pacific Standard

 

何为基因的定义标准?

需要指出的是,许多科学家仍坚称,他们需要更多的证据才能确信这份清单的准确性。协调GENCODE人工注释的EBI计算生物学家Adam Frankish说,他和他的团队已经扫描了Salzberg团队鉴定的大约100个蛋白质编码基因。据他们评估,其中只有一个似乎是真正的蛋白质编码基因。

 

Pruitt的团队成员研究了Salzberg小组的十几个新的蛋白质编码基因,但没有发现任何符合RefSeq标准的基因。有些与基因组中似乎属于侵入我们祖先基因组的逆转录病毒的区域重叠;另一些属于其他重复性延伸(repetitive stretches),很少被翻译成蛋白质。

 

但是Salzberg认为一些重复序列可以被认为是基因。ERV3–1就是一个例子,它出现在RefSeq中,并编码在结直肠癌中过表达的蛋白质。同时Salzberg也承认,他团队名单上的新基因将需要他们自己和其他人的验证。”

 

令人困惑的是基因定义的变化和不。生物学家过去认为基因是编码蛋白质的序列,但后来发现一些非编码RNA分子在细胞中有重要作用。这一基因判定的标准争议也解释了Salzberg计数和其他计数之间的一些差异。

重要意义

准确统计所有人类基因对于揭示基因与疾病之间的非常重要。Salzberg指出,不计其数的基因经常被忽视,即使它们含有致病突变。但是仓促地将基因添加到主列表中也会带来风险。一个错误的基因将会转移遗传学家对真正问题的注意力。

 

Pruitt补充道:“生物学是复杂的。数据库与库之间的基因数量不一致对研究人员来说仍然是个问题,人们还在寻求一个终的答案。”

 

New human gene tally reignites debate

产品展示

会员登录

请输入账号

请输入密码

=

请输验证码

收藏该商铺

标签:
保存成功

(空格分隔,最多3个,单个标签最多10个字符)

常用:

提示

您的留言已提交成功!我们将在第一时间回复您~
在线留言
黄大仙区| 鹤岗市| 东明县| 正定县| 邻水| 富平县| 云浮市| 克什克腾旗| 垫江县| 衡南县| 房产| 广宁县| 崇左市| 元阳县| 彰化市| 靖远县| 新丰县| 高青县| 溧阳市| 西昌市| 吉水县| 彭州市| 富宁县| 尼玛县| 阿瓦提县| 华坪县| 民权县| 绍兴县| 义乌市| 襄垣县| 台安县| 平谷区| 丰台区| 澄城县| 旬阳县| 南涧| 天水市| 龙井市| 高淳县| 青浦区| 利津县|