嗜睡病论坛

首页 » 常识 » 诊断 » 基因术语要记牢,使用别名风险高
TUhjnbcbe - 2021/11/6 3:36:00
什么是白癜风 http://baidianfeng.39.net/a_yufang/171218/5941903.html

编者按:笔者从不同的场合和亲身经历中发现,有些论文里面基因名字出现了张冠李戴,明明是研究A基因,论文跟着A基因的思路走,可结果经常是实验中做的是B基因,用B基因的序列和抗体,原因是很多时候A基因和B基因的缩写是一样的,这样的文章经常堂而皇之的发表在知名杂志上,从这里可以看出做实验的人粗心大意,写文章的也没有深究细节,遇到的审稿人也是外行,对相关领域不熟,这样发表出来的文章算什么呢?是联系杂志社撤稿还是装作不知道将错就错?实际上大多是情况下,都是默不作声将错就错了。这一点特别值得引起重视。有些时候文章只是讨论部分或者摘要部分张冠李戴错了,这还可以勘误挽回,有些时候是整个文章的实验主题部分都是张冠李戴,无法勘误,最好的办法是撤稿重做。

科研人员在发表的论文中使用独特、认可和功能丰富的术语,可以更容易地与更广泛的科学界讨论他们的工作。大多数时候,命名一个基因都是通过描述它的基本功能,然而随着人们认知的更新,对基因的描述方式也在不停地变化,旧的方式会被逐渐取代,新的方式开始占据主导。同时,有的约定俗成的东西会在某些领域中根深蒂固,形成并不规范的名词,这些名词就和各个地方的方言一样,存在的那么合理,但又造成了很多不便。

小编初入生命科学领域时,就曾被基因那些事绕得晕头转向:比如基因名与基因是不是一一对应?答案是no,当你在数据库检索文献时必定会深有体会,采用基因名、genesymble或基因别名进行搜索,检索结果必定大相径庭,那么这三者之间又有什么差别?检索结果中的文献真的都是你需要的么?最后还是需要靠你的火眼金睛来进行辨别。

虽然基因世界很混乱,但是常见的几个大数据中心(ENSEMBL,NCBI等)都致力于将混乱的世界规范化,要求全世界的科学家都采用统一的名词概念来上传他们的研究数据。换句话说就是数据中心规定了一套普通话,让全世界科学家都去学习,然后再来进行交流。许多杂志期刊在接收论文时也会强烈建议作者使用认可的基因术语,但在现实中,期刊并不会采取强制措施,因此助长了基因别名的嚣张气焰。那么在这个时候,我们必须意识到随着遗传学和基因组学的应用,在讨论临床相关基因时基因术语的使用变得尤为关键。使用未经批准的别名不仅会导致实验的混乱,更可能在临床上对患者造成伤害。

不规范的命名层出不穷,惨不忍睹,连基因命名事务“管理官”——国际人类基因组组织基因命名委员会(HumanGenomeOrganizationGeneNomenclatureCommittee,H(UGO)GNC)都看不下去了。年10月7日,HGNC在TheAmericanJournalofHumanGenetics杂志上发表了评论文章Therisksofusingunapprovedgenesymbols,以列举具体实例的方式严肃地指出,研究人员若不按照规定在科学论文中使用HGNC批准的基因符号,将为科学研究造成无穷无尽的困惑和混乱。

先来了解几个名词解释:基因全称(Definition)——用最严谨最精炼的语言描述基因的属性和功能;Genesymbol——通常是基因全称的缩写,最具识别力和使用频率最高的;基因别名(Synonymous)——基因其他名字通通叫这个。基因ID——基因的身份证,与基因一一对应。接下来,我们通过实例来看看他们的靠谱程度如何。

基因全称缩写造成的美丽误会:TAFAZZIN和WWTR1

近日,编码蛋白质tafazzin的基因被正式命名为TAZ(HGNC:;MIM:)。该基因的变异与X连锁遗传性疾病Barth综合征(MIM:)有关。Tafazzin蛋白在心肌脂重塑中起着关键作用,对线粒体功能至关重要。然而在大量已发表的文献中,WWTR1基因(WWdomaincontainingtranscriptionregulator1)(HGNC::MIM:)的别名transcriptionalcoactivatorwithPDZ-bindingmotif被缩写为“TAZ”。WWTR1可以与YAP1相互作用,相信熟知Hippo通路的小伙伴对“YAP/TAZ”这一对转录共同激活器并不陌生。当用“TAZ”去检索论文时,TAFAZZIN和WWTR1相关论文都会出现,大大较低了检索效率,甚至会可能干扰实验目的。比如,Takehara等人撤回的年所发表的论文。该论文的主旨是阐释Hippo信号通路在间皮瘤发展中的作用,因为别名“TAZ”,他们把感兴趣的WWTR1基因与TAFAZZIN混为一谈,错将TAFAZZIN当作WWTR1进行研究,这是不是有点让人哭笑不得呢~

那么如何才能更好地避免TAZ所引发的混乱呢?HGNC认为可以从两方面入手:一方面将已经批准的TAZ更新为TAFAZZIN(tafazzin,phospholipid-lysophospholipidtransacylas),目前大多数研究tafazzin蛋白的科研人员已经开始使用TAFAZZIN;另一方面,研究"YAP/TAZ"的科研人员应该及时停止使用“TAZ”符号来表示WWTR1基因(HGNC表示他们无法强制要求研究人员做出改变,只能全凭自觉)。

沿用前人犯下的错:OXR1和HCRTR1

年4月,有一位研究人员写信给HGNC,对已发表论文中将“OXR1”作为HCRTR1(hypocretinreceptor1)(HGNC:;MIM:)基因的别名表示担忧。实际上OXR1是已批准的“oxidationresistance1”(HGNC:;MIM:)的基因符号,它与小脑发育不良/萎缩、癫痫和发育迟缓相关(MIM:)。而HCRTR1和HCRTR2(HGNC:;MIM:)编码的蛋白质为神经肽激素的受体,与嗜睡症有关,他们的别名分别是“OX1R”和“OX2R”。让人感到无奈的是,在Pubmed的至少79份论文中,HCRTR1的“OX1R”别名符号的字母顺序被掉换,变成了“OXR1”(有没有发现,前人也不一定靠谱~)。HGNC认为,在这种情况下,将已批准的“OXR1”改为别的符号似乎也没有明显帮助,只能写信告知那些将HCRTR1的别名写为“OXR1”的作者,委婉地告知他们事情的严重性,期待他们能有所行动。

缩写造成的蝴蝶效应:SF3B3和SAP

SF3B3(splicingfactor3bsubunit3)(HGNC:;MIM:)和SAP(Sin3Aassociatedprotein)(HGNC:;MIM:)编码的蛋白质分子量均约为KDa。一些研究人员在论文中使用了“spliceosomeassociatedprotein”这个别名,而不是使用HGNC批准的SF3B3,并将其缩写为“SAP”。SF3B3基因编码的拼接蛋白通过结合CLEC4E(C-typelectindomainfamily4memberE)(HGNC:;MIM:)来激活免疫系统;而SAP(HGNC:)编码的蛋白是Sin3A复合物(与组蛋白去乙酰化酶相关)的一部分。年发表的一篇文章中将SAP称为CLEC4E的配体,实际上他们研究的是SF3B3。然后,OMIM将该文章添加为SAP基因的参考文献,更离谱的是,抗体公司将该文章同时附加到SAP和SF3B3相关的抗体产品中,最终造成研究人员对抗体的误用。调研结果显示,目前有34篇论文将“SAP”用作SF3B3的别名,其中有些论文并没有标注抗体具体信息,因此这些文章中抗体是否误用还有待查证,小伙伴们在使用相关抗体时可要留意咯。

基因ID才是基因唯一的伴侣:NRF1和NFE2L1

NRF1(nuclearrespiratoryfactor1)(HGNC:;MIM:)和NFE2L1(nuclearfactor,erythroid2like1)(HGNC:;MIM:)的别名都是“NRF1”。但使用“NRF1”同时表示这两个基因是不合适的,因为NFE2L1可以与TFAM(HGNC:;MIM:)协同调节NRF1;同时,NFE2L1和NRF1均受PITX2(HGNC:;MIM:)的调控。因此,在这种情况下,HGNC建议在论文中提及基因时加入身份证号(基因ID),以明确提及哪个基因:例如,NRF1(HGNC:),NFE2L1(HGNC:)。所以,最靠谱的还是基因ID啊。

软件bug:POU5F1

微软公司开发的智能表格处理软件Excel会自动转化某些基因名称为日期标签(如MARCH1-1-Mar,SEPT1-1-Sep)。年的一篇研究发现有接近五分之一的基因组学研究论文存在因为被Excel“误解”而导致的命名错误,随后HGNC对这些基因的名称进行了修改,例如将MARCH1改为MATCHF1,将SEPT1改为SEPTIN1等(另详见Bioart报道——特别

1
查看完整版本: 基因术语要记牢,使用别名风险高