来自杜克-新加坡国立大学医学院的研究人员和他们的合作者在人类基因组中发现了数千个以前未知的DNA序列,这些序列为微蛋白和肽编码,可能对人类健康和疾病至关重要。

计算生物学家Sonia Chothani博士解释说:“我们对基因组中已知的2%的蛋白质编码的了解,大部分来自于寻找长链的蛋白质编码核苷酸序列,或长的开放阅读框。然而,最,科学家们发现了小型开放阅读框(smORFs),它们也可以从RNA翻译成小肽,在DNA修复、肌肉形成和基因调控中发挥作用。”

科学家们一直在寻求识别smORFs及其编码的小肽,因为smORFs的中断会导致疾病。然而,目前可用的技术相当有限。

Chothani博士补充说:“目前的大部分数据集并没有提供足够详细的信息来识别RNA中的smORFs。大多数还来自于对永生人类细胞的分析,这些细胞被繁殖--有时是几十年,以研究细胞的生理学、功能和疾病。然而,这些细胞系并不总是人类生理学的准确代表。”

Chothani和来自新加坡、德国、英国和澳大利亚的研究人员在最发表在《分子细胞》上的一项研究中介绍了他们为解决这些挑战而创建的方法。他们搜索了现有的核糖体分析数据集,寻找具有周期三碱基部分的短链RNA,这些部分覆盖了RNA长度的60%以上。然后他们进行了自己的RNA测序和核糖体分析,建立了一个由六种细胞和五种组织组成的综合数据集,这些细胞和组织来自数百名患者。

对这些数据的分析确定了8000个smORFs。有趣的是,它们对所发现的组织具有高度的特异,这意味着这些smORFs可能在其环境中执行一种特定的功能。研究小组还确定了由其中一些smORFs编码的603种微蛋白。

来自CVMD项目的该研究的高级作者Owen Rackham副教授说:“基因组中到处都是smORFs。我们的人类smORFs的全面和空间分辨率地图突出了基因组中被忽视的功能成分,指出了健康和疾病中的新角色,并为科学界提供了一个资源,作为加速发现的台。”

新加坡国立大学研究部高级副院长Patrick Casey教授说:“随着医疗系统的发展,不仅要治疗疾病,还要预防疾病,确定疾病研究和药物开发的潜在新目标可以为新的解决方案开辟途径。Chothani博士和她的团队的这项研究,作为科学界的资源发表,为该领域带来了重要的见解。”

推荐内容