研究人员已经在新冠病毒(SARS-CoV-2)的遗传密码中发现了一个神秘基因,该基因实际上隐藏在病毒基因组的视野中,至今仍被人们忽略。
新近鉴定的基因称为ORF3d,是所谓的重叠基因的一个例子:一种“基因内的基因”由于其与其他基因的编码序列重叠的方式而有效地隐藏在一串核苷酸中。
“就基因组大小而言,新冠病毒(SARS-CoV-2)及其近亲是存在的最长的RNA病毒之一,”美国自然历史博物馆的生物信息学家蔡斯·纳尔逊(Chase Nelson)解释说,“因此,它们可能比其他RNA病毒更容易发生"基因组欺骗"。”
实际上,病毒很容易携带重叠的基因,因此这并不是一个令人震惊的发现。ORF3d是否真正代表了基因组欺骗尚待观察,但是无论如何,要观察它肯定非常棘手。
重叠的基因很难在基因序列中识别出来,因为基因扫描系统在浏览一串遗传密码时常常会错过它们:被编程为拾取单个基因,但不一定看到序列中相邻基因的核苷酸之间共有的总体指令。
在像新冠病毒(SARS-CoV-2)这样的病毒的背景下,这可能会造成严重的盲点。自今年年初以来,科学家一直在争取尽可能多地了解这种毁灭性病毒,尽管已经阐明了其遗传构成的某些方面(包括坚决认为它不是“实验室制造”的)。剩下的就是我们还不知道。
纳尔逊说:“缺少重叠的基因使我们陷入忽视病毒生物学重要方面的危险。”
重叠的基因可能是冠状病毒进化成可以有效复制,阻止宿主免疫力或使其自身传播的一种方式。至于ORF3d,还有很多东西要知道为什么存在,潜伏在基因组中并跨越其他基因。
通过基因组数据库的扫描,研究人员发现该基因以前已经被鉴定出,但仅存在于一种会影响穿山甲的冠状病毒变体中(在中国广西发现)。
先前它也被错误地归类为不相关的基因ORF3b(存在于其他冠状病毒中,包括SARS-CoV),但实际上它们不是同一回事。
“这两个基因是无关的,并且编码完全不同的蛋白质。” 纳尔逊说,“这意味着关于SARS-CoV ORF3b的知识不应应用于SARS-CoV-2 ORF3d。”
我们确实知道这个神秘基因的一件事是基于ORF3d确实引起了强烈的抗体反应,而该基因是基于人类COVID-19患者以前的血液研究得出的。
至于是否还会触发T细胞–或重叠的ORF3d可能具有其他病毒用途——我们仍是一无所知。它可能是相对良性的,也可能不是。
"我们还不知道它的功能,或者是否有临床意义,"纳尔逊说。
"但我们预测,与抗体反应相比,T细胞反应不太可能检测到这种基因。也许这与基因是如何产生的有关。
有一件事是肯定的。在一种只有15个已知基因的病毒中,发现另一个基因——更不用说重叠基因——是一个重大的发展。科学家现在将尝试找出答案,这是多么重要。