W:12月3日在OSF Preprints网站上发表了美国马萨诸塞州剑桥数据分析公司Nference的一项早期研究“Omicron variant of SARS-CoV-2 harbors a unique insertion mutation of putative viral or human genomic origin”显示,最新变种的B.1.1.529 (Omicron) 里找到一段在引起感冒的人冠状病毒 HCoV-229E 的 S蛋白中特有的序列。
C:B.1.1.529 (Omicron) 变种的特点之一是:Spike N211del,Spike L212I,Spike ins214EPE。Spike ins214EPE 是说在 S蛋白的第211号天冬酰胺丢了、第212号亮氨酸变异亮氨酸了、第214个号开始插入了三个氨基酸“EPE”,其对应的核酸RNA序列是:GAG CCA GAA,这九个核酸“倒叙(先倒过来读)取反(A和U互换,C和G互换)”是:UUC UGG CUC,拿这个字符串到病毒数据库里查询,找到一种引起感冒的人冠状病毒 HCoV-229E 的 S蛋白中有一处相匹配:
241 tgcttatggtctgtttctggctcacggcttactactggttttgtctattttaatggtact
其中的 255-263: ttctggctc 与上面插入的序列完全相同(t=U)。说明新变种Omicron有一段基因来自另一种病毒或来自宿主。
L:新冠病毒刚刚流行时,就有人研究与人新冠病毒相近的蝙蝠病毒RaTG13相比较,发生了 S+PRRA 插入。于是,怀疑是人工改造了蝙蝠病毒,使之可以在人间快速传播。
H:今年10月,伦敦帝国学院的 Thomas P. Peacock 有一篇预印本文章“Putative host origins of RNA insertions in SARS-CoV-2 genomes”,文章综述了过去两年里新冠病毒发生突变后,病毒 RNA 序列中新插入的序列是否来自宿主。从文章描述的例子看,S蛋白的这个地方(214号座位)特别软弱,已发生过多次“插入”,例如:
Spike ins214GLTSKRN,实验室变异,可能与绿猴(Chlorocebus sabaeus)基因有关;
Spike ins214KFH,见苏格兰B.1.1.7变异,可能与HYDIN基因有关;
Spike ins216ADL,见美国B.1.2变异,可能与CTRC基因有关;
Spike ins214HSG,见英国AY.4变异,可能与PTPRB基因有关;
Spike ins214EGAE,见德国AY.4变异,可能与ADIPOR1基因有关。
在GISAID数据库用“Spike_ins”搜索总数5,773,804个病毒序列中可以找到 21,106 个病毒序列有“插入”。
Z:刚刚在GISAID数据库中找到一个较新的序列,EPI_ISL_6999541,是威尔士2021年11月7日采集,11月25日上传的AY4变体。其中有变化的是 Spike E156G,Spike F157del, Spike R158del:
22021 | ggaaagtgag | ttcagagttt |
ggaaagtg | gagttt |
原初病毒中在新宿主身上丢了六个核酸:agttca。原来的第156号gag(编码Glu/E=谷氨酸)的后两位ag丢了,g连到后面ga,变成了gga(编码Gly/G=甘氨酸),原来的157号ttc(编码Phe/F=苯丙氨酸)和158号aga(Arg/R=精氨酸)丢了。
这个病毒序列还有 Spike Y248S, Spike ins248GEN:
22271 | aggtttcaaa | ctttacttgc | tttacataga | agtt | atttga |
aggtttcaaa | ctttacttgc | tttacataga | agt tca ggg gag | aatttga |
即插入了一段新序列caggggaga,将原有的tat(编码Tyr/Y=酪氨酸)断开了,变成了tca(编码Ser/S=丝氨酸),后面变成了ggg(Gly/G=甘氨酸),gag(Glu/E=谷氨酸),aat(Asn/N=天冬酰胺)。
W:新插入序列是caggggaga,倒序变成agaggggac,取反变成tctcccctg,拿这个序列基因库查查看来自哪里?再去发篇预印本。