一针辉瑞疫苗,其实是2万亿段代码:程序员逆向重建mRNA源代码
从辉瑞疫苗被批准以后,它就被置于世界的聚光灯下。近日,一位程序员从计算机科学的角度,对辉瑞疫苗的设计进行了‘逆向工程’,文章引起不小的反响,从信头 (Header)、元数据(Metadata),到帮助伪装躲过人体免疫系统防火墙的 Ψ 分子,一支疫苗有2万亿段重复的代码,我们看到了计算机与生物学那颇为神秘的联系。 辉瑞疫苗,逆向工程? 听起来有些不可思议,但一位程序员从计算机科学的角度深度剖析了Biotech/辉瑞的mRNA新冠疫苗BNT162b设计,并撰写了这篇文章—— Biotech/辉瑞SARS-CoV-2疫苗的源代码的反向工程(Reverse Engineering the source code of the BioNTech/Pfizer SARS-CoV-2 Vaccine)。(以下简称辉瑞疫苗) 读过后,你或许会开始会让你对生命和计算机世界产生奇妙的联系。 简单的生物学背景 让我们先来回顾一下生物学知识,这里,我们将透过程序员的眼睛看待生命编码。 DNA和程序的种种相似的地方,但与计算机使用0和1不同,生命使用A、C、G和U/T来编码。 在自然界中,A、C、G和U/T都是分子,以链的形式储存在DNA(或RNA)中。 在计算机中,我们把8位编入一个字节,字节是处理数据的典型单位。 自然界将3个核苷酸组合成一个密码子,而这个密码子是典型的处理单元。 密码子包含6位信息 (每个DNA字符2位,3字符= 6位,这意味着2⁶ = 64种不同密码子值) 。 其次,疫苗是一种液体,我们该如何谈论源代码? 源代码! 让我们从疫苗的一小部分源代码开始,下图为世界卫生组织公布的BNT162b前500个字符。 mRNA新冠疫苗BNT162b的核心就是这个数字代码。它有4284个字符长,在疫苗生产过程的最开始,将这段代码上传到DNA打印机,然后打印机将磁盘上的字节转换成实际的DNA分子。 DNA打印机,型号BioXp 3200 从这样的机器中产生了少量的DNA,在经过大量的生物和化学处理后,最终成为疫苗瓶中的RNA。 RNA就像计算机的RAM一样,但是,RNA非常脆弱,所以,辉瑞的mRNA疫苗必须储存在最深处的深冷库里。 每个RNA字...