博文

目前显示的是 一月, 2021的博文

一针辉瑞疫苗,其实是2万亿段代码:程序员逆向重建mRNA源代码

图片
  从辉瑞疫苗被批准以后,它就被置于世界的聚光灯下。近日,一位程序员从计算机科学的角度,对辉瑞疫苗的设计进行了‘逆向工程’,文章引起不小的反响,从信头 (Header)、元数据(Metadata),到帮助伪装躲过人体免疫系统防火墙的 Ψ 分子,一支疫苗有2万亿段重复的代码,我们看到了计算机与生物学那颇为神秘的联系。   辉瑞疫苗,逆向工程?   听起来有些不可思议,但一位程序员从计算机科学的角度深度剖析了Biotech/辉瑞的mRNA新冠疫苗BNT162b设计,并撰写了这篇文章—— Biotech/辉瑞SARS-CoV-2疫苗的源代码的反向工程(Reverse Engineering the source code of the BioNTech/Pfizer SARS-CoV-2 Vaccine)。(以下简称辉瑞疫苗)   读过后,你或许会开始会让你对生命和计算机世界产生奇妙的联系。    简单的生物学背景   让我们先来回顾一下生物学知识,这里,我们将透过程序员的眼睛看待生命编码。   DNA和程序的种种相似的地方,但与计算机使用0和1不同,生命使用A、C、G和U/T来编码。   在自然界中,A、C、G和U/T都是分子,以链的形式储存在DNA(或RNA)中。   在计算机中,我们把8位编入一个字节,字节是处理数据的典型单位。   自然界将3个核苷酸组合成一个密码子,而这个密码子是典型的处理单元。   密码子包含6位信息 (每个DNA字符2位,3字符= 6位,这意味着2⁶ = 64种不同密码子值) 。   其次,疫苗是一种液体,我们该如何谈论源代码?    源代码!   让我们从疫苗的一小部分源代码开始,下图为世界卫生组织公布的BNT162b前500个字符。   mRNA新冠疫苗BNT162b的核心就是这个数字代码。它有4284个字符长,在疫苗生产过程的最开始,将这段代码上传到DNA打印机,然后打印机将磁盘上的字节转换成实际的DNA分子。 DNA打印机,型号BioXp 3200   从这样的机器中产生了少量的DNA,在经过大量的生物和化学处理后,最终成为疫苗瓶中的RNA。   RNA就像计算机的RAM一样,但是,RNA非常脆弱,所以,辉瑞的mRNA疫苗必须储存在最深处的深冷库里。   每个RNA字符的重量为 0.5