摘要:密码子优化是基因表达优化的关键步骤之一。其中涉及 mRNA 二级结构、稀有密码子、核糖体结合位点等关键因素。简单说,基因能否顺利表达蛋白与稀有密码子含量、mRNA 结构是否阻碍翻译有很大关系。德泰开发的生物信息学软MaxCodonTM 经过近千个项目实践的优化,可以几乎完美地优化这些关键因素,为蛋白表达提供坚实基础。基因表达优化还包括载体,表达系统特异性,表达条件优化。
密码子优化
密码子优化涉及的优化点可以从基因合成、载体构建、基因转录、mRNA 翻译、翻译后修饰等过程中提取,目的只有一个,就是便于相关过程的高效达成。以下是部分优化内容:
特定功能的Motif
许多 motif 在基因表达过程中承担着重要的角色,随着研究的不断开展,功能性 motif 也在不断被发现,我们会将其不断地添加到南京德泰生物的密码子优化工具中。举例如下:
TATA 框:是构成真核生物的启动子元件之一,位于转录起始点上游-30bp 处,它可以保证转录的正确定位。
SD 序列: 作为原核表达的核糖体绑定位点,是翻译必不可少的信号。
Kozak 序列:真核生物中符合 Kozak 规则的基因,其转录及翻译效率较好。
Chi 序列:在原核生物中能够增加自然重组的几率,可能会影响人工重组蛋白的表达。
隐蔽剪切位点:真核生物中存在大量的隐蔽剪切位点(cryptic splice sites),一旦被激活,会造成 mRNA 的剪接偏离我们的预期。
仔细研究转录、翻译的过程,并不断阅读基础资料及最新研究进展,不断搜集相关的 motif 模式,我们南京德泰生物在不断完善密码子优化算法。在载体设计上,我们要通盘考虑。当然,部分 motif 已经固化到了商业载体上了。
重复序列
重复序列过多,会增加基因合成的难度。反向互补序列也对 mRNA 二级结构有重要影响。
GC 含 量
相对于 AT 配对需要 2 个氢键,GC 配对是 3 个氢键,GC 含量直接影响着 PCR 退火温度。在启动子等保守区域 GC 含量相对较高。GC 含量也影响着 mRNA 热力学稳定性及 mRNA 二级结构。
mRNA 二级结构
mRNA 二级结构是影响翻译过程的重要因素,复杂稳定的二级结构会阻碍翻译过程的顺利进行,特别是核糖体绑定位点(RBS) 附近的二级结构。mRNA 的二级结构预测是一个复杂的过程,需要考虑碱基配对、自由能等多种因素,南京德泰生物的密码子优化系统可以快速有效识别发卡(Hairpin)结构区并进行有效规避。
密码子偏好性
不同物种的种属之间,对同义密码子的使用频率是不同的。在外源基因的同义密码子使用频率与表达宿主相匹配的 情况下,外源基因的表达水平会显著提高。常用密码子适应指数(Codon Adaption Index)来表示。
限制性酶切位点
限制性酶切位点需要根据实际情况进行排除,以免与需要用到的酶切位点产生冲突,影响重组基因的操作。