密码子优化(Codon optimization)
密码子优化(Codon optimization)
在蛋白质合成过程中,密码子扮演着将基因信息翻译为蛋白序列信息的重要角色。不同的物种翻译同样一个氨基酸可能使用不同的密码子,并且因物种不同而带有密码子偏好性。尽管目前尚未得知密码子偏好性的自然形成的原因,但是这种现象对于蛋白表达效率的影响是显著的。对于重组蛋白表达,为获得最佳表达效果,通常需要根据物种的密码子偏好性进行序列优化。特别是使用异源性的蛋白质表达系统时,由于来源于另一物种的目的基因需要在自然条件下不表达该基因的宿主中进行重组蛋白表达,这种优化因此显得更为重要。除此以外,密码子优化还具有其它应用,比如通过优化CG含量和重复序列区域以改善DNA克隆效率。密码子优化还应用在改善mRNA稳定性,增强转录和翻译效率等方面。
载体家密码子优化工具专为在特定物种中的目的基因表达而设计,并提供在特定物种中目的基因的最佳密码子适应指数(Codon Adaptation Index,CAI)。该工具包含一个全面的物种列表,同时无缝衔接我们的线上载体设计平台,有助您在设计载体时即可完成密码子优化。此外,该工具还提供不同的内切酶选项以规避优化后可能产生的酶切位点。我们的密码子优化工具还可以对高GC含量和简单重复序列等问题进行优化,最大程度满足基因合成和DNA克隆等应用需求。
以下各图展现了我们的密码子优化工具的多个功能。
根据物种类型优化密码子序列
图1展示了对粉纹夜蛾(Trichoplusia ni)的piggyBac转座酶的密码子人源化优化的结果。最终的优化序列的CAI值为0.93,优化前该值为0.63。某个物种对应的CAI值量化的是该物种中高表达的基因所偏向使用的密码子类型的频率。CAI值范围为0至1。目的基因的高CAI值意味着在该物种可以被更有效表达。
图1 使用载体密码子优化工具针对特定物种优化的基因序列
针对高GC含量序列进行优化
图2展示了小鼠Hoxa4基因的GC含量优化结果。使用我们的密码子优化过工具后,Hoxa4基因的GC含量从69.3%降至59.5%。对于基因克隆时需要合成的基因序列,最佳的GC含量应在60%左右,以增加基因合成成功的机率。
图2 使用载体家密码子优化工具降低高GC含量
针对重复序列区域进行优化
图3展示了人免疫球蛋白序列自我比对的点阵图(Dot plot)。优化前点阵图中显著的对角斜线表明该基因包含大量的重复序列区域。优化后的点阵图中对角线图案消减,表明重复序列大为减少。
图3 使用载体家密码子优化工具减少重复序列区域
蛋白质生产
为了生产蛋白质,细胞必须首先翻译相关的mRNA链。转录后,mRNA离开细胞核,其中每个由三个核苷酸组成的组与携带氨基酸的tRNA分子相匹配(图1A)。这些由三个核苷酸组成的组称为密码子,每个密码子对应一个氨基酸。由于只有20种氨基酸,而可能的核苷酸组合要多得多,因此这种代码存在冗余(图1B)。
图1. 通过转录和翻译(A)形成蛋白质的密码子。每个密码子对应一个氨基酸或方向(开始/停止)。
密码子偏好性
虽然每个氨基酸有多种选择,但它们的使用不是基于偶然。这是因为每个物种都表现出密码子偏好性,即倾向于使用特定密码子来制造氨基酸。例如,丙氨酸(Ala)由GCU、GCC、GCA和GCG编码(图1B),但在人类中,GCC大约40%的时间被使用。不同生物体有不同的密码子偏好,这会影响RNA处理,从而影响蛋白质折叠和功能。这在将一个基因表达在另一个生物体中时(即异源基因表达)造成了复杂性。
密码子适应指数(CAI)是衡量给定密码子与生物体偏好的匹配程度的指标,范围从0到1。CAI为1表示所有氨基酸都反映了该生物体中最常用的密码子。我们的密码子优化工具提供了一个平衡最优CAI与其他可能影响分子实验的因素的序列。
提高克隆效率
密码子优化还可以通过序列中核苷酸的分布来帮助提高克隆效率。GC含量是设计和故障排除实验时需要考虑的重要变量。如果GC含量过高或过低,都会影响查询序列的稳定性。我们的GC含量计算器工具允许对整个序列和序列段进行独立的GC分析。然而,我们的密码子优化工具将这种分析整合起来,通过寻找同义密码子来优化这一变量,以增加或减少所需的GC含量。
此外,具有高重复频率的序列由于缺乏独特的引物结合位点,可能会在克隆工作中造成困难,而具有限制酶识别位点的序列可能在实验设计中带来挑战。使用我们的密码子优化工具可以同时优化这些因素与密码子偏好性,提供一个最有可能在您的系统中高效产生蛋白质的序列。
- 支持GenBank和FASTA格式的序列识别。
- 可以输入DNA/RNA序列或蛋白质序列。
- DNA/RNA序列必须以起始密码子ATG开头,并且必须是3的倍数以完成完整的密码子序列。