链接:https://bioxtas-raw.readthedocs.io/en/latest/saxs/saxs_mw.html。
这是RAW-BioSAXS教程的第二篇,本教程涵盖了根据SAXS数据计算分子量的基本原理和操作。
概述
有许多方法可以根据SAXS数据计算分子量。RAW程序支持四种最常用的方法:
Ø 利用绝对强度I(0)计算分子量[1]。
Ø 通过与参考标准进行比较计算分子量[1]。
Ø 利用Porod参数计算分子量[2]。
Ø 利用体积相关性计算分子量与[3]。
ATSAS软件还支持两种其他方法,如果安装了ATSAS,RAW将显示这些方法:
Ø 通过将散射与已知结构进行比较来估算分子量[4]。
Ø 通过贝叶斯推论从其他分子量方法计算分子量[5]。
所有这些方法都有优缺点,要使用和信任哪一种方法在一定程度上取决于数据的详细信息。无论如何,计算分子量对于验证样品的低聚状态很重要。
为什么要计算分子量?
SAXS分子量计算并非十分准确,通常的经验法则是不确定性约为10%(或更高)。因此,不应使用SAXS来确定样品的分子量,诸如多角度光散射(MALS)之类的方法更加准确。根据SAXS数据计算分子量的主要原因是要确定溶液中蛋白质的低聚状态。特别是如果正在研究可以形成同二聚体或更高阶低聚物的系统,则SAXS分子量计算应足够准确,以表明要测量的低聚物状态。因此,分子量是一种重要的诊断方法,可用于验证溶液中的成分。
如何计算分子量?
因为有很多方法可以根据SAXS数据计算分子量,所以这里仅列出上面提到的方法的简短摘要。一般而言,这些方法可分为两类:浓度依赖型和浓度无关型。依赖于浓度的方法需要知道SAXS池中样品的浓度,这通常意味着它们与SEC-SAXS测量不兼容。浓度无关的方法不需要了解浓度,因此对于SEC-SAXS测量非常有用。
通过绝对强度I(0)计算分子量
SAXS数据通常置于绝对比例上,因此强度值具有单位(通常为cm-1)。这意味着I(0)值可以直接与样品中的电子数量、样品的浓度和对比度相关[6]。如果已知样品的浓度和对比度,则可以计算电子总数,然后将其用于确定样品的分子量。这种方法的准确性可以通过测量或计算蛋白质微分比容(例如,使用MULCh)来提高。如有必要,调整样品和缓冲液的电子密度也会提高准确性。分子量计算公式如下:
其中MW是分子量,c是浓度,NA是阿伏伽德罗常数,ΔρM是单位质量的散射对比度。
在文献[1]中评估了此方法的准确性,发现大多数蛋白质的误差均<〜10%。
通过与标准品比较计算的分子量
零角处的散射I(0)与大分子的分子量、溶液中大分子的浓度和对比度成正比。如果测量了已知分子量和浓度的参比样品,则可用于校准具有已知浓度(假设参比样品与样品的对比度一致)的任何其他散射曲线的分子量[1]。分子量计算如下:
其中MW是分子量,c是浓度,下标m和st分别表示目标大分子和标准品的量。
利用波罗德(Porod)体积计算分子量
Porod体积名义上是大分子在溶液中的排除体积。可以直接从散射曲线计算得出,首先计算Porod不变量:
其中Qp是Porod不变量。然后计算Porod体积为:
其中I(0)是零角度的散射。一旦确定了体积,就可以通过简单地乘以大分子的密度来确定分子量。
由于Qp由0到∞的积分确定,因此实际积分必须以某种方式近似。有多种方法,包括在ATSAS datmw程序中实现的“Porod”和“ Qp”方法。RAW使用文献[2]中所述的SAXSMoW 2方法,该方法根据散射曲线中可用的数据范围将校正因子应用于Porod体积。然后,将平均蛋白质密度用于计算分子量。如果已知大分子更精确的密度,则可以提高该方法的准确性。
在文献[2]中,他们发现球蛋白的分子量计算中值不确定度为12%。相比之下,在[5]中,他们使用大量的模拟曲线测试集发现该方法的分子量中值高3%,而该方法的中值绝对偏差为5%。具有模拟噪声的数据的不确定性较高。尽管存在异常值,但对于大多数系统而言,分子量不确定性约为10%,这似乎是合理的。
从相关体积计算分子量
在文献[3]中,他们将相关体积定义为:
他们凭经验发现比率Vc2/ Rg与分子量成对数比例,公式如下:
其中c和k是根据理论散射曲线的拟合结果凭经验确定的常数。他们发现蛋白质和RNA的常数不同。对于蛋白质,c = 0.1231和k = 1,而对于RNA,c = 0.00934 和k= 0.808(注意:c和k在原始论文中定义略有不同)。
在[3]中,他们发现,分子量分布的理论不确定性约为理论值的5%,而实验分布的不确定性约为10%。相比之下,在[5]中,他们使用大量的模拟曲线测试集发现该方法的分子量中值低2%,而该方法的中值绝对偏差为7%。具有模拟噪声的数据的不确定性较高。可以合理地说,对于大多数系统,分子量的不确定性约为10%,尽管存在异常值。
与已知结构比较确定分子量
文献[4]描述了一种机器学习方法,该方法基于与PDB中已知结构数据比较,将SAXS数据分为形状类别。通过找到形状和尺寸最接近的结构(方法名称:Shape&Size),就可以获得样品分子量的估计值。
在[4]中,他们发现,对于用于测试的理论散射曲线,该方法计算的分子量在90%的测试数据的预期值的10%范围内。在[5]中,他们发现对于测试数据集,分子量中值是正确的,中值绝对偏差是4%。同样,可以合理地说,对于大多数系统,此方法的分子量不确定性约为10%,尽管存在异常值。
贝叶斯方法推断分子量
文献[5]描述了一种利用贝叶斯推论来计算分子量的方法,该方法是根据Porod体积,相关体积以及与已知结构方法的比较来计算分子量。本质上,它需要一个庞大的理论散射曲线测试数据集,使用每种方法计算每种分子的分子量,然后为每种方法创建概率分布,以描述在给定真实分子量的情况下获得特定计算分子量的概率。将所有方法中的概率结合在一起,从而估算出最可能的分子量。
他们发现,对于所使用的理论散射曲线,此方法的分子量中值准确,中值绝对偏差为4%。总体而言,他们报告说它比任何一种单独的方法都更准确。可能是此方法的不确定性~5%通常比其他方法的10%小。
不同分子量计算方法的优缺点是什么?
每种方法都有各自的优缺点,并且对于某些类型的数据而言往往会更好。每种方法都需要对I(0)进行良好的测定,而所有与浓度无关的方法都需要Rg,这通常意味着在所有情况下都需要良好的吉尼尔拟合。同样,文献[5]指出所有与浓度无关的方法都不太适用于平面和环状蛋白质。
通过绝对强度I(0)计算分子量
优点:
1、当所有参数已知时,可以非常准确。
2、具有正确的参数时可用于蛋白质或RNA/DNA。
缺点:
1、需要准确的样品浓度。
2、需要精确的绝对强度。
3、最好大分子的散射对比度已知。
4、最好知道微分比容。
通过与标准品比较计算的分子量
优点:
1、对于相同条件下的相似标准品和样品,可以非常准确。
2、具有正确的标准品可用于蛋白质或RNA/DNA。
缺点:
1、需要准确的样品浓度。
2、参考标准品应具有与样品相同的散射对比度(即在相似的缓冲液中)。
3、标准品和样品应具有相似的形状(即相同的微分比容)。
利用波罗德(Porod)体积计算分子量
MoW方法请参考文献[2]。
优点:
1、适用于大多数分子形状[5]。
2、当数据的信噪比合理时,比相关体积方法更准确[5]。
缺点:
1、当大分子具有柔性或在溶液中延展时,应该小心(尽管[5]发现情况并非总是如此)。
2、在某些情况下可能需要调整蛋白质密度(默认值:0.83 kDa / nm3),如果大分子不是蛋白质,则会失败。
3、对缓冲液扣减敏感。
从相关体积计算分子量
优点:
1、当信噪比较低时,比其他方法更准确[5]。
2、有扣减有误差时,比其他方法更准确[5]。
3、对于柔性或延展的大分子应准确[3](尽管[5]发现并非总是如此)。
4、适用于蛋白质和RNA/DNA。
缺点:
1、对于高信噪比数据,其准确性不及其他方法[5]。
2、对于延展大分子,其准确性不如Porod体积MoW方法[5]。
3、小于15-20 kDa的大分子具有较大的不确定性(根据经验,以及经验系数是从20 kDa及更大的尺寸范围生成的事实)。
4、对于蛋白质核酸复合物无效。
5、qI(q)的积分必须收敛(请参见下图)。
两个图都显示了qI(q)的积分与q的关系。左图显示积分值收敛的数据,即,随着q的增加,积分值在高q处基本不变。右边的图显示了积分值尚未收敛的数据,即,随着q的增加,积分值在高q时增加。右边的数据无法通过相关体积方法,给出准确的分子量。
与已知结构比较确定分子量
优点:
1、除低信噪比数据外,最准确的独立于浓度的方法[5]。
2、存在扣减错误时相对准确。
缺点:
1、对于柔性系统没有结果。
2、仅适用于蛋白质。
贝叶斯方法推断分子量
优点:在大多数情况下,比单独的与浓度无关的方法更准确[5]。
缺点:
1、遇到大的扣减错误不适用。
2、仅适用于蛋白质。。
常见问题
无法从SAXS数据中获得预期的分子量,该怎么办?
来自良好SAXS数据的分子量具有相对较大的不确定性(通常~10%),对于低信噪比数据可能会严重恶化。如果出现错误,需要采取的措施取决于要确定的内容。
如果确定样品在溶液中是稳定的(不易于聚集/降解),或者有证据表明样品全部处于一种状态(例如,SEC-SAXS实验中的一个尖锐的洗脱峰),如果您的分子量有一点偏差是没关系的。在这种情况下,如果只是试图确定样品的低聚状态。能清楚地区分,那就可以;不能,则需要使用其他方法测量分子量。
如果样品在溶液中不稳定(易于聚集/降解),则需要使用另一种方法测量样品的分子量。好的方法包括多角度光散射(MALS)或分析超离心(AUC)。最好的方法是进行SEC-MALS-SAXS实验,在与SAXS数据相同的洗脱液中收集MALS数据,从而消除有关样品在MALS和SAXS测量之间的变化问题。
需要确定“小分子”是否绑定到“大分子”,或者想确定结合化学计量,可以用SAXS做到吗?
这在一定程度上取决于分子的相对大小。但是,如果“小分子”物体很小,例如~20 kDa,而“大分子”物体很大,例如~250 kDa,则SAXS数据不太可能可靠地确定绑定和未绑定之间的差异(250 kDa或270 kDa),或 1:1和2:1结合(270 kDa或290 kDa)。在这种情况下,应该进行分子量的其他表征。最好的方法是进行SEC-MALS-SAXS实验,在该实验中以与SAXS数据相同的洗脱液收集MALS数据。
参考文献
1. Mylonas, E. & Svergun, D. I. (2007). J. Appl. Crystallogr. 40, s245–s249. DOI: 10.1107/S002188980700252X
2. Piiadov, V., de Araújo, E. A., Oliveira Neto, M., Craievich, A. F. & Polikarpov, I. (2018). Protein Sci. 2–22. DOI: 10.1002/pro.3528
3. Rambo, R. P. & Tainer, J. A. (2013). Nature. 496, 477–481. DOI: 10.1038/nature12070
4. Franke, D., Jeffries, C. M. & Svergun, D. I. (2018). Biophys. J. 114, 2485–2492. DOI: 10.1016/j.bpj.2018.04.018
5. Hajizadeh, N. R., Franke, D., Jeffries, C. M. & Svergun, D. I. (2018). Sci. Rep. 8, 7204. DOI: 10.1038/s41598-018-25355-2
6. Orthaber, D., Bergmann, A. & Glatter, O. (2000). J. Appl. Crystallogr. 33, 218–225. DOI: 10.1107/S0021889899015216