对“充分统计量与不足解释”的回应：使用你的信息

让-保罗·福克斯

简介

van Breukelen (2019) 的反应中声称，总分是潜特质参数

(θ_{i j}

在时间点

j

的第

i

个人的充分统计量。论证指出，如果以总分作为充分统计量，估计的组间方差不会偏倚，而估计的组内方差则会受到测量误差方差项的污染。我们同意，当总分是充分统计量时，导致相同总分的不同项目反应模式变得无关紧要。然而，我们可以证明，在纵向 IRT 模型（即使用 IRT 测量的纵向潜变量的潜增长模型）中，总分不是潜特质参数的充分统计量。

首先，我们证明了在考虑总分作为充分统计量时，数据中关于

θ_{i j}

的额外信息被忽略了，因此总分不是充分统计量。其次，我们证明了当使用总分作为结果变量而不是项目反应数据时，估计的方差分量（组内和组间）受到了未解释的误差方差的污染。这支持了我们论文的结论。

^{1}

假设项目反应在给定潜在特质时条件独立分布（如在 Rasch 模型中），积分分数是潜在特质参数的充分统计量是一个常见的错误。只有当数据不提供关于潜在特质的额外信息时，这种假设才是正确的。纵向数据包括重复测量，在每次测量时测量潜在特质，并假设纵向潜在特质的潜在增长模型。这个潜在增长模型定义了潜在特质参数的分布。由于这种分布，同一被试在不同测量时间点的数据对每次测量的潜在特质都是相关的。因为其他测量时间点的数据提供了关于每次测量的潜在特质的信息，所以积分分数不是充分统计量。

额外信息对潜在特质的影响可以通过考虑给定数据的后验期望值

θ_{i j}

来容易地说明。考虑人员

Z_{i j k}

的量化项目反应

i

、测量

j

和项目

k

，假设

Z_{i j k}

正态分布，并且我们假设潜在特质参数存在线性趋势。

\begin{matrix} Z_{i j k} = θ_{i j} - b_{k} + e_{i j k}, e_{i j k} \sim N (0, 1) \\ θ_{i j} = β_{0 i} + β_{1 i} t_{i j} + r_{i j}, r_{i j} \sim N (0, σ^{2}) \end{matrix}

与 van Breukelen 的线性模型（方程(3)）相比，误差分布被简化了，但我们的复杂性足以证明我们的观点。

θ_{i j}

的后验期望值如下（遵循 Gorter 等人上方的方程(10)的推导）：

^{1}

E (θ_{i j} ∣ Z_{i j}, b, β_{i}, σ^{2}) = (\frac{K}{K + σ^{- 2}}) (\overset{―}{Z_{i j} + b}) + (\frac{σ^{- 2}}{K + σ^{- 2}}) (β_{0 i} + β_{1 i} t_{i j})

来自时机

j

的数据信息由均值

\sum_{k = 1}^{K} (Z_{i j k} + b_{k}) / K = \overset{―}{Z_{i j} + b}

表示，剩余的信息来自于线性趋势。当项目数量

K

相对于精度

σ^{- 2}

增加时，后验均值会向均值

\overset{―}{Z_{i j} + b}

收缩。当精度相对于

K

增加时，后验均值会向线性趋势预测收缩。这个后验均值估计器基于借用强度原则，其中利用了其他测量时机的数据信息来改善均方误差方面的估计器。因此，潜在增长分布的潜在特质参数连接了不同测量时机相关的参数，使得可以应用借用强度原则。在潜在增长建模中，总分不应作为充分统计量使用；因为它忽略了其他测量时机的数据信息，不是一个潜在特质参数的次优估计器。

这种增益是通过同时使用 MCMC 估计所有参数实现的，这有助于平衡不同测量时机的数据信息。潜在增长参数和难度参数是从后验分布中使用所有数据进行采样，并结合特定时机的数据信息。因此，当潜在增长参数从条件分布中采样（Gorter 等人附录 1 中的步骤 3b

^{1}

）时，难度参数从其条件分布中采样（Gorter 等人附录 1 中的步骤 1c

^{1}

），然后使用采样的潜在增长和项目难度参数值更新后验均值。随后，从后验分布中采样潜在特质参数（Gorter 等人附录 1 中的步骤 1b

^{1}

）。在 MCMC 算法收敛后，潜在特质参数的采样值根据边际后验分布

p (θ_{i j} ∣ Z)

分布，该分布使用了所有数据信息。

将总分作为潜在增长模型分析中的充分统计量使用会影响方差分解。当不将总分作为充分统计量使用时，方差分解与 van Breukelen 描述的不同。van Breukelen 在潜在特质参数的水平上考虑协方差分量，主要是因为总分定义在这一水平上。然而，为了理解方差分解，我们需要将总平方和分割为测量内成分（SSW）、测量间（SSA，被试内）成分和被试间（SSB）成分。研究表明，每个平方和误差代表不同的方差分量，项目参数影响估计的测量误差方差。因此，估计的测量误差方差增加会导致测量内和被试间方差的减少，因为数据中的总方差（即总平方和误差）是固定的。

为了证明我们的观点，我们考虑一个平衡设计，包含

N

个受试者，

J

个测量时间点，和

K

个项目。对于平衡数据，可以通过将误差平方和设置为其期望值并求解方程来容易地估计方差分量。

^{2}

通过这种方法，我们检查哪些方差分量被估计以及这些估计值如何相互影响。为了减轻数学上的负担，我们仅包括潜在增长模型的随机截距。考虑以下模型：

\begin{aligned} Z_{i j k} = θ_{i j} - b_{k} + e_{i j k}, e_{i j k} \sim N (0, δ_{j k}^{2}) \\ θ_{i j} = β_{0 i} + r_{i j}, r_{i j} \sim N (0, σ^{2}), β_{0 i} \sim N (0, τ_{0}^{2}) \end{aligned}

误差平方和的表达式可以以闭式形式获得。每个误差平方和的期望值用于理解模型下的方差分解。根据数据的多级结构，总误差平方和被分割。

\begin{aligned} \sum_{i = 1}^{N} \sum_{j = 1}^{J} \sum_{k = 1}^{K} {(Z_{i j k} - \bar{Z})}^{2} = & \sum_{i = 1}^{N} \sum_{j = 1}^{J} \sum_{k = 1}^{K} {(Z_{i j k} - {\bar{Z}}_{i j} .)}^{2} + \sum_{i = 1}^{N} \sum_{j = 1}^{J} K {({\bar{Z}}_{i j .} - {\bar{Z}}_{i .})}^{2} \\ + \sum_{i = 1}^{N} J K {({\bar{Z}}_{i .} - \bar{Z})}^{2} = S S W + S S A + S S B \end{aligned}

其中

\bar{Z} = \sum_{i, j, k} Z_{i j k} / (N J K), {\bar{Z}}_{i . .} = \sum_{j, k} Z_{i j k} / (J K)

，和

{\bar{Z}}_{i j .} = \sum_{k} Z_{i j k} / K

。

S S W

表示响应模式中的平方误差之和。

SSW 的期望值被用来获得能够解释观测水平上方差的成分。通过将线性模型（方程（2））代入并取随机成分的期望值来得出期望值。因此，

\begin{aligned} E (S S W) & = \sum_{i = 1}^{N} \sum_{j = 1}^{J} \sum_{k = 1}^{K} E {((θ_{i j} - b_{k} + e_{i j k}) - (θ_{i j} - \bar{b} . - {\bar{e}}_{i j .}))}^{2} \\ = \sum_{i = 1}^{N} \sum_{j = 1}^{J} \sum_{k = 1}^{K} {(b_{k} - \bar{b} .)}^{2} + E {(e_{i j k} - {\bar{e}}_{i j .})}^{2} \\ = N J \sum_{k = 1}^{K} {(b_{k} - \bar{b} .)}^{2} + N \sum_{j = 1}^{J} \sum_{k = 1}^{K} (δ_{j k}^{2} + {\bar{δ}}_{j .}^{2} / K) \end{aligned}

我们假设误差是相互独立地分布的，二项式产品的内积为零，因为随机误差的期望值为零。项目难度参数被假设为固定不变。由此直接得出，在 SSW 中的未解释方差由于项目难度参数解释的方差而减少。当项目在项目难度上差异越大，由项目难度参数解释的方差就越多。这减少了由测量误差方差捕获的未解释方差的数量

δ_{j k}^{2}

。在 CTT 模型下这是不可能的，因为 CTT 模型不考虑项目难度差异。

SSA 表示组内方差的信息，

σ^{2}

。SSA 的期望值以类似的方式推导得出。

\begin{aligned} E (S S A) & = \sum_{i = 1}^{N} \sum_{j = 1}^{J} K E {((β_{0 i} + r_{i j} - {\bar{b}}_{.} + {\bar{e}}_{i j .}) - (β_{0 i} + {\bar{r}}_{i .} - {\bar{b}}_{.} + {\bar{e}}_{i . .}))}^{2} \\ = \sum_{i = 1}^{N} \sum_{j = 1}^{J} K (E {(r_{i j} - r_{i .})}^{2} + E {({\bar{e}}_{i j .} - {\bar{e}}_{i . .})}^{2}) \\ = N K (J - 1) σ^{2} + N \sum_{j} ({\bar{δ}}_{j .}^{2} + {\bar{δ}}_{. .}^{2} / J) \end{aligned}

对于观察到的 SSA，当不考虑平均测量误差方差时，估计的被试内方差

σ^{2}

会被污染。van Breukelen 也注意到了 CTT 中被试内方差估计中的这种偏差。然而，被试内方差估计中的这种污染包含更多的成分。在 CTT 中，解释的被试内方差

{(r_{i j} - r_{i .})}^{2}

低于 IRT，因为 CTT 忽略了导致相同总分的不同反应模式。因此，在 CTT 中，解释的被试内方差较低，未解释（测量误差）方差的减少也较少。CTT 忽略了项目难度的不同，这导致了更多的未解释（测量误差）方差。总之，CTT 中被试内方差的高估是由未解释的测量误差方差引起的，其中包括平均测量误差方差的污染。

最后，SSB 表示组间方差的信息，

τ_{0}^{2}

。SSB 的期望值由以下公式给出：

\begin{aligned} E (S S B) & = J K \sum_{i = 1}^{N} E {((β_{0 i} + {\bar{r}}_{i .} - {\bar{b}}_{.} + {\bar{e}}_{i . .}) - ({\bar{β}}_{0 .} + {\bar{r}}_{. .} - {\bar{b}}_{.} + {\bar{e}}_{. . .}))}^{2} \\ = J K \sum_{i = 1}^{N} \sum_{j = 1}^{J} E {(β_{0 i} - {\bar{β}}_{0 .})}^{2} + E {({\bar{r}}_{i .} - r_{. .})}^{2} + E {({\bar{e}}_{i . .} - {\bar{e}}_{. . .})}^{2} \\ = J K (N - 1) τ_{0}^{2} + K (N - 1) σ^{2} + (N - 1) {\bar{δ}}_{. .}^{2} \end{aligned}

荷兰特温特大学行为、管理与社会科学学院研究方法、测量与数据分析系，恩斯赫德

通讯作者：

Jean-Paul Fox，行为、管理与社会科学学院研究方法、测量与数据分析系，荷兰特温特大学，恩斯赫德，荷兰。

邮箱: j.p.fox@utwente.nl