企业管理

组织管理研究中应该如何使用控制变量?

2022-07-31 17:23:36  来源:企业管理  作者:中企检测认证网  浏览:121

1 引言

在组织与管理实证研究中,控制变量(Control Variable)是指研究者为了排除对研究结果的其他解释,提高统计检验力而使用的变量(Becker, 2005),也称额外变量(Nuisance Variable)或混淆变量(Confounding Variable)有效控制这些额外变量,不仅有助于提高研究的内部效度与外部效度,帮助研究者更准确地估计核心研究变量(以下简称核心变量,主要指前因变量与结果变量)之间的关系,还有助于排除研究结果的替代性解释(Becker, 2005; Becker et al., 2016; Breaugh, 2006. 2008; Meehl, 1971; Spector & Brannick, 2011; Spector, Zapf, Chen, & Frese, 2000; York, 2018)。正因如此,控制变量与核心变量同等重要(Becker, 2005)。

一般而言,实证研究设计中额外变量的常见控制方法有实验控制与统计控制(e.g., Atinc, Simmering, & Kroll, 2012; Becker, 2005)。采用实验控制方法在心理学研究中非常普遍。例如,Festinger 和 Carlsmith(1959)在研究认知失调时对被试隐瞒了真实的实验目的,即采用排除法(Elimination Method)控制了被试的主观预期对实验结果的影响,为了研究控制力对个体行为的影响,Langer 和 Rodin(1976)随机(Randomization)挑选了居住在同一养老院不同楼层的两组老人作为实验组和控制组,在探讨榜样对儿童模仿学习的影响时,为了控制被试先天的攻击性,Bandura, Ross 和Ross(1961)根据正式实验前被试攻击行为的等级评定结果对被试进行匹配(Matching Method))。在组织管理研究的实验研究中,上述实验控制方法也较为常见(梁健,樊景立,陈志俊,2018.p.125)。简言之,在实验研究中,控制发生在额外变量的影响产生之前(York, 2018)。受研究问题、研究伦理等限制,组织与管理研究者经常使用非实验设计开展研究(Scandura & Williams, 2000),例如通过问卷法收集数据。由于很难像实验研究一样对变量进行操纵和控制,研究者通常会采用层次回归分析(Hierarchical Regression Analysis)等统计方法移除与额外变量有关的变异,修正数据收集过程中的缺陷(Carlson & Wu, 2012),导致控制发生在额外变量的影响产生之后。

尽管在组织与管理的非实验研究中采用统计方法控制额外变量是十分普遍的现象,但是一些方法学者提醒,在研究中加入控制变量并不一定能让研究结论更可靠(Spector & Brannick, 2011)。排除因果联系外的其他解释是社会科学研究中比较经典的因果关系推论三准则之一(温忠麟, 2017)。实验研究能有效排除额外变量对核心变量之间的因果关系的影响, 从而做出因果推断; 但在相关研究中, 仅通过移除额外变量与前因变量的共同变异(Shared Variance)并不能达到相同的效果(Meehl, 1971)。再者,由于变量之间关系复杂,统计控制后的研究结果可能是模糊的, 甚至与假设相矛盾(Becker, 2005; Breaugh, 2008))。例如,在研究领导风格对员工主动性行为(Proactive Behavior)的影响时,研究者可能会习惯性地控制领导的性别、年龄、工作年限、受教育水平等人口统计学变量。然而,不包括这些人口统计学变量变异的领导在现实生活中并不存在,导致研究结果的外部效度令人怀疑。此外,加入不恰当的控制变量还会影响核心变量关系的显著性水平和效应量(Breaugh, 2008)。

目前,国外学者十分重视控制变量的合理使用 ,已经有很多研究者提出了组织与管理研究中合理使用控制变量的方法(e.g., Atinc et al., 2012; Becker, 2005; Becker et al., 2016; Carlson & Wu, 2012), 相关建议也已经加入Academy of Management Journal(AMJ) 和 Journal of Organizational Behavior(JOB)的审稿标准中(Bono & McNamara, 2011)。尽管如此,控制变量理论基础不足等问题依然存在。例如, Bernerth 和 Aquinis(2016) 回顾了 2003 至 2012 年发表在顶级管理学期刊上的 580 篇实证研究,发现 2003 年只有 5% 的研究为控制变量提供了充分的理论基础,2012 年这一数据为 3%, 情况并未改善。同样,本文选取了 2016 至 2018 年在四本管理学和心理学的权威中文期刊(《管理世界》、《南开管理评论》、《心理学报》、《心理科学》)上通过统计方法控制额外变量的 113 篇组织行为学实证研究,并对这 113 篇实证研究进行了初步分析(如表 1 所示)。尽管在这 113 篇研究中,只有 31% 的研究者没有为控制变量的使用提供依据,但是其中只有 3 篇研究是基于明确的理论依据来选择控制变量的,且在2018 年发表的研究中该数值为 0.在其他中文期刊中,不难看到控制变量要么完全“不用”, 要么被“误用”或“滥用”的现象。出现这种现象可能的原因是研究者把控制变量仅仅当作研究设计和数据分析中次要的部分,并且控制变量对研究结果的影响不容易被发现(Carlson & Wu, 2012)。总而言之,组织与管理领域的研究者并没有深刻认识到控制变量的重要性以及应该如何合理地使用控制变量。因此,本文将基于统计控制方法的基本原理,主要围绕控制变量的选择、分析与报告过程中存在的常见问题进行分析,最后从研究设计、数据收集与分析、研究结果报告三方面探讨合理使用控制变量的策略,希望引起国内学术期刊和研究者对这一问题的重视。

2 统计控制的基本原理

组织与管理研究者常常使用层次回归分析方法和结构方程模型(Structural Equation Modeling, SEM)分析数据。结构方程模型是由层次回归分析发展而来的,与层次回归分析在统计控制原理上并无实质差异,层次回归分析方法的统计控制相关问题在使用结构方程模型时同样可能存在,因此本文的分析将主要基于层次回归分析方法。在层次回归分析方法中,研究者经常在层次回归的第一层加入控制变量,第二层加入前因变量,再根据ΔR2估计没有被混淆的前因变量的效应,这已经成为了一种标准化操作模式(Breaugh, 2008; Spector & Brannick, 2011)。

首先需要明确统计学中的两个基本概念:偏相关(Partial Correlation)和半偏相关(Semi-partial Correlation)。如图1所示,偏相关是指同时从X和Y中移除Z与X、Y的共同变异(c + d + g)后, 剩余X(b + e)能够解释的剩余 Y(a + b)中的变异,偏相关系数的平方(即决定系数 R2)为 b/(a + b)。半偏相关是指单独移除Z与X的共同变异(c + g) 或单独移除 Z 与 Y 的共同变异(c + d) 后 X与 Y 的相关。研究者在层次回归分析中实际讨论的,是移除了Z与X的共同变异(c + g)后, 剩余X(b + e)能够解释的 Y(a + b + c + d)中的变异。移除了Z对X的影响后的半偏相关系数的平方为 b/(a + b+ c + d), 与研究者经常使用的ΔR2 等价(Breaugh, 2006)(有关偏相关和半偏相关的详细说明可见罗胜强和姜嬿(2014), pp.53-56)。使用统计方法对额外变量的影响进行控制后,研究者在假设检验中实际使用的前因变量 X 已经不再是原始的 X(b + c + e + g), 而是移除了前因变量X 和额外变量 Z 的共同变异(c+ g)后的剩余前因变量 X(b + e)。这一点对于理解统计控制相关问题非常重要。

在统计学上,共同变异无法被分割成来自不同变量的不同部分,只能作为被一系列变量解释的总体变异的一部分。随着前因变量和控制变量相关的提高,前因变量和控制变量能够分别解释的共同变异的大小会更加模糊,剩余前因变量的意义与假设中的原始前因变量所表达的意义差异也会更大(Becker et al., 2016))。统计控制可能会让参数估计的解释变得模棱两可,当研究者并不清楚统计控制的目的和原理时问题会更加明显(Becker et al., 2016))。需要指出的是 ,统计控制方法难以帮助研究者获得准确的因果关系推论。原因是在回归分析中,控制变量实际上作为前因变量参与运算。组织管理领域的研究者在开展研究时往往会使用多个控制变量。如果想要通过统计控制做出准确的 X 对 Y 的因果关系推断,必须保证所有可能影响 Y 的因素都在模型中,而这在非实验研究中是很难实现的(York, 2018)。

3 控制变量的应用问题

3.1 控制变量的选择问题

一些研究者提出,在分析中加入控制变量是一种更安全保守的统计方法(Carlson & Wu, 2012; Spector & Brannick, 2011)。但是,选择不恰当的控制变量不仅会影响不同数据分析结果的比较,还会降低研究结果的信度与效度(Aguinis & Vandenberg, 2014; Becker, 2005; Breaugh, 2006. 2008)。总结以往研究发现,控制变量的选择过程中主要存在缺乏理论基础、使用替代变量、过度控制与控制不足、同质化等问题。

3.1.1 缺乏理论基础

研究者一般将那些能够与研究目的匹配、具备坚实理论基础的控制变量称为具有理论意义的控制变 量(Conceptually Meaningful Control Variables, 以下简称有意义的控制变量)。选择有意义的控制变量非常重要,因为理论能够帮助研究者更清晰地理解控制变量在核心变量的关系中可能发挥的作用(Becker et al., 2016; Bernerth, Cole, Taylor, & Walker, 2018; Meehl, 1971; Spector & Brannick, 2011)。如果没有坚实的理论为控制变量的选择提供指导,研究者可能就无法判断应该加入哪些控制变量(Becker, 2005;Breaugh, 2006)。

尽管选择有理论意义的控制变量十分重要,但很多研究者仍然不重视这个问题。例如,2003 至 2012年发表在 5 本顶级管理期刊上的 580 篇文章一共使用了 3500 多个控制变量,但每年为控制变量提供了充分理论基础的研究比例最高不超过 9%(Bernerth& Aquinis, 2016); 张军伟和龙立荣(2017. p.184)在探讨组织层次、部门层次与员工感知的高绩效工作系统的一致性时,以“HR 经理的任职年限越长可能对组织的高绩效工作系统更为了解”为由控制了 HR 经理的任期,而不是基于理论。一些研究者常常默认控制变量与核心变量相关,却不解释这种关系为什么可能存在(Atinc et al., 2012; Carlson & Wu, 2012; Spector & Brannick, 2011)。

3.1.2 使用替代变量

替代变量是指那些用来代替有意义控制变量的变量(Proxies, 以下简称替代变量)(Becker, 2005; Breaugh, 2008; Carlson & Wu, 2012; Spector & Brannick, 2011)。常见的替代变量主要有性别、年龄、组织规模等人口统计学变量与组织特征变量。Bernerth 等(2018) 对 2003 至 2014 年发表在 10 本顶级期刊上的关于领导力的实证研究进行分析后发现, 人口统计学变量(例如年龄和性别)和工作任期相关变量作为控制变量的平均使用频率超过了 57%。除了常见的人口统计学变量外,还有一些其他替代变量。例如,Becker 等(2016)发现研究者可能会为了控制员工的冲动性(Impulsivity)而将过往工作数量作为替代变量,理由是更冲动的人往往会更频繁地更换工作。但是,大多数情况下人们改变工作的原因不是冲动,使用该替代变量并不合理。

之所以出现频繁使用替代变量的问题,可能是因为选择控制变量时理论依据不足,也可能是因为替代变量的测量比有意义控制变量的测量容易得多(Becker et al., 2016; Bernerth et al., 2018; Bernerth & Aguinis, 2016; Breaugh, 2006)。事实上,很多时候替代变量确实与结果变量存在显著相关,但由于多数替代变量都不具备理论基础,研究者无法基于理论解释替代变量与结果变量之间的关系,也就无法基于替代变量来解释核心变量之间的关系。在无法明确替代变量理论基础的前提下,控制替代变量的同时可能会无意间移除有效的变异(Becker et al., 2016; Bernerth et al., 2018; Breaugh, 2008)。

3.1.3 过度控制与控制不足

围绕控制变量的数量问题,目前学界存在两种相反的观点:其一是“控制变量越多越好”(e.g., Antonakis, Bendahan, Jacquart, & Lalive, 2010); 其二是“少即是多”(Less is more)(e.g., Carlson & Wu, 2012; Spector & Brannick, 2011)。研究者需要充分认识到,重要的是控制变量的质量,而非数量。

认为“控制变量越多越好”的研究者认为,忽略重要的控制变量会得到错误的模型(Antonakis et al., 2010))。然而,只有当研究模型中包含所有的额外变量时才能准确估计核心变量的关系,这在非实验研究中几乎不可能实现(Spector & Brannick, 2011; York, 2018)。如果无法明确变量之间的因果关系,控制变量就无法净化核心变量的关系,这与控制变量的数量无关。例如,Spector 等(2000)提出了六种机制解释为什么消极情绪(Negative Effect)可能与工作压力相关,借此论述在压力研究中将消极情绪作为控制变量是存在问题的。控制变量的数量越多,问题可能越严重(Becker, 2005)。

更多的研究者相信“少就是多”, 但这并不意味着控制变量毫无益处或不必控制。加入有理论意义的控制变量在一定程度上有助于研究者在非实验研究中做出因果推断(Bernerth et al., 2018))。虽然研究者使用的控制变量数量非常庞大,但正如一些审稿专家所言 ,“由于控制变量的选择没有充分的理论背景,研究者可能没有控制那些能够解释核心变量之间的关系的内在因素”(Green, Tonidandel, & Cortina, 2016. p.12))。

3.1.4 同质化

在组织与管理研究中,虽然不同研究领域存在明显的理论差异, 但常用的控制变量却非常相似,即控制变量的使用存在同质化问题。例如, Bernerth 和Aguinis(2016)对 2003 至 2012 年发表在 5 本管理学期刊上十个最受欢迎研究领域的 580 篇实证研究进行分析后发现,常见的控制变量(例如年龄、性别、工作任期、受教育水平、种族)在理论基础不同的研究领域使用频率却没有明显的差异。

之所以会出现过于同质化的问题,本文认为原因可能主要有如下两点:其一,模仿前人研究。例如,本文对2016 年至2018 年间发表的113 篇实证研究(见表 1)进行分析后发现,虽然有 78 篇研究为控制变量的选择提供了依据,但有 16 篇都以“参考以往研究”作为选择控制变量的标准。这样做并没有充分考虑控制变量在核心变量的关系中可能发挥的作用(Aguinis & Vandenberg, 2014; Meehl, 1971; Spector & Brannich, 2011)。其二,让审稿专家满意。为了顺利发表,研究者可能会查阅前人的研究并推测审稿专家希望看到哪些控制变量(Atinc et al., 2012)。这样的想法同样是不合理的,因为加入没有理论基础的控制变量而被拒稿的概率高达 80%(Green et al., 2016)。严谨的审稿专家也希望研究者为控制变量提供充分的理论依据,以保障研究的科学性和严谨性。

3.2 控制变量的分析问题

对于很多研究者来说,统计控制方法能够帮助研究者更准确地分析核心变量之间的关系,Spector 和Brannick(2011)称之为“净化原则(Purification Principle)”。然而 “, 净化原则”在绝大多数情况下是不成立的(Spector & Brannick, 2011)。概括而言,控制变量的分析过程中主要存在忽略了控制变量的作用、控制变量模糊了核心变量的关系、与核心变量的相关过高或过低、基于剩余变异的分析不当、研究假设中未加入控制变量、没有比较不同的假设检验结果等。

3.2.1 忽略了控制变量的作用

在相关研究中,研究者所感兴趣的某个变量究竟是前因变量、结果变量、中介变量、调节变量还是控制变量,只能基于研究假设背后的理论做出判断。如果控制变量的选择并非基于严格的理论框架,或者并非基于综合考虑多方面论据的符合逻辑的推导,研究者就很容易忽略他所认为的控制变量真正发挥的作用(Aguinis & Vandenberg, 2014; MacKinnon, Krull, & Lockwood, 2000; Spector & Brannick, 2011)。例如,Becker 等(2016)就曾经引用过以下案例。在探讨领导者的整体思维(Holistic Thinking)对领导行为的影响时,研究者将成为领导者后的工作经验作为控制变量; 然而, 领导经验可能会调节整体思维与领导行为之间的关系, 随着领导经验的增加,领导者的行为逐渐自动化,对积极思维模式的依赖可能会逐渐减少, 因此领导经验越少,整体思维和领导行为的相关可能越强。如果一个研究者所认为的控制变量实际上是模型中的核心变量,控制这些变异就会带来误差(Becker, 2005)。

3.2.2 控制变量模糊了核心变量的关系

与“净化原则”相反,在有些情况下控制变量不仅会导致假设与分析不匹配,令研究者无法准确地解释研究结果,甚至还可能出现控制变量解释的变异超过前因变量的情况(Atinc et al., 2012; Spector & Brannick, 2011)。根据控制变量影响的是核心变量的测量过程还是潜在构念(Underlying Construct), 控制变量对核心变量关系的影响可以分为污染(Contamination)和虚假因果关系(Spuriousness)(Spector & Brannick, 2011)。

如果控制变量只影响核心变量的测量过程,就会产生“污染”问题。例如,在探讨组织承诺(Organizational Commitment)和主动性行为的关系时,研究者可能会因为社会赞许性而控制主管支持(Perceived SupervISOr Support),因为知觉到的主管支持(Z)可能会影响组织承诺(X)和主动性行为(Y)的测量(如图 2 所示)。根据污染物分别影响 X 和Y 还是同时影响 X 和 Y, 计算相应的半偏相关或偏相关系数就能排除污染。然而,控制变量不仅会影响核心变量的测量过程,还可能会影响核心变量的潜在构念(Carlson & Wu, 2012)。因此,尽管确定合适的控制变量就能够通过统计控制方法排除污染的影响, 但这在实际研究中是非常困难的。

当研究者所认为的控制变量事实上是核心变量共同的前因变量时,可能会出现“虚假因果关系”(Spector & Brannick, 2011)(如图 3 所示)。例如,在研究知觉到的主管支持(X)对员工绩效(Y)的影响时,如果二者的相关只是因为主管的主观意愿产生的绩效评估结果宽大,知觉到的主管支持和员工绩效的相关就是虚假的。这是因为绩效评估结果宽大被员工知觉为与主管关系良好的正向反馈(陈丽芬, 王霖,2017), 员工绩效考核又是由主管完成的,即它们都是绩效考核宽大效应(Z)的结果变量,这时将绩效考核宽大效应作为控制变量就是不合适的。由于中介效应检验和统计控制在统计原理上是不存在实质性差异的,仅仅通过统计方法无法对其进行区分,因此必须有理论、文献或其他证据提供支持(MacKinnon et al., 2000; Spector & Brannick, 2011; 温忠麟,黄彬彬,汤丹丹,2018)。虽然通过比较X 单独进入方程的标准化回归系数和加入 Z 之后的标准化回归系数,能够区分 Z 究竟是控制变量还是 X和Y 的前因变量(Spector & Brannick, 2011), 但随着变量数量的增加,统计控制能够起到的作用非常有限。如果想要完全排除虚假因果关系,只能通过实验设计(Becker et al., 2016)。

3.2.3 与核心变量的相关过高或过低

研究者常常默认控制变量与核心变量相关显著且具有理论价值,实际上这种假设是存在问题的(Carlson & Wu, 2012)。例如,Bernerth 和 Aguinis(2016)对 2003 至 2012 年间发表在顶级管理期刊上的 580 个实证研究进行分析后发现,在任务绩效的相关研究中,使用频率最高的五个控制变量在超过三分之二的研究中都与核心变量不存在显著相关,Bernerth 等(2018) 曾对 2003 至 2014 年在 10本顶级管理学和应用心理学期刊中发表的领导力实证研究文献进行了元分析,发现所有控制变量的平均效应量只有0.04.

如果控制变量与结果变量几乎不存在或者没有相关(例如 |r| < 0.1), 这些控制变量就无法排除对结果变量的其他解释,Becker(2005)称之为无效的控制变 量(Impotent Control Variables)。无效的控制变量会降低自由度,可能会引发抑制效应(Suppression Effect), X 和Y 的关系可能被夸大, 犯一类错误的概率也可能会提高(Becker et al., 2016; Carlson & Wu, 2012; MacKinnon et al., 2000)。另一方面, 也有一些研究者认为控制变量与结果变量的相关太强也会出现问题。例如,Atinc 等(2012)对 2005至 2009年间发表在四本顶级管理学期刊上的 261 篇报告了控制变量的解释量(R2)的研究进行分析后发现,一些研究中控制变量解释的变异甚至比前因变量都高,将上述变量作为控制变量显然是不合适的。就控制变量与前因变量的相关而言,如果控制变量与前因变量的相关为 0. 控制变量与前因变量的半偏相关系数和简单相关系数等价,统计控制不会改变研究结果 ; 但是,随着二者共同变异(图 1 中的 c + g) 的增加,前因变量的剩余变异所占原始变异的比例(图 1 中的 b + e/b + c + e + g)不断下降,统计控制对核心变量关系的影响也就更加明显(Bernerth et al., 2018)。考虑到研究者使用的控制变量的数量以及相关系数的大小和方向,控制变量与前因变量和结果变量的相关模式存在多种可能性(York, 2018); 由于多元回归中多重共线性(Multicollinearity)(罗胜强,姜嬿, 2014. pp.114-116)等问题的存在,加入控制变量后前因变量的回归系数可能出现不稳定的情况。例如, 控制前显著但控制后不显著,控制前后符号相反等。因此, 即使前因变量的回归系数在加入控制变量前后出现显著差异,也不能证明加入控制变量能够更准确地估计前因变量的效应量(Becker et al., 2016)。

3.2.4 基于剩余变异的分析不当

如前文所述,通过统计方法对额外变量进行控制后,研究者在假设检验中实际使用的是移除了控制变量与前因变量的共同变异(图 1 中的 c + g)后前因变量的剩余变异部分(图 1 中的 b + e)。由于无法确定移除的共同变异是否属于前因变量的有效变异, 前因变量的原始意义、构念效度和回归系数都可能会因此而改变(Becker et al., 2016; Breaugh, 2006; Carlson & Wu, 2012; Spector & Brannick, 2011), 前因变量剩余变异的意义也很难用理论进行解释(Breaugh, 2008; Carlson & Wu, 2012)。尽管多数研究者以为前因变量的构念效度始终没有改变(Atinc et al., 2012), 但事实并非如此。例如,Judge 和Cable(2004)在研究身高对收入的影响时,将性别、年龄和体重作为控制变量,结果发现身高的回归系数显著。然而, 将控制变量与身高的共同变异移除后, 身高的剩余变异只有 40%(Breaugh, 2008)。显然,移除了性别、年龄和体重后身高的剩余变异并不能够代表身高的真实变异。

除了影响前因变量的构念效度外,基于剩余变异推广研究结论还会影响研究的外部效度。例如 ,在研究尽责性(Conscientiousness)对组织公民行为(Organizational Citizenship Behavior, OCB)的影响时,研究者对员工的性别、年龄、受教育水平、工作任期等人口统计学变量进行控制,其实际在假设检验中使用的变异就是尽责性人格特质与员工的性别、年龄、受教育水平、工作任期等人口统计学变量不相关的剩余变异。然而在现实生活中,个体必然受到这些人口统计学变量的影响。剩余变异只是通过数学方法“人造”的变异, 既不具有理论意义, 也不具有现实意义。正如 Meehl(1970. p.147)所言 :“在多元分析中,研究者通过某种数学‘修正’, 运用统计方法捏造了一个虚拟的、理想化的样本,样本中的成员是由虚构的分数赋值后的虚构的人群”。在多数情况下,基于剩余变异的分析并不能带来有效的结论,甚至可能产生误导(Newcombe, 2003)。

3.2.5 研究假设中未加入控制变量

将控制变量加入研究假设中,不仅能够帮助研究者选择更多具有理论意义的控制变量,还有助于研究者明确控制变量与核心变量的关系,鼓励研究者重视控制变量的价值,引导研究者在剩余变量的背景下解释研究结果(Atinc et al., 2012; Becker et al., 2016)。尽管很多学者都建议将控制变量加入假设中(Becker et al., 2016; Carlson & Wu, 2012; Spector &Brannick, 2011), 且相关建议也已经加入了 AMJ 和JOB 的审稿标准中(Bono & McNamara, 2011), 但是将控制变量和核心变量一起加入研究假设中的研究仍非常少见。例如,本文对 2016 年至 2018 年间发表的 113 篇组织与管理领域的实证研究(见表 1)进行了分析,没有一篇在研究假设中加入了控制变量。

如果不将控制变量加入研究假设中,分析中实际使用的剩余前因变量与假设中的原始前因变量就是不一致的,假设检验就是无效的(Becker et al., 2016)。如果研究者关注的是统计控制后前因变量单独解释的变异(Unique Variance, 图 1 中的b), 例如在控制了工作自主性(Job Autonomy)的影响后工作压力能够单独解释离职中的变异量,使用统计控制方法就是可行的 ; 如果研究假设是基于前因变量和结果变量之间的共同变异(图 1 中的 b + c)提出的,例如工作压力和离职存在正相关,使用统计控制方法就是不恰当的。因为统计控制方法关注的重点是,移除了与控制变量的共同变异后,前因变量能够单独解释的结果变量中变异的部分(Breaugh, 2006)。可惜的是,研究者常常混淆上述两种情况,在提出研究假设时聚焦于核心变量之间的相关,却用统计控制后前因变量单独解释的变异来检验研究假设(Becker, 2005)。

3.2.6 没有比较不同的假设检验结果

一般而言,需要比较的假设检验结果主要包含两类: 一是加入与不加入控制变量的假设检验结果 ; 二是基于基线假设(baseline Hypotheses)比较不同的替代性假设检验结果。为了体现出控制变量对核心变量的关系可能造成的影响,研究者应当分别报告包含与不包含控制变量的分析结果(Atinc et al., 2012; Becker, 2005; Bernerth et al., 2018)。然而,很少有研究者会这样做。Carlson 和 Wu(2012)对 2007 年发表在 3 本顶级管理学期刊上的 266 篇实证研究进行分析后发现, 只有 8% 的研究比较了包含与不包含控制变量的结果,并对其进行了报告。

考虑到控制变量与核心变量关系的复杂性,以及控制变量角色的模糊性,研究者可以尝试基于基线假设, 围绕控制变量可能发挥的不同作用提出一些替代性假设。所谓基线假设,是指目前多数研究中都在使用的假设,基线假设中变量之间的关系一般是基于先前的研究和理论得到的(Spector & Brannick, 2011)。如有可能,研究者还应该努力提出一系列竞争性假设(Comparative Hypotheses),将一种机制与另一种机制对立起来,基于不同理论试图分辨不同的可能性。可惜的是,也很少有研究者这么做。

3.3 控制变量的报告问题

控制变量的报告情况在一定程度上反映了研究者对控制变量的重视程度。如果研究者没有完整地报告与控制变量有关的结果,控制变量就难以充分发挥作用。本文认为在报告控制变量的相关信息时,主要存在信效度报告不充分、描述性统计信息报告不全面、控制方法的描述不清晰、对数据分析结果的报告不严谨等问题。

3.3.1 信效度报告不充分

研究者在报告信效度时常常会忽略控制变量。例如, Becker(2005)提出了一项想要控制疗养院规模的研究,将每年年初疗养院床位数的自然对数作为疗养院规模的测量指标。然而, 测量的信度是未知的, 因为该研究并没有报告床位数量的一致性情况 ; 测量的构念效度也有问题,因为该研究没有清晰地界定组织规模。研究者也没有解释为什么控制床位数而不是患者数,为什么控制年初的床位数而不是全年的床位数,为什么需要用自然对数等问题。可能因为额外变异难以全部移除(Breaugh, 2006. 2008), 控制变量的测量信效度相对较低,但研究者却经常默认控制变量的信效度较高(Bernerth & Aguinis, 2016)。如果控制变量的测量存在误差,即使核心变量的测量完全没有误差,在估计核心变量的关系时也会出现误差(Edwards, 2008)。

3.3.2 描述性统计信息报告不全面

本文认为,研究者应当报告包括控制变量的均值、标准差等基本描述性统计信息。可惜的是,这并没有成为组织与管理研究者们的写作惯例。例如,在领导力研究中,30% 的研究者都没有报告控制变量的均值、标准差等重要的描述性统计信息(Bernerth et al., 2018)。报告控制变量与核心变量之间的相关系数、回归系数和显著性水平也非常重要,因为这样做便于计算前因变量的原始变异中剩余变异所占的比例(图 1 中的b + e/b + c + e + g)。在移除了前因变量与控制变量的共同变异后,前因变量的效应量可能会下降,因此统计控制前后可能会出现截然不同的结果(Breaugh, 2008)。例如,Janssen 和 Van Yperen(2004)控制了员工的性别、年龄和组织任期,基于目标定向理论(Target Orientation Theory)和领导成员交换理论(Leader-member Exchange, LMX), 预测下属的绩效定向(Performance Orientation) 与领导成员交换成负相关。虽然简单相关系数不显著,但加入控制变量后前因变量的回归系数显著。

3.3.3 控制方法的描述不清晰

一般而言,研究者需要描述纳入控制变量的具体方法。Becker 等(2016)指出,在以下两种情况下研究者需要更清晰地描述控制方法。其一,使用不太常见的控制方法。例如,Ahmadjian 和Robinson(2001) 在研究裁员对解除终身工作制(Deinstitutionalization of Permanent Employment)的作用时,使用面板概率分析方法(Panel Probit Analyses)控制了年份、出口量和行业。这种情况下就需要解释为什么使用上述方法而没有选择传统的统计控制方法。其二,当同样的控制变量在不同的分析中处理方式不同时,或者当某些控制变量在同样的分析中和其他控制变量的处理方式不同时,研究者也需要明确描述控制方法。例如, Becker 等(2016)指出,如果用销售业绩的得分除以销售区域内的客户数量来控制区域对销售业绩的影响,研究者就需要解释为什么要使用这种方法,并解释为什么没有使用将客户数量加入回归方程中等更传统的方法。

3.3.4 对数据分析结果的报告不严谨

在组织与管理领域,使用层次回归分析法对额外变量进行统计控制已经成为了一种规范化的操作流程(Spector & Brannick, 2011), 研究者在报告数据分析结果时一般都会纳入控制变量(例如在层次回归分析中的第一层加入控制变量的有关信息)。随着统计技术的发展,越来越多的研究者开始使用结构方程模型等其他统计方法分析数据分析。然而,可能是由于流行时间相对较短,在组织与管理领域,结构方程模型还没有像层次回归分析那样形成一套规范化的操作流程。研究者经常忘记报告与控制变量相关联的路径是被自由估计还是被固定的,在报告变量关系的路径图时也经常忽略控制变量(Becker et al., 2016)。例如,本文对 2016 年至 2018 年间发表的 113 篇中文的组织与管理实证研究进行了分析, 发现在使用了结构方程模型分析数据的 25 篇研究中,只有 6 篇研究解释并报告了控制变量的路径。

4 控制变量的应用策略

针对控制变量的应用过程中存在的诸多问题,一些学者提出了合理使用控制变量的策略与建议。基于前文的问题分析,本文从研究设计、数据收集与分析、结果报告三方面入手总结了控制变量的应用策略, 希望能够为组织与管理领域的研究者提供参考。

4.1 研究设计阶段

4.1.1 选择有理论意义的控制变量

研究设计阶段是控制变量应用过程中最关键的阶段。研究者需要思考“为什么要使用控制变量”,这是控制变量相关的一系列问题的起点(Bernerth & Aguinis, 2016)。对此问题,以下回答都是不太恰当的:模仿其他研究者,为了让审稿专家满意,为了更保守地检验假设,认为控制变量对核心变量之间的关系有影响(无论是基于实证证据还是研究者的推测),排除对研究结果的其他解释,增加新的解释等。有意义的控制变量往往与理论关系密切,顶级学术期刊的审稿专家和编辑也要求研究者基于理论选择控制变量。例如,Green 等(2016)使用迭代法(Iterative Approach),以审稿专家和编辑对投递至Journal of Business and Psychology的69篇稿件的304审稿意见为样本进行了质性分析,发现审稿专家和编辑要求样本中14.49%的稿件作者提供控制变量选择的理论基础。尽管理论导向的控制变量选择过程还没有被组织管理领域的研究者广泛采纳,但在国内,已经有研究者开始这样做。例如,谢菊兰、马红宇、唐汉瑛和姜海(2017.p.363)在研究家庭支持型主管行为对双职工夫妻双方婚姻满意感的影响与作用机制时指出:“根据‘资源 - 获取 - 发展’观,家庭需求特征会影响工作资源提升员工家庭角色表现及功能的过程。基于此,本文选取是否有小孩、是否有父母帮助处理家务作为控制变量”;张峰和杨建君(2016. p.8)在研究股东积极主义视角下大股东参与行为对企业创新绩效的影响时提出:“根据产权理论,由于国有企业大部分所有权归国家所有,经理人缺乏动力去最大化企业利润,因此本文将企业所有制分为国有企业和非国有企业并对其进行控制”。

本文认为研究者可以采取以下四点策略选择有理论意义的控制变量。第一,研究者应充分回顾与研究假设相关的理论,如理论中的核心概念、核心命题和边界条件等。如果该理论明确指出在控制了某些额外变量的特定情景中使用该理论才具有合理性,研究者就应当控制这些额外变量(Becker et al., 2016),这是因为该理论可能是以统计控制后前因变量的剩余变异为背景提出的。除此之外,研究者还需要明确解释为什么没有控制一些理论中认为应该控制的额外变量(Breaugh, 2008)。第二 ,研究者需要考虑在其采用的理论视角中,是否包含其他能够解释结果变量的潜在前因变量。例如,Wang,Jex,Peng,Liu和Wang(2019)在研究情绪调节(Emotion Regulation)视角下员工的表层扮演(Surface Acting)和深层扮演(Deep Acting)对婚姻幸福感(Marital Well-being)的影响时,将自我损耗(Ego Depletion)作为解释机制的同时,控制了员工在工作中体验到的消极情绪,这是因为在情绪调节理论视角下,消极情绪也能解释表层扮演对婚姻幸福感的影响(Semmer, Messerli, & Tschan, 2016)。第三,研究者需明确研究问题是否能够采用其他替代性理论进行解释,尤其是在有证据表明在该替代性理论中所涉及的前因变量可能与研究者所关注的前因变量存在显著相关时。第四,如果研究者确实无法为某个控制变量提供严谨的理论依据,但仍要将其加入研究设计中,那么至少需要基于适当的引用、统计、实证证据、符合逻辑的推导过程等,综合多方面论据论证为什么控制变量会影响核心变量及其关系(Becker, 2005)。例如,Van Scotter, Motowidlo和 Cross(2000. p.527)在研究任务绩效(Task Performance)和周边绩效(Contextual Performance)对系统性奖励(Systemic Rewards)的影响时,为选择工作经验作为控制变量提供了三点理由:“首先,研究表明,工作经验解释了较多任务绩效包含的变异;其次,任务绩效和周边绩效与工作经验存在相关关系路径差异,这为区分上述两种绩效提供了支持;第三,在该研究中,工作经验与周边绩效之间的平均相关系数(r = 0.17)表明不应忽视二者之间的关系。因此,如果不控制工作经验的差异,可能无法检测工作绩效(Job Performance)和其他变量之间的关系”。尽管上述三条论据每一条都不是十分恰当,但是在缺乏严谨的理论基础时,综合多方面论据要比单独选择其中某一条论据更可靠。

4.1.2 谨慎对待替代变量

使用替代变量(以人口统计学变量为代表)常常会带来问题,但这并不代表人口统计学变量不重要。本文建议研究者不能仅仅把人口统计学变量当作控制变量来对待,而应该关注它们对核心变量的影响机制,如果能够对人口统计学变量的作用进行更全面的理论分析,研究者就可以对其研究的问题进行更深入的探讨(Spector & Brannick, 2011)。事实上,常用的人口统计学变量是可以用理论进行解释的。例如,Bernerth和Aguinis(2016)指出,不少研究都直接或间接地提到过人力资本理论(Human Capital Theory)和关系性人口学理论(Relational Demography Theory)。人力资本理论认为,经验积累能够帮助个体获得更好的工作、更高的收入、更多的资源,因此,任期、教育背景、工作经验等个体特征会对工作态度和行为带来积极影响。关系性人口学理论强调,员工如果与组织中其他个体相似,人际互动的满意度就会更高,工作相关的态度和行为就会因此而受到影响。如果上述理论与研究者提出的研究假设匹配,控制变量理论基础不足的问题就可能得到一定的缓解。

4.1.3 在研究假设中加入控制变量

好的研究需要在理论和假设之间建立严密的逻辑联系,因为假设能够引导研究的设计与分析过程(Aguinis & Vandenberg, 2014; Carlson & Wu, 2012; Spector & Brannick, 2011)。本文建议研究者在研究假设中加入控制变量,而不是只论述前因变量、结果变量等核心变量之间的关系,只有这样,包含控制变量的数据分析过程才是有意义的(Spector & Brannick, 2011)。例如,Loi,Yang和 Diefendorf(2009. p.772)在研究组织公平(Organizational Justice)对个体间和个体内每天的工作满意度的影响时就将控制变量纳入了研究假设中,即“在控制了每天的积极情绪后,个体内水平的人际公平与工作满意度呈正相关”。当某个理论明确指出只有对某些额外变量进行控制后使用该理论才合理时(Becker et al., 2016),研究者更应该将控制变量加入研究假设中,因为这些理论可能是基于对某些额外变量进行控制后得到的前因变量的剩余变异提出的。

4.1.4 基于理论精选控制变量

不必要的控制变量会让变量之间的关系变得更复杂,凸显研究整体理论基础薄弱的问题,甚至可能间接移除其他变量的变异(Becker et al., 2016; Carlson & Wu, 2012; Green et al., 2016; Spector & Brannick, 2011);但遗漏重要的控制变量同样会带来错误地估计核心变量之间的关系等问题。在考虑控制变量的数量问题时,研究者首先需要尽可能多地选择与研究假设背后的理论框架相匹配的控制变量,之后再追求模型的简洁性,力求既简约又包含最多信息的模型(York, 2018)。控制变量应用问题的核心并非数量问题,而是质量问题,找到正确的控制变量最重要。

4.2 数据收集与分析阶段

4.2.1 考虑控制社会赞许性

收集数据时, 在某些情况下研究者应当考虑社会赞许性(Social Desirability)对研究结果的影响(Bernerth & Aguinis, 2016),这是因为社会赞许性可能会污染核心变量的测量过程。例如,在采用自我报告法(Self-reported Method)研究员工知觉到的不合规任务(Perceived Illegitimate Tasks)对退缩行为的影响时,由于体现出“集权”、“控制”等文化特征的威权领导(Authoritative Leadership)在我国企业中仍普遍存在(孙雨晴,罗文豪,2018),员工可能会基于社会赞许性,报告更少的不合规任务与退缩行为,导致知觉到的不合规任务和退缩行为的测量被污染。遗憾的是,可能是因为曾有研究者对数据收集过程中的方法学偏差表示担忧,现在将社会赞许性作为控制变量的研究并不太常见(Bernerth & Aguinis,2016)。

4.2.2 同等对待控制变量与核心变量

如前文所述,控制变量的影响不可忽略。因此,研究者应当同等重视控制变量与核心变量。具体来说:其一,研究者应当将控制变量的心理测量学标准提升至与核心变量同等的水平,采用同等的信效度标准(Becker et al., 2016;Carlson & Wu, 2012)。其二,研究者不仅需要选择与控制变量所代表的概念相一致的测量方法,还要尽可能清晰地描述为什么要用这种方法进行测量(Becker, 2005; Becker et al., 2016)。其三, 如果有可能,最好同时对控制变量的构念效度、会聚效度和区分效度进行分析,并使用结构方程模型等技术检验控制变量的心理测量学指标(Becker et al., 2016)。

4.2.3 关注控制变量与核心变量的相关及剩余变异

本文认为,控制变量与核心变量的相关不宜过高也不宜过低。如果研究者所认为的控制变量与结果变量相关太高,将这些变量作为前因变量或中介变量可能更合适。如果研究者所认为的控制变量与前因变量的相关过高,导致统计控制后前因变量的剩余变异(图1中的 b+e)所占原始变异的比例太小,前因变量的构念效度就很有可能发生改变。因此,控制变量与核心变量的相关不宜过高。相反,如果研究者所认为的控制变量与结果变量相关过低,意味着在研究中纳入一个与结果变量相关不显著的无效的控制变量,通常会导致难以准确地估计核心变量之间的关系。即使当控制变量与前因变量的相关很小时,统计控制对核心变量的关系的影响能够被忽略,控制变量与核心变量的相关也不宜过低。在研究中,控制变量与核心变量的相关太低相较于相关太高的问题或许更为普遍。例如,Bernerth 等(2018)对2003至2014年发表在10本顶级期刊中的领导力实证研究文献进行分析后发现,与核心变量相关不显著的控制变量高达五分之四。本文认为,最根本的问题依然是研究者所选择的控制变量是否具有理论意义,而不是控制变量与核心变量的相关是否显著。在缺乏理论基础的前提下,即使控制变量与核心变量的相关显著,也不一定要将其纳入模型中(York, 2018);反之,在理论基础充足的前提下,即使控制变量与核心变量的相关不显著,也应该对其进行控制。

此外,研究者还需要关注前因变量剩余变异的构念效度与原始变异是否相同,如果不同,使用剩余变异就是不合适的。如果研究假设本身就是针对前因变量的剩余变异提出的,使用剩余变异就没有问题。可惜的是,多数研究中研究假设是基于前因变量的原始变异提出的,假设检验过程却是围绕剩余变异而展开的(Breaugh, 2008)。正因如此,很多学者都建议组织管理领域的研究者应当报告剩余变异所占原始变量的比例(图1中的b + e/b + c + e + g)(e.g., Atinc et al., 2012; Becker et al., 2016; Breaugh, 2008; Carlson & Wu, 2012)。

4.2.4 尝试比较不同的假设检验结果

研究者应当努力明确控制变量在研究模型中可能发挥的不同作用,基于理论充分地解释控制变量为什么与核心变量相关,相关是怎样的,加入或忽略这些控制变量可能会对研究带来怎样的影响。因此,研究者可以尝试构建一系列有关控制变量的基线假设和替代性假设,考虑控制变量可能发挥的作用并进行比较,进而排除控制变量与核心变量关系的不同可能性;研究者还可以提出相互竞争的假设,将一种机制与另一种机制对立起来,试图排除其他可能。这里引用 Spector和Brannick(2011)提出的例子进行说明。例如,基于工作压力理论,高工作负荷(Workloads)的个体会出现更多的躯体压力症状(基线假设)。因为难以保持注意力,高度焦虑的个体可能无法保证高效的工作而出现工作堆积,与此同时,焦虑也会导致躯体压力症状, 简言之,工作负荷和压力症状之间的关系可能是由于焦虑情绪所引起的,二者的因果关系是虚假的(替代性假设 1)。此外,高度焦虑的个体往往会过度报告消极的经历(例如繁重的工作)和消极的自我状态(例如躯体症状),因此,焦虑情绪还可能污染工作负荷和躯体压力症状的测量(替代性假设 2)。如果工作负荷和躯体压力症状的简单相关显著,基线假设就可以得到验证;如果在不纳入焦虑情绪的情况下工作负荷的标准化回归系数显著,纳入焦虑情绪后工作负荷的标准化回归系数不显著,工作负荷和压力症状的因果关系就可能是虚假的,替代性假设1就可以得到验证;如果根据焦虑情绪影响的是工作负荷、压力症状还是同时影响二者的测量过程,分别计算对应的半偏相关系数与偏相关系数,结果发现半偏相关系数或偏相关系数比工作负荷和压力症状的简单相关系数小,焦虑情绪就可能是污染物,替代性假设 2 就可以得到验证。

研究者还可以比较有无控制变量的假设检验结果并进行报告。例如,Erdogan 和 Bauer 在研究领导 - 成员交换差异化对员工绩效、工作态度、退缩行为(Withdrawal Behaviors)的影响时,没有将工作任期作为控制变量加入分析中,因为“两种类型的工作任期都与退缩行为不存在相关,加入工作任期后并没有改变任何结果的显著性水平,所以我们报告的结果中并没有控制工作任期”(2010. p.1109)。根据 Becker等(2016)的建议,如果前因变量的标准化回归系数在包含和不包含控制变量的两种情况下差异小于0.1.研究者可以指出加入控制变量对研究结果没有影响,只需要报告不包含控制变量的结果,并建议未来研究者不再关注这些控制变量;如果差异显著, 那么两次分析结果就都值得关注,因为控制变量在核心变量的关系中可能发挥着实质性作用。

4.3 结果报告阶段

在研究结果报告阶段,研究者需要报告包括控制变量的均值、标准差、信效度等描述性统计信息,如有可能还应该报告控制变量的分布情况,因为极端值可能人为地扩大或缩小控制变量与核心变量的相关,使研究者曲解核心变量的关系(Becker, 2005)。报告控制变量的相关系数也非常重要,因为这样做能够帮助研究者比较原始前因变量和剩余前因变量,判断移除控制变量与前因变量的共同变异后,前因变量的构念效度是否发生改变,从而解释更复杂的数据分析结果,提供检验结论准确性的依据,方便后续研究者对研究数据进行二次分析(Bernerth et al., 2018; Bernerth & Aguinis, 2016; Breaugh, 2006)。只有研究者报告了控制变量的信度和效度,研究误差才有可能在一定程度上得到控制,控制变量的构念效度才有可能得到保证,参数估计的准确性才有可能提高(Becker et al., 2016)。此外,如果研究者使用了一个不太常用的统计控制方法,应当准确描述这个方法并说明使用该方法原因;如果研究者对同样的控制变量采用不同的方法处理,或者对不同的控制变量采用相同的方法处理,也需要进行说明(Becker et al., 2016)。为了充分理解控制变量在核心变量的关系中发挥的作用,研究者不应只在文章的方法部分报告控制变量的相关信息,还应尝试将控制变量加入假设、结果和讨论部分(Atinc et al., 2012)。尤其是对于使用结构方程模型的研究者来说,在报告数据分析结果尤其是模型的路径分析图时要加入控制变量(Becker et al., 2016)。

5 总结与展望

组织管理实践与工作场所较为复杂,与之相关的研究课题往往难以在实验室环境下加以研究。为了获得可靠的研究结论,研究者会使用统计控制方法来排除额外变量的影响。本文在总结以往研究文献后发现,研究者在使用统计控制方法时存在诸多问题(如表 2 所示)。

综上,无论是在控制变量的选择阶段还是分析与报告阶段,研究者都应当用高标准来对待控制变量(Becker, 2005), 不能为了让未来的研究者“放心”而加入控制变量(Carlson & Wu, 2012), 更不能把控制变量当作“为了让数据结果显著的工具”。最重要的是,研究者需要不断反思控制变量是否具备坚实的理论基础,因为只有理论能解释控制变量与核心变量之间可能存在的关系,只有理论能赋予控制变量最恰当的角色,只有理论能引导研究者选择与研究假设相匹配的有效的控制变量,只有加入具备理论基础的控制变量才能充分地检验理论假设。由于控制变量在某种程度上与核心变量相关,研究者应当为控制变量相关的决策提供清晰的理论基础(Bernerth & Aguinis, 2016)。

除了重视控制变量的理论基础外,本文认为在开展科学研究的不同阶段,研究者都应当给予控制变量足够的关注。例如, 在研究设计阶段, 研究者需要在保证理论基础的前提下追求模型的简洁性,谨慎对待以人口统计学变量为代表的替代变量,也可以尝试将控制变量加入研究假设; 在数据收集与分析阶段, 研究者可以考虑控制社会赞许性,同等重视控制变量与核心变量, 关注控制变量与核心变量的相关,注意前因变量的剩余变异,还可以尝试比较不同的假设检验结果; 在研究结果报告阶段, 研究者应该准确地报告控制变量的描述性统计信息与信效度,详细说明使用不同控制方法的原因,并尝试将控制变量加入文章的假设、结果和讨论部分。本文为研究者提供了控制变量的应用决策树,可以帮助研究者判断如何选择控制变量,以及采取何种策略分析和讨论控制变量(如图 4和图5所示)。

为了改善国内组织管理研究中控制变量理论的应用现状, 期刊也应该给予研究者足够的空间,同时提高控制变量的审稿标准(Becker, 2005)。审稿人应当像过去对待核心变量那样,针对控制变量是否具备坚实的理论基础提出质疑,要求研究者解释控制变量为什么可能会影响核心变量之间的关系(Atinc et al., 2012)。国外学者的研究表明,已经有很多审稿人和编辑采纳了上述建议(Green et al., 2016)。鉴于目前组织管理领域的研究结果的可信度面临挑战这一现状,采用实验设计方法来排除额外变量的影响从而落实基本的科学原则是非常有必要的(Bernerth & Aguinis, 2016)。总之, 控制变量也是研究变量(Becker, 2005),为了做出高质量的、科学严谨的实证研究,控制变量的应用问题应当得到国内组织管理研究者的高度重视。

本文内容整合网站:中国政府网百度百科最高人民法院知乎国家认证认可监督管理委员会国家知识产权局市场监督总局

TOP
2008 - 2022 © 中企检测认证网 版权所有  
发表评论
0评