农村教育问题驱动下的量化研究
刘善槐
摘要: 在经历三个阶段的发展后,农村教育的量化研究逐渐走向科学化和规范化,研究范式具有“问题驱动”“基于证据”和“多学科交叉”等特点。农村教育的量化研究具有三种基本类型: 一是以摸清事实为目的的大规模调查研究,用数据来回答“是什么”; 二是以解释为目的的关系性研究,用统计模型来回答“为什么”; 三是以决策为目的的构建性研究,用价值模型来回答“如何做”。
关键词: 农村教育; 问题驱动; 基于证据; 调查研究; 因果推断; 模型构建
农村教育是一个综合性很强的研究领域,其研究范式的转变和发展大致经历了三个阶段。第一个阶段的研究为偏重于思辨的经验性研究。这个阶段的研究也注重调查和证据,但调查并不系统,多为碎片化的日常观察和非完备化的统计数据; 分析资料和数据的方法多为简单描述,严谨性偏弱; 不同学者之间的研究结论难以互相支撑、相互验证或互为补充,科学性和推广性受到很大的限制。这类研究难以为后续的研究提供有价值的参考,也形成不了累积性、逐渐完善的知识体系。第二个阶段的研究为从自然科学、数学( 含统计学) 等学科进行方法迁移的研究。这个阶段的研究强调数据的真实性和完备性,数据来源多为一线抽样调查; 分析数据的方法普遍采用统计学方法,科学性得到加强,能够为后续研究奠定一定的基础,研究结论的学术价值得到提升。但是,这类研究本质上是“用其他学科的方法解决农村教育上的问题”,自然科学和数学方法的强大性得到彰显,但农村教育的学科特点正在丧失。如果按照这种发展逻辑,农村教育似乎可以拆解为某些学科的应用性分支; 此外,这类研究只适用于部分农村教育问题。第三个阶段的研究为注重社会科学、自然科学和数学( 含统计学) 交叉融合的研究,体现了农村教育综合性的学科特点。这类研究为“基于证据的研究”,统计数据、数学模型和教育理念构成了这类研究的基本要素。由于具有规范化、科学化和可推广性的后实证主义色彩,基于这三个要素的研究已经逐渐成为农村教育研究主流,在教育界的认可度也在逐渐得到提升。这种始于研究问题的研究范式可归纳为“农村教育问题驱动下的量化研究”。
一、农村教育研究的问题
问题是研究的逻辑起点。那么,什么是农村教育研究的问题? 在哲学上,有学者把“问题”定义为某个给定的智能活动过程的当前状态与智能主体所要求的目标状态之间的差距( 林定夷, 1991) ; 也有学者把“问题”定义为相对于已知和未知,是认知主体对认知对象已知状态与未知内容之间的差距、矛盾的主观反映( 魏发辰, 1989) 。以上定义把“问题”界定为“差距”或“矛盾”,偏向于自然科学上的解释。农村教育作为社会科学研究的一个领域,也把价值层面上的问题作为其研究的对象,因此,“问题”更应该包含价值分析、价值判断或价值期望。在农村教育研究领域,任何问题都是有时间维度的,要么是解释过去的问题,要么是面向现实的问题,要么是规划未来的问题。解释过去的问题呈现为理论判断,面向现实的问题凸显为矛盾表达,规划未来的问题表示为价值期望。这三类不同时间维度的问题需要不同的研究策略和研究方法来进行解释、回答或解决。解释过去的问题需要验证,面向现实的问题需要回应,而规划未来的问题需要建构。从这个意义上来说,农村教育研究的“问题”可以界定为需要验证、回应或建构的关于农村教育的理论判断、矛盾表达和价值期望。
除了时间维度外,农村教育研究的问题类型也可以按照其他标准进行划分。如果按照层级划分,可分为宏观、中观和微观的问题; 若按照研究对象划分,可分为农村学生( 含学生家庭) 的问题、农村教师的问题、农村学校的问题和教育行政部门的问题等; 而按照学科属性划分,可分为属于农村教育经济学、农村教育社会学、农村教育政治学和农村教育文化学的问题等。但是,这些划分并不能体现研究方法论上的差别。
基于不同的哲学基础,农村教育的研究方法可以分为质性方法、量化方法和混合方法,其中质性方法主要用于对研究对象的意义建构进行解释( 陈向明, 2000,第7 页) ,量化方法则适用于研究对象及其关系的精确度量,而混合方法整合了质性和量化方法( 李刚,王红蕾, 2016) 。针对农村教育研究问题的界定和属性,量化方法应包含三种基本的类型: 一是通过数据来描述客观现实的调查性研究; 二是通过从数据抽离出来的变量关系来解释教育现象或问题的发生机制及因果关系的关系性研究; 三是通过基于教育理念、统计数据和数学方法构建出的价值模型来指导教育实践的构建性研究。这三种类型的研究前后支撑,共同构成了农村教育量化研究的方法论基础。
二、以摸清事实为目的的大规模调查研究
调查研究指的是通过调查工具来收集资料和数据以描述客观事实的研究,这一类型的研究在农村教育领域应用非常广泛。近年来,关于农村教育的调查研究发展迅速,在解决农村教育问题中发挥着重要的作用,产生了积极的学术影响。按照类别划分,以学校为对象的调查研究有农村学校布局调整调查研究( 范先佐,郭清扬,2009; 刘善槐, 2011) ,农村学校公用经费调查研究( 钟秉林,赵应生,洪煜,阮琳燕,2012) 等; 以教师为对象的调查研究有农村教师编制结构调查研究( 刘善槐, 2016) ,农村教师流动调查研究( 吴建涛, 2015) 等; 以学生为对象的调查研究有农村贫困地区学生学业表现调查研究( 张彩,陈福美,李勉,张平平,王耘, 2015) 、农民工随迁子女调查研究( 陶红,杨东平,李阳,2010) 等。
事实是研究的立足点,摸清事实是农村教育研究者需要面临的首要问题。如果农村教育研究的“事实”可以通过大规模调查获取,那么这就要求其需要具备三个前提条件: 客观性、稳定性和可获取性。
1. 农村教育的“事实”是客观存在的,不因调查者、调查工具和调查过程的不同而产生巨大差异。绝对的客观事实是否存在一直有争议,原因在于,事实的获取依赖于经验或证据等,而这些似乎均带有主观性的色彩( 赫文,多纳,2008,第27 - 28 页) 。但是,各个研究领域内存在普遍认同的概念体系和知识领域。这些正是观察事实的领域理论视角,它们构成了学术研究和学术对话的基础。农村教育已形成了相对独立的概念体系和领域知识,使不同的研究者在研究相同的问题、选取相同的研究对象、按照相同的研究方法和研究程序时能够获得一致的研究结论,从而保证了农村教育研究“事实”的相对客观性。
2. 农村教育的“事实”是稳定的,至少在某一特定阶段是稳定的或者稳定变化的。已经发生的事实是稳定的,但正在发生的事实却是在不断变化中的。如果事实的变化速度较快,那么在调查结论出来之前事实已经发生了很大变化,调查结论将与事实产生巨大的反差,真实性必定要受到质疑。为了保证调查结论能够接近事实,缩短研究周期和采用跟踪性的调查研究是两种通用的完善策略。因此,农村教育研究“事实”的稳定性能够通过完善调查过程得到保证。
3. 农村教育的“事实”是通过外部的调查工具可获取并可描述的。“事实”是否可获取取决于其表现形式。从表现形式上来看,农村教育的事实可分为显性的和隐性的,显性的事实可以直接观察,开发适切的调查工具能够对其进行标尺化、次序化和类别化度量; 隐性的事实需要借助于表现特征进行观察和描述,而这可以通过开发间接的工具进行度量。调查研究是一项系统性的研究工作,为何调查、调查谁、调查什么、用什么调查和如何调查是研究过程需要回答的基本问题。
( 一) 为何要调查?
农村教育研究获取事实的方式有很多,比如文献研究、宏观的统计资料等,为何还需要通过大规模的实地调查? 这其实是由研究问题对数据的要求所决定的。
第一,这是获取最小分解单元数据的需要。宏观的统计资料,如《中国统计年鉴》《中国教育统计年鉴》和《中国教育经费统计年鉴》等,多是经过加总后的宏观数据。但是,农村教育研究所需数据往往是原始性的微观数据,其他层级的数据可以通过其进行加总或组合生成,这也就意味着研究所需数据其实是最小分解单元数据。如在研究农村教师所需编制时,只有明确每个农村学校所需教师编制才能生成每个乡( 镇) 、每个县、每个省和全国农村所需的教师编制总量,此项研究的最小分解单元数据即为每个农村学校所需的各个学科的教师编制数。
第二,这是获取关联性属性数据的需要。农村教育中的许多问题涉及关系性的研究,这类研究需要关联性的数据支撑,而原有的数据资料多为碎片化的数据,难以建立联系。如在研究农村学生学业成绩与家庭背景的关系时,需要收集学生个体学习、学校和家庭信息等关联性的数据,而这样的微观关联性数据从宏观的统计资料和相关文献中是难以获取的。
第三,这是获取真实可靠数据的需要。某些统计资料采集数据的方法为从基层部门开始逐层上报,由于某些数据与教育资源分配相关,而数据又只依赖于某一采集主体,因此其真实性易受到质疑。研究者作为独立方开展的实地调查能够做到利益回避,采用从多个主体收集数据进行相互验证的方式能够有效保证数据的真实性。
( 二) 调查谁?
农村教育调查的对象包括教育行政部门、农村学校、农村教师、农村学生家长( 含村民) 和农村学生等。到目前为止,没有哪一项关于农村教育的调查研究能够做到开展覆盖全国所有样本的调查,这也就意味着通过抽样来确定具体的调查对象是一个重要的问题。抽样本质上是选取能够代表总体特性样本的过程,而代表性的强弱取决于抽样的方法和样本量的大小。
1. 应如何进行抽样? 抽样分为概率抽样和非概率抽样,概率抽样包括随机抽样、系统抽样、分层抽样、定额抽样、整群抽样和多级抽样等; 非概率抽样包括目的抽样、雪球抽样、理论抽样和方便抽样等( 登斯库姆, 2011,第10 - 14 页) 。但是,许多农村教育的调查研究却不能简单套用这些抽样方法。在研究农村教育政策问题时,如果考虑不同因素对政策的影响,为了体现样本的丰富性,必须依据影响因素对总体进行分类,在每一类中抽取具有代表性的样本。当影响因素是连续型变量时,可以采用聚类分析进行分类,类别的多少取决于聚类分析所呈现出的类别之间的相对距离,距离越小类别越多,距离越大则类别越少。当影响因素是离散型变量或对影响因素进行离散化处理能够满足研究需要时,那么类别的多少取决于影响因素的数量和每个影响因素的类别。假定有n 个影响因素,每个影响因素的类别为x1,x2,…,x n,那么样本必须覆盖ni= 1xi个类别。如在农村学校布局调整的调查研究中,由于农村学校布局调整受经济、文化、人口、地理、民族分布等诸多因素的综合影响,为了使抽取的样本地区能够体现这些因素的综合作用,在抽样时应把这些因素作为县级样本分类的指标( 史宁中等,2014,第127 -129 页) 。
2. 应如何确定样本容量? 如果按照相同的抽样方法,样本量越大,抽样的精度越高,代表性越强。在理想的状态下,样本量的确定是在控制抽样精度的前提下确定最小样本容量的过程。但是,现实状况却是非常复杂的,并非所有特征的抽样精度均能合理估算; 并且,调查可利用的调研员数量和调研经费总是非常有限的,因此,样本量的确定变成了抽样精度和调查资源相互妥协的问题。
( 三) 调查什么?
在大规模调查研究中,调查内容源于研究问题。调查内容的信息收集均需要通过调查工具来实现,调查工具的科学性决定了能否获得真实可靠的调查信息。研究内容转化为调查工具通常要需要经历三个基本环节。
1. 理论关系模型化。从农村教育研究问题的界定可以看出,它暗含了特定的理论视角和复杂的理论关系,而调查研究本质上是通过调查所获得的数据对这种理论视角或理论关系进行验证、修正或重建的过程。为了使这一过程严密,需要对所有的理论关系进行模型化,在理论模型的结构中体现各种概念,而概念反映的正是调查的内容。
2. 调查内容指标化。调查内容以概念的方式呈现,需要通过系统化的指标体系进行刻画才能便于收集信息。如在调查农村学生的家庭背景时,需要设计能准确刻画社会背景、文化背景、经济背景等的多维指标体系来采集相关的信息。
3. 信息维度问题化。调查问题是研究者与被调查者进行对话的基本方式。从接收问题到回答问题,被调查者需要经历四个基本的过程: 理解问题,回忆与之有关的信息,决定给出答案以及向调查员报告自己确定的答案( 扎加,布莱尔, 2007,第54 页) 。因此,为了获取准确的信息,需要确保被调查者具备相关的知识背景,有回答问题的意愿,掌握相关信息且清晰表达相关信息的能力。但是,农村教育的调查对象通常难以同时满足这些条件,从而使问题设计的难度增大。如在调查低年段学生的学习兴趣时,受限于学生的理解能力和表达能力,调查员通常难以直接从学生身上收集相关信息; 而在调查农民收入时,由于许多经济作物生长周期跨越几年,调查员常常会遇到连农民自己也搞不清楚一年的收入是多少的尴尬局面。
( 四) 用什么调查?
调查工具是调查问题的组织方式,问卷、调查表和访谈提纲等是开展农村教育大规模调查的基本工具。与调查研究理论框架的呈现逻辑不同,调查问卷有其特定的生成逻辑和限制条件,但这并不影响信息收集的充分性。依据调查问卷呈现的信息与理论框架建立的对应关系,信息依然能够被有效还原。为了提升应答率和准确率,调查问卷应从回答者的角度进行设计。因此,问卷设计应遵循从简至难、相似的问题就近编排、合理设置问题筛选器等一些便于被调查者回答的原则; 同时,也应遵循敏感信息回避、题量控制等一些减少影响应答者情绪的限制条件。
( 五) 如何调查?
选择什么调查方式是一个操作层面上的问题。调查质量和调查问卷的回收率是影响调查方式选择的两个主要的参考因素。如果采用实地调研的方式,在调查资源有限的条件下难以保证调查能够同时达到高质量和高回收率,因此需要寻求两者之间的平衡( 风笑天, 2007) 。在农村教育调查研究中,调查方式主要包括实地调查、电话调查、网络调查、邮寄调查和委托调查等。实地调查是农村教育调查中最为普遍的一种调查方式,它能够有效控制样本质量并且实现调查者和被调查者之间的信息交换和互动,从而收集到高质量的数据; 电话调查和网络调查主要用于从特定样本中收集即时信息,适用于舆情调查等; 邮寄调查和委托调查通常用于省域层面和县域层面农村教育宏观和中观层面的数据收集,数据质量通常取决于调查过程中调查者与调查对象双方建构的关系。
三、以解释为目的的关系性研究
以解释为目的的关系性研究指的是利用统计模型,从数据中提取理论关系来解释农村教育现象的研究。基于后实证主义的哲学思想,这类研究采用实证性的研究范式,并已经形成了稳定的操作程序与呈现方式。从成果的呈现方式来看,这类研究趋向于“洋八股”,即包含问题、文献、假设、测量、数据、方法、分析和结论等部分( 彭玉生, 2010) 。近几年来,伴随统计学方法的发展和推广,这种类型研究在数量上有了较快的增长。例如,农村学校撤并对学生上学距离的影响研究( 赵丹,吴宏超,Bruno Paro-lin,2012) ,农村学校布局调整对学生发展的影响研究( 侯龙龙,张鼎权,卢永平,2010) ,西部农村中小学教师质量及其影响因素研究( 陈纯槿,胡咏梅, 2010) ,寄宿对留守儿童社会情感能力发展的影响研究( 王树涛,毛亚庆,2015) ,父母外出务工与留守子女辍学的关系研究( 苏群,徐月娥,陈杰, 2015) 等均属于这类研究。关系性研究的各种概念可以从理论模型中提取,由概念衍生变量。当可量化的变量体系形成后,关系性研究需要回应的基本问题变为: 变量之间有关系吗? 变量之间是什么关系? 变量之间的关系是否紧密? 如何解释变量之间的关系? 在研究的过程中,学者们利用统计模型来判断变量之间是否有关系和有什么关系,通过参数的估计来分析关系的紧密程度,采用与问题背景相结合的方式来解释统计模型所呈现出的理论关系,也即模型选择、变量遴选和模型解释是这类研究的关键所在。
( 一) 如何选择模型?
任何关系性的研究都是有预设的,这种预设构成了研究的理论假设,而数据分析其实就是验证、完善或推翻这种理论假设的过程。理论假设并不是凭空提出的,而是源于理论直观、理论推理或研究前沿等。在农村教育领域,绝大部分理论模型均带有随机性的因素,也有一些变化是理论模型难以解释的部分。这一特点决定了农村教育的关系性研究采用的是带有随机因素干扰的统计模型,而非因素之间具有完全决定作用的数学模型。模型度量的是变量之间的关系结构,因此,模型选择的核心问题是采用哪种关系结构来刻画变量之间的关系。除了原有的理论基础外,模型选择应考虑解释变量的类型: 如果因变量是连续性的变量,采用较多的是线性回归模型、多层线性模型或结构方程模型等; 如果因变量是分类变量,采用的多是广义线性模型( 如logistic 模型、probit 模型) 。模型的比较和优选通常通过对统计模型拟合度的分析来实现。
( 二) 如何遴选变量?
变量设计源于概念解析,好的变量必须满足三条基本原则: 一是数量最少化信息最大化原则。变量在数量上应最少但能够最大程度地涵盖概念的信息,如果能够收集到充分的数据,这一过程可以通过因子分析来实现。二是可数据化原则。变量必须能够根据变量的属性收集到相应的数据。三是灵敏性原则。变量在刻画概念时可以有效甄别其特性与细微变化。变量的数量和作用甄别取决于良好的模型结构和完备的样本数据。为了避免遗漏重要的变量,在调查设计的过程中通常会纳入尽可能多的变量。实验控制或统计控制是判断某些变量因果关系的基本方法,但这两种方法对数据结构有特殊要求,这需要研究者提前进行实验设计或调查设计。一旦模型类型确定后,数据分析就变成了确定变量有没有发挥作用,发挥多大作用和发挥什么作用的过程,这一过程可以通过参数估计和假设检验来实现。
( 三) 如何解释关系?
因果推断是关系性研究的基本指向,但是,基于调查数据和统计模型的关系性研究通常并不能直接进行因果推断。关系性研究对因果推断也并非毫无作用,有因果一定有净相关,多元统计分析是一种检验、证伪因果命题的有效方法( 彭玉生, 2011) 。因此,关系性研究是因果推断的必要前提。实验研究是进行因果推断最为可靠的方法,有学者曾运用干预的方法研究了现金补偿对农村学生辍学的影响( Mo,Zhang,Yi,et al., 2013) 。由于实验研究不可逆并且容易产生许多伦理学的争议,其在农村教育领域的运用并不广泛,农村教育的因果推断更多借助于统计控制。即使关系性研究证明了变量之间存在因果联系,但依然难以解释这种因果关系是如何发生的。若想清晰地解释农村教育问题产生的机制,除了需要开展严谨的关系性研究外,还应回归到农村教育的现实背景中对运行机制进行分析。
四、以决策为目的的构建性研究
农村教育的构建性研究指的是通过构建包含价值参数的决策模型来指导未来教育实践的研究。由于是面向未来的研究,构建性研究已经突破了传统意义上的实证研究。农村教育的发展有其客观的内在规律,同时也体现了具有主观特性的前瞻性规划。这一特性要求农村教育研究必须具备引导农村教育未来实践的基本功能,而指导教育决策是实现该项功能最为直接的方式。因此,农村教育的构建性研究是农村教育发展给农村教育研究提出的基本要求。这种研究融合了科学性和人文性,在操作规范上依照问题定位、理念分析、参数选择、模型构建和参数估计的步骤,主要体现为如何把合理化价值嵌入科学化的数学模型。近几年来,这一类型的研究有农村学校布局调整决策模型构建研究( 刘善槐,2012) ,农村教师补充模型建构研究( 李玲,卢锦珍,李婷, 2015) ,农村教师编制测算模型构建研究( 刘善槐,邬志辉,史宁中, 2014) 等。相较于现实需求而言,这种研究极为短缺,远不能为农村教育的全面发展奠定理论基础并提供科学依据。
构建性研究要解决的关键问题是处理工具理性和价值理性之间的关系,也即如何实现方法的科学性和价值的合理性的有效融合。方法的科学性体现在模型框架的最优化和影响因素的完整性等,而价值的合理性可体现为公平、民主和道义等。
( 一) 如何在模型中融合价值?
为了构建科学且价值合理的决策模型,价值与数学模型需要进行有机整合,整合的方式有三种: 价值前置,价值嵌入和价值后置。价值前置指的是把价值理念作为模型构建的限制条件,模型构建依然可以按照数学方法进行。如在构建教师编制测算模型时,把“不同规模学校学生获得的教育服务应均等化”作为价值理念,可推导出模型构建的限制条件“不同规模学校教师工作量一致”,这是价值前置的过程。价值嵌入指的是把价值理念直接转化为价值变量或将价值参数纳入数学模型中。如在构建学校布局调整决策模型时,引入反映决策主体真实意愿的价值参数,用于协调利益相关主体教育效用、经济效用和社会效用之间的关系,这是价值嵌入的过程。价值后置指的是按照统一的原则构建决策模型,之后再对某些特殊群体进行利益倾斜。例如在按照统一的公用经费测算模型分配公用经费时,发现对小规模学校不利,然后调整测算标准,对不足100 人的小规模学校按照100 人进行核算,这就是价值后置的过程。在研究实践中,选择哪种整合方式取决于研究问题。按照价值前置和价值后置方式构建出的决策模型仍是数学模型,而按照价值嵌入方式构建出的决策模型是带有价值参数的数学模型,也即价值模型。
( 二) 如何估计价值参数?
统计模型中的参数估计是通过数据分析来实现的,并且参数估计的优劣可以进行检验。与之不同的是,决策模型中价值参数的估计却是“确定由谁来决定各类因素的重要性”以及“如何确定各类因素的重要性”,因此,价值参数的估计是在运用决策模型进行决策实践时完成的。决策是利益和价值的分配过程,为了避免冲突,价值参数的估计需要变成了利益相关主体共同确定“什么是重要的”。如果利益相关主体寻找到了利益协调的方式,那么价值参数的估计就能够得以实现,反之,价值参数则估计不了。因此,民主化程序是利益协调的基本方式。价值参数的估计具有对象指向性,不同的决策主体其参数有很大的差别。比如,在农村学校布局调整的决策过程中,有的利益主体认同“学生到交通距离相对很远但教育质量更高的地方上学”,而有的利益主体却选择“学生到教育质量相对很差但交通距离很近的地方上学”,二者在交通距离和教育质量的价值权衡上差别巨大,这两个因素由于价值参数不同而会在决策过程中体现出作用差异。除了体现民主外,价值参数也必须反映公平和道义底线,这可以通过构建决策模型的拒绝域来实现。一旦决策方案触碰了拒绝域,价值参数变成零,方案需无条件否决。比如在农村学校布局调整决策模型中,辍学、安全隐患、低龄寄宿、拉大教育差距等均可以纳入拒绝域中。