模式(model)作为一种科学抽象方法,经历了从实物模型到思维模型或数学模型、再到行为模式的历史演变。教育评价模式是既具有理论性又具有可操作性的行为范式,是联系教育评价理论和实践的纽带,具有构造、解释、启发、预测等多种功能。尽管以色列教育评价专家内伏认为教育评价模式的构成涉及十个方面的问题,即评价如何定义?评价的功能是什么?评价的对象是什么?对于每个对象应收集哪些方面的信息?应该用什么准则来评判一个评价对象的价值和优点?评价应该为谁服务?评价的过程是什么?在评价中应用什么技术方法?谁来进行评价?用什么标准对评价进行元评价[1]?诚然,实践中的教育评价模式仅仅侧重上述内容的某几个方面,但不可能也不应该面面俱到。任何教育评价模式都必须设定目的理念、运行机制和标准体系三个必不可少的基本要素,否则就难以构成相互作用、相互联系、动态运行并自成体系的教育评价模式。一般说来,国外教育评价思想可以划分为四个时期,即测量时代、描述时代、判断时代和建构时代。追溯教育评价从测量、描述到判断、建构的历史演进,落脚点在于对行为目标模式、决策导向评价模式(CIPP模式)、应答模式和共同建构模式等标志性评价模式加以历史的、理论的审视。
教育评价思想孕育和奠基于教育测量运动。20世纪初,为了克服学校考试单纯采用口试的主观性,西方国家兴起了教育测量的热潮。在教育测量的探索中,桑代克成就最大。他提出的“凡是存在的东西都有数量,凡有数量的东西都可以测量”的思想,为教育测量的客观化、标准化奠定了理论基础。教育测量的客观化、标准化虽不失为学校教育评估的重要手段,但是过分追求测量结果的客观化和标准化,使所有难以客观地、数量化地加以描述的事物,都被排除在测量对象之外,使学生在态度、兴趣和情感等方面的表现受到完全忽视。行为目标教育评价模式在对教育测量批判的基础上应运而生,并深受实用主义教育思想的影响。
拉犬尔·泰勒教授主持的“八年研究”(1933~1941年的“课程与评价”研究),产生了著名的行为目标模式。这一模式认为:“评价过程在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。但是,鉴于教育目标实质上是指学生发生的变化,是指在学生行为模式中产生某种所期望的变化,因此,评价是一种确定行为发生实际变化的程度的过程。”[2]泰勒第一次把测验与评价做了区分,第一个对评价做了系统的描述和应用,开创了行为目标模式的先河。
“泰勒模式是以目标为中心的。”[3]在该模式中,教育目标是评价的出发点,也是合理的评价标准。因此,编制教育教学目标是这一模式的关键。20世纪50年代以来,泰勒的学生布卢姆及其同事提出了教育目标分类理论,这一理论把教育目标分为认知、情感和动作技能三个领域,并具体研究了这三个领域的教育目标。在每一个领域中,根据能力的复杂程度和品质内化的程度,找出具有递进关系的层次,形成目标的阶层。例如,情感领域的教育目标划分为高低不同且存在着有机联系的五个层次,即接受、反映、价值内化、价值组织化和价值个性化。这些层次进一步划分为不同的亚类。而对每一个阶层的教育目标,都指出适宜的行为动词,以使目标落实到学生的行为方式上。这样,目标被表述得相当具体,具有可操作性,便于教师改进教学,便于教师进行评价。总之,布卢姆完善了目标评价模式。
行为目标评价模式是最早的较为完备的评价理论模式,对20世纪的评价理论与实践产生了深远的影响,为评价领域后来的发展开辟了道路。首先,这一评价模式开创了目标参照测验这一测验新形式。泰勒认为,起源于智力测验的常模参照测验是以区分考生为目的的,它对了解学生的学习进展并无多大意义。而与此相对的目标参照测验则更有利于判明学生学业的进展,改进课程和教学方案。其次,行为目标评价模式结构紧密,操作性强,其操作程序相当完备,包括目标群、筛选、目标、学习情境、工具与测验、信息检验等首尾一贯的具体环节[4]。最后,这一模式成功地设计了认知领域的行为目标,但是情感目标、技能目标的编制并不十分成功。这一模式中的教育目标是预定的,结果只与预定的目标相比较,而目标以外的结果被忽略了。有些教育目标无法用行为语言恰当地表达出来,比如生长性目标、表现性目标等就难以量化、难以操作化,把这些教育目标排除在外,将导致价值判断的表浅化。
在实际应用中,行为目标模式重视控制与预测,在一定程度上忽视了发挥学生的主观能动性,它必须得到突破。自20世纪60年代以来,新的教育评价模式大量涌现。1966年斯塔弗尔比姆首创决策导向评价模式(CIPP模式),1967年斯克里文提出了目的游离模式,1973年斯塔克提出了需求导向的应答模式。此外,还有反对者模式、解释模式和研究模式等。
斯塔弗尔比姆正式提出形成性评价思想,“评价的最主要的目的不是为了证明,而是为了改进。”[5]他认为泰勒提出的作为评价中心和根据的目标本身也需要受到评价,评价不应局限于确定目标的达到程度,而应为决策者提供信息服务。最有用的评价应当为管理者、教师、学生和其他人提供反馈信息,从而更好地为教育服务。在这些思想的指导下,斯塔弗尔比姆建立了CIPP模式。
CIPP模式由背景(context)评价、输入(input)评价、过程(process)评价和成果(product)评价结合而成。简单说来,背景评价是根据社会发展需要和评价对象的需要对教育目标本身作出价值判断;输入评价是对达到目标所需而且可能获得的条件进行评价,本质上是方案可行性评价;过程评价是对方案实施情况不断检查,即对是否按计划实施方案,是否以有效方式利用现有资源等进行评价;成果评价是对方案实施结果的评价,即测量、解释和判断教育的成就,确认人们需要被满足的程度。在CIPP模式的运用过程中,评价者可根据需要采用一种评价,或采用几种评价;既可在方案实施前使用,也可在方案实施后使用。这完全取决于评价听取人的需要,它是一种十分灵活的模式。
CIPP模式在背景评价中对目标的合理性进行审查,弥补了泰勒模式的不足。而且针对泰勒模式忽视条件和非预期结果,提出了输入评价和过程评价。CIPP模式整合了背景评价、输入评价、过程评价和成果评价,具有较强的系统性。但是,CIPP模式过分注重描述性信息,忽视对方案及其实施作出价值上的判断,缺乏对实践的反思批判精神。而且,CIPP模式的评价者可能为决策者在政治上的便利而做出虚假的伪证,因为在CIPP模式中,评价人员的职能就在于按照有关的决策领域,为决策者收集、分析和传送概括性资料,而决策者常常受政治因素干扰[6]。此外,CIPP模式的背景评价、输入评价、过程评价和成果评价等四类评价之间的实施流程比较复杂,需要耗费大量的人力、物力和财力,去实施繁杂的活动,因而限制了其适用范围。
斯塔克的应答模式上承行为目标模式、CIPP模式,下启共同建构模式。该模式主张与教育活动有关的各种人员的接触,如学生、教师、家长和决策者等,了解他们的需要和要求,从中发现并选择出他们所关注的有价值的问题,然后把它同实际活动相比较,对教育方案作出修改,对大多数人的愿望作出回应,以便满足各种人员的需要。强调以关心教育方案的所有人所关注的现实的和潜在的问题为出发点,不主张以预定的目标或假设为出发点。在选择人们所关注的有价值的问题时,强调价值观的多元性和发散性。在选择评价方法时,强调质性评价方法,轻视量化评价方法。斯塔克用评价时钟图来表示应答模式的具体操作结构,这一“评价时钟”显示了评价问题、评价工具、评价结果和平等协商等十二个评价环节。但是应答模式的操作程序的不确定性太强,可能使人无所适从;适用范围有限,“当了解目标是否达到,承诺是否履行,假设是否证实成为主要任务时,预定式评价比应答式评价更为合适。”应答模式强调在自然环境中的观察、访谈和描述等方法,忽视调查、统计等量化方法,所以其评价缺乏深度,难以发现教育价值运动的本质和规律。
20世纪80年代以来,教育评价理论流派纷呈,各抒己见,百家争鸣,一派繁荣景象。在批判传统的教育评价思想的基础上,教育评价理论不断综合创新,努力实现量化评价与质性评价的互补,结果评价与过程评价的并重,他人评价与自我评价的结合,正式评价和非正式评价的共生,元评价与再评价的对接。这个时期,国外教育评价学界明确提出了鉴赏批评模式、共同建构模式和质量保障模式等有代表性的教育评价理论。
由枯巴和林肯于20世纪80年代提出的第四代评价理论认为,前三代评价存在三大严重缺陷和问题,即“管理主义倾向”、“忽视价值的多元性”和“过分依赖科学范式”。因此,第四代评价的出发点应该是“回应性聚焦方式”,即回应推动者、受益者和受害者三类人士的要求,回应他们各自的主张、担心和问题三类要求。第四代评价认为评价的本质是共同建构评价共识,协商是从出发点通向本质的途径,故评价的方法论应该是“建构性探究方法”,即是一个由进入条件、探究过程和探究结果三阶段构成的建构框架。在“进入条件”阶段,应该在自然情境中进行探究和评价,必须采用“质的研究方法”。在“探究过程”阶段,不断进入“诠释辩证的循环圈”,通过协商形成共识,即共同建构。在“探究结果”阶段,撰写反映共识形成条件、过程的评价报告。具体说来,建构性评价的操作流程大致可以分解为12个相互联系的步骤,即签订协议;组织评价;鉴定利益相关者;形成每一方的共识;以新信息增进理解,扩大共识;查明主张、担心和问题;确定优先协商的问题;收集信息,增进认识;准备协商方案;进行协商;提出报告;再循环[7]。
在评价理念上,共同建构模式的真正意义和优势在于“对利益相关者赋权、坚持协商与共识的原则。”[8]在评价策略上,共同建构模式提出了“回应—协商—共识”的思路,这一方法的操作程度和成效有待于实践的检验,但是这一方法具有开创性,且倡导了一种民主协商精神。在评价者和被评价者的关系上,共同建构模式实现了重大突破,从传统的“权威—服从”关系根本转变为平等合作的主体间关系,从传统的“主体—客体”关系发展为“主体—客体—主体”的关系。也就是说,该模式不再把被评价者看做评价客体,而是看作评价主体,因此参与评价的双方共同建构评价结论,构成交互主体关系,以客体为中介的“主体—主体”关系。此外,这一模式还提倡全面参与,让所有参与评价的人充分表达自己的意见;尊重人的尊严、人格和隐私,对评价提出了道德要求;认为在评价中人们的价值需求是多元的,因而评价要追求多元化目标[9]。
在哲学基础上,共同建构模式肯定多元化的价值观念处于重要地位,认为评价不过是一个心理建构过程,“评价过程是由评价者和参与者共同建构统一价值观的过程,评价结论是一种主观性认识,是心理建构物。”[10]这有陷入主观主义价值论的危险,因为评价虽然受价值观的影响,具有主体性,但是评价归根结底依赖于客观的价值关系,具有客观性。在操作流程上,建构性探究方法实施起来比较艰难,特别是鉴定利益相关者、对弱势群体授权和构建民主公正的协商制度在现实中都是很大的操作难题。
作者:福州大学马克思主义学院 蔡晓良 庄穆 来源:《高教发展与评估》2013年第02期