长期以来许多评价的目的不明,将教学活动和教材、科普活动与读物一律排除在学术评价客体”之外是个误区。学术的四种类型实际上是四个功能各异(不能互相代替),但又互相衔接、层次分明的整体。不能片面地强调哪一个方面,当然也不能抹杀它们的区别。还要注意亦此亦彼的成果,如诺贝尔经济学获奖者萨缪尔森的〈经济学原理》(又名〈经济学》),既是作者原创研究成果,又是教科书,不能简单地认为是教科书而不能参加专著的评奖。总之评价目的要明确,从而根据实际情况确定评价对象。 学者和学术成果是最重要的评价客体,因为学者是推动和导引人文社会科学学术研究和学术发展的关键,其中学者的品质和科学精神至关重要。学术成果则是评价人员、机构、乃至国家研究实力的基础。学术期刊(包括开放存储等数字期刊)作为知识传播的一种特殊媒体,它是人文社会科学学术研究的主要论场,是学者深思熟虑的记录型研究成果和知识产权证明,是进行知识交流的主要平台,因此对于学术期刊的评价,有助于建立稳定合理的学术交流体系,从而推动学术的交流和健康发展。 科学清晰地界定和类分评价客体,对于人文社科的按特点分类评价”的原则具有重要意义。人文学科不同于社会科学,文史哲也各有特点,某个学科内部的不同领域和方向也各有侧重,如文学中的文学理论与文学作品创作就是不同的领域,其成果形式和内容也不一样。只有确定被评价的对象具有可比性和比较的条件,才能按照一定的标准和方法进行评价。 3评价目的 评价目的是指评价要达到的预期希望和总的原则要求,即评价的理由,为什么要评价。评价目的可有多种分类方法,比如从时段上可分为长远目的、中期目的和近期目的。不同的评价目的决定着不同的评价标准和指标、不同的评价方法和评价专家的选择以及评价程序的确定,它是评价的龙头,分类评价的动因,规定、制约和导引着整个评价的方向和具体做法。目前的许多评价之所以出现问题,主要是因为评价目的不明所造成的。比如,学术期刊的质量分级评价,其目的是要达到按质分级、各得其位、按位配置资源、优化管理的目的。按此目的,就应以内容评价、效用评价为主,形式评价可以参考。如果仅以形式评价来分级,就达不到评价的目的,就会出现期刊片面追求某些指标、背离办刊宗旨、功能等异化现象。又如,对高校教师的评价,如果是每年一次的常规评价,目的是检查教师是否在干活、出活,那么,仅以形式评价即可,不宜与物质奖励密切挂钩,否则极易造成短期行为、粗制滥造、弄虚作假等不端行为的出现。如果是若干年一次的教师水平评价,目的是将具有创新潜力或实力的教师评选出来,那么必须以内容、效用评价或动态评价为主,形式评价为辅,否则劣币驱除良币”的现象难免不会出现,如此等等。因此在实际的评价中,一定要牢牢掌握评价目的这个纲”。 4.评价方法 评价方法是指评价中使用的工具或手段,包括同行评议法(专家意见法、德尔斐法)、引文评价法、文摘评价法、加权求和评分法、指数加权求和评分法、混合评分法、系统分析评价法、模糊评价法、分层评价法、因果评价法、果因评价法、间接评价法、直接评价法等。这些方法又被概括成定量评价法、定性评价法和定性定量综合评价法。 定性评价法是评价专家通过观察、阅读、讨论等对评价对象用文字语言进行相关描述的方法;定量评价法是在定性分析的基础上最终用数学语言进行描述的方法。一般说来,定性评价对学术评价更为重要。但在实际的评价中,定性评价与定量评价常常相互补充。定性是定量的基本前提,没有定性的定量是一种盲目的、毫无价值的定量;定量使定性更加科学、准确,它可以促使定性评价得出广泛而深入的结论。实际的评价必然是根据一定量的某种质或一些质的一定量来判断的,或更准确地说是根据一个质量向量”来判断的。所以,不可能有纯粹的定性评价,纯粹的定性评价必是主观随意评价,毫无科学性可言。另一方面,也不可能有纯粹的定量评价,纯粹的定量评价必然不是评价,而是一种纯粹测量,这就好比说此人有一篇论文”,它不是一种评价,评价必须说明:这一篇论文是合格还是不合格,按一定标准水平是高还是低。量化价值判断的结论一般不是量化的,如通过计算所得出的结论往往是此方案可行”、“该刊入选核心期刊”、“此学者优秀”等。 为了更好地说明各种评价方法的特点,更好地理解学术共同体评价与实践、时间或历史的最终评价之间的关系,笔者受到钟义信先生的全信息、全知识理论的启发,结合国内外人文社科评价实践及其存在的问题提出了三个新概念组合,即形式评价、内容评价和效用评价。根据全信息、全知识理论,任何信息和知识都可以分成形式、内容和效用三个要素。学术评价可以被理解成是对评价客体生产出的知识的量和质的评价问题,而质又可以从知识的内容(含义)和效用(价值)上反映出来,因此从知识的形式、内容、效用三要素就可以推广概括出评价的三种方式或方法:形式评价、内容评价和效用评价。 所谓形式评价是指评价主体对评价客体内含知识的外部特征的评价,它既包含同行的定性评价,也包含定量评价,但最终的评价可用数字、数据反映,包括发表论著数、被引用数、被文摘量、获奖数、发表字数、获专利数、发表成果的级别、院士和教授人数等。形式评价也有同行评价,但不是直接对评价对象内容质量、效用的评价,而是与内容质量、效用评价有密切关联,它在一定程度上可以反映评价对象的知识含量,是一种简单易行、粗略、可测试、可核实的评价。根据一定的评价目的,如对成果一般性、非精确地评价,或对宏观、中观总体的估价(直接的评价因工作量太大不可能进行),此种评价是有效的,或是最不坏的评价方法。但对某些要求高的精细评价,它可能是评价的基础,有可能参考,也有可能不做参考,一切视具体的评价目的而定。 所谓内容评价是指评价主体对评价客体内含知识的本身特征的评价,由同行专家通过直接观察、阅读、讨论来进行,为了计算的方便,可能也会将定性评价转换成数字,但最终的评价通常用文字或数字加文字来反映,如此方案一致通过,此人是一流学者”,该成果具有原创性”等。它是针对某一评价目的对知识内容的逻辑性、合理性、价值等的直接评价,是一种费时费力、测试、核实更花时间,但却精细、较为可信、可靠的评价。一般对于关系到评价对象直接、重大利益的精细评价都应采取此种评价,而不能片面强调工作量大而放弃。 所谓效用评价是指实践、时间、历史对评价客体实际作用、价值的验证或最终评价。它既强调用一段时间、有限的实践、己有的历史事实来评价,更注重长时间、更多实践和事实的评价。它既依赖于学术共同体的评价(因学术共同体最能认定实践、事实的意义),但又有独立性,不以任何人的主观意志为转移。在社会科学领域,其效用常表现为被社会机构作为有关政策、措施出台的依据,以及这些政策、措施实施后的结果;在人文学科,其效用则常表现为精神产品及其对人们思想、观念、社会风气、舆论等的产生的作用。由于此种评价包含着无限的过程,因此它是一种“进行时”加上“未完成时”。 目前人文社会科学的学术评价被诟病的主要原因在于,根据评价目的,应该精细评价的却进行简单、粗糙的评价;而应该简单评价的却人为复杂化。比如评价学者的成果质量及创新性,这是一种精细评价,不适合仅用粗糙的形式评价,不能因为工作量大或怕花工夫,不用或几乎不用更有意义的内容评价和效用评价。目前应用于人文社会科学的三种基本评价方法:文献计量方法、同行评议法和实践、时间最终评价法,大体可分别对应于形式评价、内容评价和效用评价。这三种学术评价都不同程度地包含定性定量评价,因此从定性还是定量的角度,很难说清文献计量方法、同行评议法和实践、时间最终评价法这三种方法的优劣和适当的使用范围,但用形式评价、内容评价和效用评价来解释则容易很多。 文献计量方法可以提供学科领域组织性、结构性较强的描述数据,弥补定性评价在内容上的局限。另外,它在成本和效率方面也存在优越性。但它毕竟是一种从评价对象的外在表现形式去进行分析判断的方法,尽管形式与内容有密切关系,但毕竟不是内容和效用本身。尤其人文社科评价对象的内容、效用又有许多特点,在某些情况下形式评价不能或不能完全反映这些特点。 由于许多反映内容、效用的指标还没有研究出量的表达形式,因此目前理想的评价方法应该是根据一定的评价目的选择适当的评价方法,该简单的评价就应简单,该复杂的就应复杂。一般说来,以引文分析方法为代表的形式评价可以作为基础,内容评价作为主体或核心,一定实践、时间内的效用评价为根本,对于一些特殊的例外情况,可以特别处理。 形式、内容和效用三种评价,或文献计量专家、人文社会科学的同行学者、社会公众(包括报刊、网络媒体)的三种评价可以形成人文社会科学评价的三角校正”关系,从而为得到公平、合理的评价提供帮助。因此,一般说来,以发表论著数、被引频次、影响因子、即年指标、期刊影响广度、地域分布、半衰期等多种指标进行的形式评价,是简单、粗糙的,但却是内容评价和效用评价这些精细评价的基础,对某些评价目的而言,可能就够了。对某些学科和评价对象,可以探讨对内容评价、效用评价的过程进行解析和规范,从而将专家主观定性的意见转化为可测量的结果。 匈牙利学者贝克(Beck)曾创造了一种测量标尺方法。他把科学认识论结构或科学思维模式分解为6个阶段:设立公理、建立定理、联结理论模型和现实、获得经验事实、探索性实践、程序性实践。依据这一思维模式建立的科学成果测量标尺有两个维度:阶段的强度;科学成果的有条件扩展。贝克用该标尺对40项成果进行了测量,结果说明,最精确的物理学和最不精确的人文社会科学,具有同样的认识论结构。该方法可以用来非常精当地评价任何一个学科的成果,因为它同时指向两个不同的方向:理论的深度和程序性实践”(即成果的成熟度). 由此可见,至少对某些评价对象,通过对专家评价意见的主成分的分解和量化,可以将主观定性的结论转化为可测度的定量分值,从而实现内容和效用评价的定量化,既弥补了以引文分析为主要手段的形式评价的不足,又尽可能地屏蔽专家进行内容、效用评价的低效、主观和不可消除的个人情感等干扰因素,将难以测度的专家的内容、效用评价进行规范和量化。但对某些对象,不能量化的绝不能偷懒图省事勉强量化,否则,差之毫厘,谬以千里。根据评价目的,该内容评价、效用评价的,工作量再大也得做。当然这种精细的评价,必须按照学术的逻辑和发展规律,确定恰当的评价时间周期,不能草率、频繁举行。一般说来,内容、效用评价每5年一次,重大精细的评价,以10年一个评价周期为好。比如,形式评价中的某些引文数据,有可能是人为制造或研究热点等原因所致,在内容、效用评价中,同行专家可以通过细致分析数据的来源加以确认,并做相应处理,从而获得校正性的合理评价。 5.评价标准及指标 所谓评价标准是指人们在评价活动中应用于对象的价值尺度和界限。评价的客观性因素是评价标准具有科学性的重要依据。评价标准是评价活动的关键、核心部分,是人们价值认识的反映,它表明人们重视什么、忽视什么,具有引导被评价者的作用。 评价的标准依赖于评价目的,即评价目的决定评价标准。评价理论性成果与评价应用性成果的标准就不一样。/在学术评价中,科学家用真和美的(标准)尺度去衡量不同的科学理论的价值,对它们作出比较和选择。哥白尼理论比托勒密体系具有更大的数学简单性和谐和感。评价科学理论的标准应该是:1.理论的可证伪程度较高;2理论经受检验的严峻程度较高。”°应用性成果则以应用理论、社会效益、社会舆论和风气为标准。 社会科学领域中的/价值”判断,一定程度上是见仁见智的事情,很难建立起一个公认的/客观”标准。而确立/客观、公正”的人文社会科学的评价范式或评价标准,又恰恰是形成具有较强认同感与公信力的多元化人文社会科学评价体系的关键性问题。不同学科的学术成果以及学术成果本身的学术性质都存在极大的差异,对此,学术评价标准理应有所区别,如果套用同一价值评价标准去评价所有的学术成果,那么学术评价就失去了存在的意义。 社会科学与人文科学有其不同于自然科学的特性,故其评价标准也有别于自然科学的评价标准,即是以社会效用作为其最高标准的。从这个意义上看,形式评价、内容评价和效用评价既可以是评价方法,也可以是评价标准。形式评价与内容评价实际上可以被看成是一种论证性评价。此类评价标准是逻辑标准,即评价对象是否得到学术界的认同及其所获认同程度的高低。效用评价也可以被看成经验性评价。此类评价标准是事实标准,具体表现为评价对象的实践情况。而人文学科的实践主要是指社会舆论,尤其是指人文学科学术共同体的舆论;社会科学的实践主要是组织实践,主要是决策部门主导的实践。 如果说评价标准是总的衡量尺度,那么评价指标可以看成是评价标准的细化。每一评价指标都是对评价对象某个或某些属性的概括,作为评价指标,它必须在质和量两方面都可以确定。 比如,引文量、获奖数等,既有明确的含义,又可以量化。有些指标有明确的含义,但目前很难量化,如声誉、创新程度、对学科的贡献度等,只能通过调查或专家直接用程度词来描述。这也就是内容评价和效用评价费时费力的一大原因。对于定性的指标,如评价成果,一般可从科学性、价值性、创新性、规范性四大方面设置指标。评价指标通常应是多指标,分层次的,次序由简到繁;指标有权重之别;各指标有约束条件;评价指标体系在逻辑上是自洽的;不宜太多或太少。 6评价制度 评价制度是有关部门制定的保证评价活动进行、要求有关人员共同遵守的规程,包括评价专家遴选制度、监督制度、评价对象申诉制度、评价结果公示制度、反馈制度、评价结果共享制度、第三方独立评价制度等。在评价制度的建设中,尤其应重视对评价目的、评价标准和指标等的规范化(订立成文的规范)和制度化(建立常规的制度),因为制度具有极严的强制性和约束力,是达到评价体系总体目标的保障。从层次上分,评价制度也可分为总体制度、一般制度和具体制度。 |