在社会行为科学的研究里,同一个或类似的研究假设常常会在不同的研究中被直接或间接地探讨。例如,两种不同的心理治疗方法是否在改善或治愈忧郁症的效果上有所不同;或者,两种不同的阅读教学方式是否在帮助阅读困难学生的阅读上有不同的成效。而因为抽样与测量上的变异(误差),不同的研究往往会得出不完全一致、有时甚至相反的结果。当我们在综理这些文献中的研究时,习惯上都是以每个研究的统计推论的决定(某个效果是否显著、某个研究假设是否得到支持)作为结果,进行综合分析与评断。然而统计推论所做的决定是根据手边掌握证据的强度(几率)所做的暂时性判断,有其任意性(因为这个判断会受到研究者主观上愿意接受多大的犯错风险所影响),并不能视为研究的结果。量化的研究结果其实是数据本身(raw data)、或依数据所计算出来的统计数(平均数、标准差、比较所得的t,F,r,χ2之类的统计数、或其对应的几率)。如果我们将同一个研究假设的不同研究,视作重复多次的相同研究,并且假定每一次重复时都会有一定的随机误差(抽样上的、测量上的),那么各研究的结果会有不一致的情形是可以理解及预期的。研究间结果上的不一致不一定是有系统的因素造成的,有可能只是随机的因素造成的。如果是后者,其实我们可以把这些研究的结果加以合并(平均),合并的结果会有更高的可信度(因为样本大大地增加了),当然也就能据以下一个比较肯定的结论。当然,如果我们怀疑有一些非随机的因素导致研究之间结果的不同,那么我们也可以检视这些非随机因素所造成的变异是否显著地大于随机因素所造成的变异。以上的做法是一种量化的文献综理方法,也就是所谓的整合分析(meta-analysis)。