La historia de la evaluación de políticas públicas es relativamente reciente, ya que se puede hablar de un campo que se ha desarrollado en las últimas décadas, a pesar de que existen referencias sobre algunos trabajos de evaluación de la primera mitad del siglo XX. Concretamente, después de la Segunda Guerra mundial, la práctica de la evaluación de programas y políticas públicas se extiende al conjunto del mundo anglosajón y a la Europa del Norte, mientras que su desarrollo en los países latinos es más tardío. Tradicionalmente se individualizan tres grandes oleadas de difusión de la evaluación en las que se desarrollaron diferentes aspectos sobre la evaluación, algunos bastante opuestos, pero otros complementarios. Por otra parte, Derlien (2001) defiende la tesis de que desde los años 60 a los 90, el énfasis político sobre la evaluación ha pasado desde la función de información a la de reasignación. Se describen brevemente, a continuación, cada una de estas etapas de desarrollo.
Primer periodo: “Optimismo frente a los programas y optimismo frente a la evaluación” (1960-1970)
A partir de los años 60 empieza a hablarse en EE.UU., y un poco más tarde en Canadá, de la práctica de la evaluación, como una disciplina consolidada y actividad científica, surgida como respuesta a la preocupación por determinar los efectos de los programas de la Great Society[1], impulsados por el Presidente Johnson. Este primer movimiento de evaluación estuvo muy unido al proceso de planificación y programación y, por tanto, al papel de los administradores de los programas (Derlien 2001). El momento coincidió con un gran desarrollo de las ciencias sociales, lo que llevó a considerar las ventajas de medir los resultados de las políticas de reforma con métodos experimentales. Empezaba a emerger, aunque con menor intensidad, también en Europa, y fundamentalmente en aquellos países[2] donde existe un desarrollo importante de la política de bienestar social (Suecia o Alemania) o en conexión con los programas de ayuda internacional de la Organización de las Naciones Unidas (ONU) y varias de sus agencias (Instituto Navarro de Administración Pública 2011).
En este período, detractores y defensores de las políticas sociales se mostraron partidarios de la evaluación para obtener información sobre mejores resultados y costes. La función de información predominó durante la fase de despegue del movimiento de evaluación en los años 60 (Derlien 2001). Los defensores veían en la evaluación la posibilidad de legitimar y justificar el incremento del gasto público y los detractores buscaban argumentos en los que fundamentar su crítica, con el propósito de posponer su generalización o reclamar su eliminación. Durante este período, existen dos figuras relevantes (AEVAL 2010):
- La primera es la de Donald Campbell, psicólogo y sociólogo que mantenía que los programas políticos debían ser considerados como experimentos y que los políticos debían mantener una actitud experimental y desapegarse de los proyectos, una vez aplicados. De esta forma, buscaba que el experimentalismo académico ofreciera las respuestas sobre sus éxitos o fracasos. Bajo el enfoque de Campbell, evaluar es medir científicamente la eficacia de las intervenciones públicas observando la evolución de las variables de impacto a través de dos muestras estadísticamente comparables de beneficiarios y no beneficiarios. La experimentación fue favorecida por el sistema federal norteamericano, que permitió aplicar los programas en algunos Estados, controlando los resultados antes de su implementación a escala general. Este hecho condujo a un proceso de institucionalización de la evaluación con la creación de unidades de evaluación y la aprobación de normativa para regular la evaluación de las acciones públicas.
- Michael Scriven es la segunda figura importante de este período, para el que la lógica de la evaluación es completamente inversa a la que aplicaba el experimentalismo. Scriven no trata de ver si un programa se ha desarrollado como debía o si los objetivos se han alcanzado, sino de descubrir si el programa en sí es bueno o no. De esta forma, se empieza a pensar en términos de calidad y se busca atribuir un valor a los programas, intentando, a la vez, que sean los implicados los que aporten su idea de valor sobre las intervenciones.
Segundo Período: “Pesimismo respecto a los Programas y desencanto respecto a la evaluación (1970-1980)”
A finales de los años 70 e inicios de los 80, la evaluación es sistemática y generalizadamente aplicada en una gran mayoría de los países desarrollados. En este segundo período, la evaluación se ocupa principalmente de cuestiones de output y, en menor medida, del impacto. Es el caso del Reino Unido durante el mandato de Margaret Thatcher, de los Países Bajos o de Noruega. La mala situación económica fruto de la crisis del petróleo y la crítica situación fiscal promovió que la evaluación se hiciera por vía del proceso presupuestario. Por consiguiente, la perspectiva y la función de evaluación cambiaron ligeramente, puesto que en lugar de implementar programas, el énfasis se ponía más bien en la reducción de los programas ineficaces para, de esta forma, recortar el presupuesto nacional. (Derlien 2001).
EE.UU. sigue siendo el país con un mayor nivel de institucionalización. Es allí donde la función de evaluación se encuentra ya normalizada e integrada en el sistema político administrativo a través de unidades u organismos especializados, en el nivel ejecutivo, pues se cuenta con estructuras de evaluación en los departamentos y agencias públicas, pero sobre todo en el nivel legislativo con organismos fundamentales para el desarrollo de la evaluación, no solo a nivel de los EE.UU. sino también a nivel global: la General Accounting Office[3], el Congressional Research Service, la Congressional Budget Office y la Office of Technological Assessment (Instituto Navarro de Administración Pública 2011).
En esta etapa, la institucionalización de la evaluación es progresiva y empieza a considerarse limitada la creciente intervención pública experimentalista del período anterior. El pesimismo del título del epígrafe, se refiere a la sensación fruto de apreciar que los programas iniciados en el anterior período no han conseguido los logros que perseguían. Por ejemplo, no se consigue erradicar el desempleo en el breve espacio de tiempo que se esperaba; la rehabilitación de los guetos no es tan simple como se creía; y resolver el fracaso escolar es una tarea complicada. Ante este panorama, se concluye que hay efectos asociados a los programas y políticas que no se controlan, y así, comienza a considerarse la idea de los efectos perversos de las políticas públicas. Durante este periodo los evaluadores mantienen dos posiciones distintas (AEVAL 2010):
- La primera de ellas es la que orienta la investigación de Rossi y Freeman[4], que mantiene que el diseño de los programas o políticas es el que dificulta la evaluación de los mismos, pues se plantean unos objetivos demasiado difusos o genéricos. En este sentido, se detecta en ocasiones, una cierta incoherencia entre necesidades apreciadas, objetivos planteados y medidas adoptadas, de forma que la emisión de un juicio de valor válido resulta muy complicada, haciéndose necesaria una reformulación de las intervenciones para facilitar su evaluabilidad.
- La segunda posición, es la defendida por los llamados “naturalistas” que sostienen la necesidad de estudiar un programa en la realidad donde se desarrolla, sin buscar la generalización. Esta postura incide en el hecho de que el evaluador debería tratar de ver qué sucede en los programas, ayudar a las personas implicadas y responsables a expresar su juicio sobre la intervención, evaluar y negociar con las diversas partes interesadas dinamizando el proceso y no mantenerse al margen, externos al sistema, sin ensuciarse las manos.
La función de evaluación predominante en los años 80 durante la segunda etapa de institucionalizaciones estaba destinada claramente a ayudar a realizar una asignación racional del presupuesto. Ahora, los actores principales no son ya los administradores de los programas, sino las oficinas auditoras, los Ministerios de Hacienda y las unidades centrales, a quienes les compete la elaboración global del presupuesto y su estructura interna (Derlien 2001).
Tercer Periodo: “Institucionalismo, pluralismo y evaluación”
El final de los años 80 e inicio de los 90, con las presidencias de Reagan y Bush, es un período en EE.UU., que en cuanto a evaluación se refiere, se caracteriza por el fortalecimiento del proceso de institucionalización de la evaluación al crearse un instituto específico para la evaluación dentro de la General Accounting Office que posteriormente, se reorganiza en la División de Evaluación de Programas y Metodologías. A pesar de ello, el problema de los efectos perversos de los programas se agudiza, concluyéndose que los resultados no son los esperados, con lo que los parlamentarios empiezan a solicitar evaluaciones sobre los aspectos negativos para decidir sobre los recortes de gastos. Se constata la complejidad de los programas, al estar compuestos por diversas partes cuyos resultados pueden ser muy desiguales, por lo que se busca analizar el mérito de las acciones singulares para entender, en cada caso, qué es lo necesario (AEVAL 2010).
Por otra parte, en los 90 se inicia en Europa una oleada de evaluaciones motivada, fundamentalmente, por la obligación reglamentaria de realizar evaluación de los programas cofinanciados con Fondos Estructurales, fruto evidentemente de la preocupación de los países más desarrollados, que transfieren rentas a los menos desarrollados, por conocer los resultados que se consiguen con la aplicación de los Fondos de Ayuda[5]. Esta obligación supuso un impulso determinante para la implantación de la evaluación en los países miembros, donde comienzan a aparecer evaluaciones de programas de ámbito regional y local, razón por la que la evaluación ha estado, y sigue estando en la actualidad, fuertemente vinculada a proyectos europeos (Instituto Navarro de Administración Pública 2011).
[1] Precisamente en enero de 2014 se conmemoraron en EE UU los 50 años de la política contra la pobreza del presidente Lyndon B. Johnson, que fue creador del seguro de salud para los ancianos (Medicare) y para los pobres (Medicaid), de las ayudas federales para la educación y de una política de la vivienda de bajo coste. Johnson defendió la construcción de una gran sociedad (The Grat Society) en una nación donde la igualdad de oportunidades y una alta calidad de vida fueran el patrimonio de todos (Estefanía 2014).
[2] Según Derlien (2001) el primer grupo de países que impulsó la evaluación de políticas durante los años 60 eran “países con una situación económica próspera y con presupuestos en crecimiento que permitían a los gobiernos embarcarse en costosos programas de intervención social, incluyendo educación y salud. En este contexto surgieron sistemas formales de planificación que, o estaban limitados a una planificación económica a medio plazo (República Federal Alemana) o, intentaban integrar el presupuesto con la programación (EE.UU., Suecia y Canadá)”.
[3] La General Accouting Office cambió posteriormente su nombre por el de Government Accountability Office, lo que significó un cambio también en el enfoque de su actuación. En otras entradas se hablará sobre este organismo.
[4] El manual de estos autores “Evaluation: A Systematic Approach”, representó por muchos años el texto fundamental para ayudar a los políticos a reformular los programas y a evaluar sus diversas fases.
[5] Se trata de algo similar a lo que ocurre en el seno de las organizaciones internacionales de fomento del desarrollo, tal y como se comprobará en siguientes entradas.