Durante a fase de avaliação da política pública, qual é a principal vantagem da avaliação externa?

Ainda que seja amplamente discutida no Brasil e no mundo, a expressão “política pública” assume diversos significados. De acordo com ), países de língua latina apresentam dificuldades para distinguir dois termos da língua inglesa: politics e policy. Para ), o primeiro se refere a um conjunto de atividades humanas atinentes à polis ou ao Estado; e, conforme , o segundo denota algo mais concreto, que tem relação com ações e decisões. Assim, a “política pública” se alinha ao significado de policy, ou seja, diz respeito ao processo de construção, atuação e decisão política. Pode-se dizer que a política pública está intimamente ligada a ações estatais, porém, existem outras correntes de pensamento que indicam um cenário multicêntrico (). Na abordagem multicêntrica se constrói uma rede de políticas públicas (policy networks) conformada por atores governamentais, organizações privadas e não governamentais e organismos multilaterais (; ). Sob o ponto de vista conceitual, além de envolver diversos atores na formulação ou implementação, as políticas públicas são multidisciplinares e repercutem na economia e nas sociedades (; ). Tendo em vista as definições supracitadas, infere-se que o estudo da política pública é um fenômeno complexo com multiplicidade de atores internos ou externos ao Estado (). Desse modo, a busca por processos analíticos é um caminho para diminuir a complexidade do objeto e simplificar as análises. Para tanto, estabeleceu-se a divisão em etapas, sob a égide do ciclo político (policy cycle) e em relação às diversas fases do processo político dispostas de forma sequencial e interdependente (; ; ). Dentre os formatos observados na literatura, optou-se por descrever as resoluções aplicadas de problemas e os estágios correspondentes ao ciclo político, com base em ) e - o sintetiza essas conexões.

Durante a fase de avaliação da política pública, qual é a principal vantagem da avaliação externa?

Quadro 1
Resolução aplicada de problemas e sua relação com o ciclo político
1Estudos sobre a extinção de políticas públicas começaram a ter destaque nos países desenvolvidos na década de 1970. Eles realizavam diversas ações sociais vinculadas ao Estado de bem-estar, postas em xeque devido à resolução de um problema específico: a ineficiência da ação ou a perda de importância e saída da agenda política (). Fonte: Elaborado pelas autoras.

Por se tratar de um campo holístico com vários desdobramentos, este estudo se propõe a analisar especificamente o processo histórico de estruturação da etapa do ciclo político denominada avaliação. Dada sua importância conceitual, metodológica e de desenvolvimento, a avaliação de políticas, programas ou processos públicos se insere na agenda de pesquisa contemporânea como ferramenta essencial para o aperfeiçoamento das políticas públicas em todas as esferas de governo e no cenário global. A Organização das Nações Unidas (), o Banco Mundial, o Banco Interamericano de Desenvolvimento (BID), a Organização para a Cooperação e o Desenvolvimento Econômico (OCDE), a Comissão Econômica para a América Latina e Caribe (Cepal) e o Centro Latino-Americano de Administração para o Desenvolvimento (Clad) surgem como protagonistas na geração de metodologias e projetos avaliativos ().

O uso efetivo de processos avaliativos pode contribuir com a transparência dos atos públicos, bem como apresentar aos cidadãos formas de controle e acompanhamento das ações governamentais, garantindo, assim, a legitimidade das políticas ou programas desenvolvidos (; ; ; ; ). Contudo, vale ressaltar que, por ter um caráter político, as avaliações podem contribuir com a manutenção ou não de determinada política, por vezes atrelada às proposições e estratégias das partes envolvidas (; ; ).

) pontua que a avaliação apresenta alto grau de complexidade e especificidade, fatores que elevam a dificuldade na incorporação da atividade avaliativa no dia a dia dos gestores, já que existem múltiplos atores, objetivos, causas, efeitos e desfechos. Nesse sentido, para contribuir com o debate sobre avaliação de políticas públicas, este artigo destina os próximos tópicos ao resgate histórico do estudo da avaliação, além do detalhamento dos modelos, tipos e metodologias existentes na literatura e as tendências internacionais recentes inseridas nessa discussão. Para a construção deste ensaio teórico, optou-se por busca avançada nas seguintes bases de dados: SCOPUS, Web of Science, Google Scholar, SciELO, Banco de Teses e Dissertações da USP, BVS e Portal de Periódicos da Capes. As principais palavras-chave da investigação foram: “políticas públicas”; “avaliação”; e “avaliação de políticas públicas”. Não obstante, tal busca também resultou em ampliação da literatura por meio dos artigos analisados.

REVISÃO TEÓRICA

A literatura considera como marco de proliferação de estudos avaliativos o final da década de 1950. De acordo com ), o processo histórico dos estudos sobre avaliação no contexto global pode ser dividido em quatro ondas de difusão. Cada onda é indicada por um período de tempo e moldada de acordo com questões sociais, políticas e econômicas. A construção dessa metáfora remete à constante renovação do cenário decorrente do movimento repetitivo das ondas e do constante depósito de sedimentos para a criação de uma base (). Utilizando esse enquadramento teórico, opta-se por descrever a evolução dos estudos avaliativos usando a concepção das ondas de difusão de .

A primeira onda, ou fase de difusão dos estudos de avaliação, remonta ao final da década de 1950, com consolidação em meados de 1960 (; ; ; ), e é caracterizada como “a onda orientada para a ciência” (). Os estudos pertencentes a esse recorte de tempo estão atrelados ao surgimento do Welfare State, principalmente nos países com aspirações reformistas naquele período, destacando-se: Estados Unidos da América (EUA), França, Alemanha, Suécia e Canadá (; ; ).

Os principais objetivos dos estudos dessa fase eram acompanhar e analisar os resultados das políticas implementadas; ) atribui a esse conjunto de estudos a função de informação. Trata-se de avaliações com o intuito de averiguar os efeitos e resultados decorrentes da política ou programa, bem como identificar possíveis consequências positivas ou negativas. Esses estudos também tinham por objetivo verificar pontos a melhorar e apontar falhas recorrentes (). “O foco era a melhoria dos programas, e os gerentes tinham interesse em usar a avaliação como mecanismo de feedback” (, p. 537). Para ), foi nesse período que as avaliações emergiram de um contexto de racionalidade radical; a estrutura do pensamento avaliativo foi pautada pela noção de “cientifização” dos processos de política pública e da administração pública. A avaliação traria ao governo ares de racionalidade com arcabouço científico e baseado em fatos (; ; ). Em seu artigo sobre reforma no setor público, ) reforça a racionalidade descrita por e confirma a função de informação proposta por , afirmando que, se o uso da avaliação é orientado à ação, ela deve concentrar-se em fornecer conhecimento utilizável. Para o autor, é muito mais provável que a avaliação seja aceita se seu aspecto de informação for ressaltado ().

O segundo período de tempo, ou segunda onda descrita por ), denominada “onda orientada ao diálogo”, configura-se em meados da década de 1970, em um contexto no qual pesquisadores argumentavam que as avaliações deveriam ser mais pluralistas, impulsionados por ideais progressistas (; ).

Discute-se a inserção de todos os atores envolvidos na intervenção a analisar, desde pesquisadores e políticos até operadores da política ou programa em questão (). ) destacam o crescimento do uso de pesquisas qualitativas nesse período, modelo convergente ao pensamento inclusivo da época, justificando seu uso baseado nos custos menores dessas pesquisas em nível local e com maior utilidade e flexibilidade para os gestores. Tais modelos avaliativos suportariam melhor a abrangência participativa e trariam maior contato com a realidade (; ). Sintetizando as características dessa onda, , p. 270, tradução nossa) explica que, “em contraste com a onda induzida pela ciência, a onda orientada ao diálogo repousou sobre racionalidade comunicativa. Em vez de produzir verdades, a avaliação dialógica faria gerar amplos acordos, consensos, aceitabilidade política e legitimidade democrática”.

Por outro lado, a terceira onda, denominada por ) “onda neoliberal”, introduzida no início da década de 1980, modificou mais uma vez o padrão dos estudos de avaliação. Vedung (2010) e ) descrevem esse período como uma inundação neoliberal no campo de estudos avaliativos, com foco em redução do Estado e promoção do livre mercado e de parcerias público-privadas. Nos EUA, as novas concepções avaliativas acompanharam o desmonte dos programas sociais promovido por Ronald Reagan (). O modelo de gestão emergente era o New Public Management (NPM), com maior focalização nos resultados em relação aos processos. , p. 270, tradução nossa) complementa argumentando que “descentralização, desregulamentação, privatização, a sociedade civil e, em particular, orientação ao cliente se tornaram novos slogans. Anteriormente considerado a solução para os problemas, o setor público se tornou o problema a ser resolvido”. ) atribui a essa onda a função de mapeamento e os estudos se concentram em diagnosticar as políticas ou programas que podem ser cortados a partir de resultados negativos apresentados e de levantamentos das consequências da privatização de certas funções ou atividades do Estado; busca-se a eficiência financeira na condução de políticas e programas públicos ().

Em contribuição, indicam que, nessa fase, a avaliação foi entendida como ferramenta capaz de justificar políticas e realocar recursos financeiros. No âmbito governamental, os avaliadores se concentram no Ministério da Fazenda e em órgãos de auditoria. Em conclusão, ) sintetiza que as atividades avaliativas da terceira onda se voltaram principalmente a prestação de contas, medição de desempenho e consumo, busca pela qualidade dos serviços prestados e avaliações comparativas.

Em continuidade, a quarta e última onda descrita por ) é denominada “onda da evidência: o retorno da experimentação”. Essa onda de estudos avaliativos tomou corpo nas décadas de 1990 e 2000, principalmente em países do Atlântico Norte e nos países nórdicos. Trata-se de estudos baseados em evidências e, nesse sentido, ) enfatiza que os envolvidos em estudos de avaliação estão “surfando” essa quarta onda. Os estudos focalizados na evidência científica almejam separar o que funciona do que não funciona (; ).

Os autores destacam que estudos com abordagens experimentais, com uso de randomização (grupos controle e tratamento) ou quase experimentais, têm por objetivo principal a verificação dos impactos causados pela política ou programa público (; ). Complementarmente, ) retomam o conceito de avaliação que busca entender e conhecer as consequências de uma ação, bem como antecipar seus possíveis resultados. Nesse entremeio, organismos internacionais, acadêmicos e governos começaram a realizar revisões sistemáticas da literatura, com o intuito de fortalecer as bases da pesquisa, garantindo maior racionalidade ao processo. ) classifica esse movimento de busca incessante por provas científicas como um retorno ao modelo baseado na ciência, porém, com nova roupagem. Na visão de , p. 107, tradução nossa), a avaliação nesse momento tem a função de legitimação: “acredita-se que a evidência científica justifica decisões políticas, seja para melhorar, reduzir ou eliminar os programas”.

Diante do panorama internacional apresentado, mostra-se necessário um recorte geográfico para a discussão sobre o campo de estudos de avaliação no Brasil. Diferente dos países de grande tradição na avaliação de políticas e programas públicos, o Brasil entrou tardiamente nessa fase do ciclo político. De acordo com , p. 90, tradução nossa):

Apesar do que foi falado e conforme publicado sobre a importância dos processos de avaliação, ainda é incomum encontrar programas ou políticas sociais na América Latina que têm um rigoroso processo de avaliação sistemática incorporado em processos diários de gestão e tomada de decisão.

A preocupação em avaliar políticas ou programas públicos é algo recentemente incorporado à agenda política, dado que a prioridade dos gestores era canalizada para o processo de formulação de políticas, com pouca ênfase às outras etapas do ciclo (; ; ). Essa incorporação se reporta a meados da década de 1980, após a experiência de reformas estruturais no aparato estatal propostas em várias partes do mundo, com o intuito de reduzir os custos do governo e torná-lo mais eficiente (). Tem-se, então, uma utilização maior e menos fragmentada da avaliação no Brasil apenas no decorrer da terceira onda descrita por ) ou durante a função de legitimação proposta por ).

Por outro lado, a adoção de práticas avaliativas em países como o Brasil visam a fortalecer os arranjos institucionais e proporcionar aos gestores a análise das políticas adotadas (). Em seu estudo, ) compararam os estudos avaliativos realizados no Brasil e nos EUA, com o intuito de apresentar o grau de estabelecimento desse tipo de pesquisa nos países; como resultado, tem-se que, diferente dos EUA, a área de pesquisa em avaliação não está totalmente estabelecida no Brasil, ainda que haja um esforço por parte dos pesquisadores para alterar esse quadro.

Acredita-se que, no caso brasileiro, as bases de dados públicas disponíveis apresentam problemas de confiabilidade (algumas apresentam dados declarados), dados indisponíveis e descontinuidade na produção de indicadores; tais fatores podem contribuir com a baixa adesão a estudos avaliativos quantitativos. Assim, as avaliações no país estariam entre a segunda onda proposta por ), com maior quantidade de avaliações qualitativas de caráter local e análise de políticas especificas, e a terceira onda, voltada principalmente a prestação de contas, medição de desempenho e busca da qualidade dos serviços prestados.

De qualquer modo, é oportuno frisar que existe, no meio acadêmico, o fortalecimento do estudo da avaliação para buscar as melhores práticas e teorias, contribuindo de modo substancial com a criação de uma “cultura” avaliativa capaz de abarcar a complexidade e as especificidades de cada política ou programa em questão (; ).

A trajetória de evolução dos processos avaliativos no Brasil e no mundo facilita a compreensão de que não há um único método ou padrão definido na atualidade. Percebe-se a multiplicidade de abordagens e metodologias abrangendo um amplo leque de opções. Partindo do pressuposto de que as avaliações não são iguais, ) e ) sugerem a descrição das diferentes formas de avaliação segundo uma série de critérios, tais como: uso, tempo, objetivos, quem realiza, a quem se destina, qual é o desfecho esperado, dentre outros. ) denominam a variedade de conceitos e metodologias dos estudos de avaliação um emaranhado conceitual. Os autores indicam que o conhecimento de diversas alternativas teóricas contribui sobremaneira para a escolha do método mais adequado para cada tipo de política ou programa a ser avaliado.

Segundo ), pode-se apontar ao menos quatro tipos de uso para a avaliação: instrumental; conceitual; persuasivo; ou de esclarecimento. O uso instrumental remete à importância da qualidade e à adequada divulgação dos resultados alcançados, para tornar a avaliação algo palpável e factível de empregabilidade. ) acrescenta que o uso instrumental da avaliação pode orientar os decisores, pois possibilita uma retomada à história do programa analisado, fornece feedback aos praticantes da avaliação e também confere destaque aos objetivos estabelecidos para o programa.

O segundo uso, denominado conceitual, é aplicado frequentemente aos que não têm contato direto com a formulação do programa (técnicos locais); trata-se, pois, de fornecer informações a respeito da política ou programa, apresentar sua natureza e operação, bem como introduzi-lo aos impactos e resultados conquistados (). Pode-se afirmar que o principal objetivo do uso conceitual é a aprendizagem proporcionada aos atores; a esse respeito, , p. 127, tradução nossa) reforça que, “em resumo, a avaliação permite enriquecer os processos de gestão com uma aprendizagem dinâmica. Longe de ser um monstro diabólico, então, a avaliação pode ter uma nova imagem, a de um aliado da guarda”. Complementarmente, ) indicam que a aprendizagem pode ser potencializada quando os técnicos participam de modo ativo no processo de avaliação.

Em continuidade, o terceiro uso, denominado persuasivo, descrito por , p. 103), “dá-se quando ela é utilizada para mobilizar o apoio para a posição que os tomadores de decisão já têm sobre as mudanças necessárias na política ou programa”. A avaliação, nesse momento, tem a função de legitimar as mudanças desejadas e conquistar novos apoiadores para esse movimento. Por fim, o uso de esclarecimento é proposto como decorrente do acúmulo de conhecimento oriundo de várias avaliações já realizadas () e torna-se capaz de pautar a agenda governamental. ) afirma que a maturação de um novo paradigma de gestão, voltado a práticas avaliativas, pode ser um aliado na incorporação da avaliação como processo natural e gradual para a consecução dos objetivos propostos.

Para embasar a diferenciação entre os vários momentos da avaliação, ) a dividem em: avaliação ex ante e avaliação ex post.

As avaliações ex ante são as realizadas antes da tomada de decisão e pode-se dizer que têm por finalidade auxiliar na tomada de decisão quanto à implementação de políticas ou programas sociais (; ). Ademais, ) afirmam que, nesse tipo de avaliação, gera-se um diagnóstico sobre a situação observada, contribuindo com a adequação dos recursos disponíveis aos objetivos propostos (verificação de viabilidade), também podendo servir como ferramenta de direção para a manutenção e/ou formulação das políticas ou programas.

Já a classificação ex post indica que as avaliações são realizadas durante a execução de um projeto ou ao seu final. Quando a avaliação se refere ao momento intermediário (avaliação de processos), as conclusões podem basear decisões de continuidade ou descontinuidade de determinada política ou programa (; ; ; ). Já em relação às avaliações terminais (que medem impacto e resultado, por exemplo), as avaliações ex post fornecem informações concernentes à experiência alcançada e podem subsidiar futuras decisões sobre a mesma política ou programa ou, ainda, contribuir com a construção de um modelo avaliativo para outro objetivo ou experiências semelhantes (; ; ; ). Com base na literatura, pode-se inferir que as avaliações ex post são mais difundidas tanto no meio acadêmico quanto em aplicações práticas; assim, apresentam metodologias mais sedimentadas e sofisticadas.

Do mesmo modo, ) define dois termos para os momentos de avaliação: avaliação formativa e avaliação somativa.

A avaliação formativa se assemelha à função da avaliação ex post intermediária, sendo conduzida durante o processo de implementação ou desenvolvimento do programa, e tem como desígnio fornecer uma leitura analítica aos tomadores de decisão.

Já a avaliação somativa é dirigida após a conclusão do programa (ex post terminal), proporcionando aos gestores e usuários um julgamento do valor geral do programa (; ). Sob o mesmo ponto de vista, Ramos e Schabbach argumentam que a classificação das avaliações feitas por ) também apresenta conexões com a natureza de uma avaliação, podendo ser de formação de um programa (avaliações formativas) ou para a análise e produção de informações (avaliação somativa). ) argumenta que a simplicidade proposta na definição de não diminui o alcance dos propósitos avaliativos, mas produz informações que contribuem com a modificação ou manutenção do programa.

No tocante à classificação da avaliação sob a ótica de quem a realiza ou dela participa, pode-se afirmar que há consenso na literatura quanto à distinção em quatro tipos: avaliação externa; avaliação interna; avaliação mista; e avaliação participativa. Primeiro, ) alertam que avaliações realizadas por pessoas alheias à organização tendem a enfatizar o método aplicado em detrimento do conhecimento específico à área em que a política ou programa se desenvolve. ) contribui com a discussão informando que avaliações externas agregam isenção à prática avaliativa, porém, o avaliador externo tem maiores dificuldades de acesso aos dados. Em complementação, pode-se citar como vantagem a maior objetividade dos avaliadores externos, por não participarem dos processos internos, além da possibilidade de comparação com programas semelhantes (; ). Na visão de ), em seu artigo sobre reforma no setor público, as avaliações externas podem desempenhar um papel crucial na tomada de decisão; o autor cita o caso da Grécia, que realizou avaliações externas para a tomada de decisão em relação aos fundos estruturais da União Europeia.

Em referência às avaliações internas, as vantagens apresentadas pela literatura versam sobre: a diminuição dos conflitos gerados pela inserção de pessoas ou organizações externas; a possibilidade de revisão e aprendizagem quanto aos processos executados em determinada política ou programa; o maior conhecimento teórico e técnico das especificidades avaliadas. Todavia, as avaliações internas se arriscam a perder objetividade e conclusões parciais, já que são desenvolvidas pelos envolvidos na formulação e implementação do programa analisado (; ; ; ; ).

Em seguida, tem-se a avaliação mista, que combina os dois modelos descritos. Basicamente, o objetivo da avaliação mista é somar esforços e garantir a sinergia entre os atores envolvidos na ação. Combinam-se, então, as potencialidades de cada um dos modelos e diminuem os impactos ou vieses apresentados individualmente (; ).

Por fim, apresenta-se a avaliação participativa, que tem por principal objetivo diminuir a distância existente entre os organizadores e produtores da avaliação e os beneficiários das políticas ou programas avaliados. Permite-se, nesse modelo, a participação dos usuários em todas as fases do ciclo político, favorecendo a opinião e atendendo às demandas específicas desses atores (; ). Para ), a avaliação participativa deve considerar as prioridades e os efeitos e estabelecer as definições comuns tanto para avaliadores quanto para beneficiários.

O autor descreve alguns passos para tornar a avaliação participativa viável, como: realização de sessões interativas para discussão dos aspectos da avaliação; discussão e modo de utilização das prioridades, finalidades e definições; e proposta de modelo avaliativo ideal que supra todas as condições expostas nas etapas anteriores (). Em complemento, ) expõe a importância da avaliação participativa, já destacada, capaz de fortalecer os laços entre os envolvidos, colaborando com a manutenção da prática avaliativa democrática. No entanto, deve-se levar em conta a dimensão da política ou programa avaliado; a esse respeito, ) sugerem que as avaliações participativas funcionam de modo adequado apenas em pequenos projetos ou programas locais. Por sua vez, , p. 89) argumenta que:

De fato, tratando de unidades mais delimitadas (uma instituição ou um programa), a avaliação participativa torna-se procedimento rico, dado que sua realização é partilhada com os agentes e beneficiários envolvidos (no programa ou instituição), permitindo para além da avaliação uma apropriação reflexiva e socializada entre os diversos sujeitos da ação em movimento.

Salienta-se, portanto, que a avaliação participativa promove a incorporação dos sujeitos na tomada de decisão e favorece a aprendizagem social e a cidadania (). ) destacam que os burocratas não devem trabalhar de modo isolado, pelo contrário, a avaliação é uma ferramenta de transparência dos atos públicos e os cidadãos podem e devem informar-se e fiscalizar as ações promovidas pelos atores políticos.

No tocante à abordagem, as avaliações podem ser classificadas em qualitativas, quantitativas e de métodos mistos. Sinteticamente, ) classifica pesquisas qualitativas como aquelas que se apresentam em palavras e as quantitativas, em números. O autor complementa afirmando que avaliações quantitativas coletam dados e transformam-nos em informações numéricas, fortemente apoiadas por estatística, métodos matemáticos e econométricos. As abordagens quantitativas podem utilizar ferramentas sofisticadas na análise de dados, que identificam relações entre uma ou mais variáveis, e podem englobar um universo amostral de grande porte, além de fornecer informações sobre a extensão e distribuição de um fenômeno (). Por outro lado, as avaliações qualitativas tendem ao uso de ferramentas com menor estruturação, tais como entrevistas, técnicas observacionais e análise documental (). , p. 29) sustenta que:

A avaliação tem que ser trabalhada com visão ampla, orientada por um julgamento de valor, algo eminentemente qualitativo, focalizada sobre processos complexos, em que os elementos em interação nem sempre produzem manifestações mensuráveis, podendo, inclusive, alguns desses elementos, não apresentar atributos quantificáveis.

) afirmam que, para pesquisas sociais, como é o caso do estudo das políticas públicas, a abordagem qualitativa apresenta vantagens, pois tem a capacidade de promover aproximação com a realidade e é flexível para contemplar a complexidade que envolve tais políticas. ) faz alusão às grandes discussões existentes nos setores sociais que colocam as abordagens qualitativas e quantitativas em diferentes lados de uma mesma arena. Trata-se de uma competição exagerada sobre qual método é o mais eficiente, eficaz ou efetivo. Atribuem-se a essas diferenças os motivos de, em parte, as avaliações não serem institucionalizadas como rotina da prática administrativa.

Em relação aos resultados, grande parte da literatura nacional e internacional discute as vantagens e desvantagens de cada abordagem, porém, há crescente aceitação de que a integração entre elas é melhor saída para os embates teóricos (). As diferenças entre as abordagens geram oportunidades de complementação, agregando as similaridades e aumentando a sinergia entre as partes (). É nessa seara que se insere a abordagem de métodos mistos, que nada mais é do que a combinação entre avaliações qualitativas e quantitativas. , p. 114, tradução nossa) argumenta que, “em particular, a avaliação pode ser aplicada a métodos quantitativos e qualitativos também para gerar tipos diferentes informação que, em conjunto, correspondem às diferentes questões propostas pelo processo de avaliação”.

) estabelece as competências de um avaliador e assinala a utilização de métodos mistos, argumentando que o avaliador deve apresentar domínios qualitativos básicos, como utilização de questionário e métodos observacionais. Também é necessário o controle da polarização entre as abordagens, para combinar tais testes práticos, procedimentos de medição, avaliação de julgamento e narrativa e técnicas de estudo de caso. Por conseguinte, ) afirmam que o uso de métodos mistos colabora com o emprego das melhores fontes de dados disponíveis, com o intuito de fornecer respostas abrangentes e robustas. Contudo, os autores apresentam como limitações para o uso de métodos mistos o tempo, os recursos e o compromisso de edificar os aspectos pragmáticos da avaliação (). ) acrescentam que a pesquisa quantitativa leva a uma generalização de resultados conformada por informações padronizadas. Em contrapartida, a pesquisa qualitativa provavelmente fornecerá dados relativos a circunstâncias e ambientes sociais, creditando destaque às dimensões culturais e contextuais.

Considerando a metodologia aplicada à avaliação, ) agrupam as avaliações em: avaliação de processo; avaliação de metas; e avaliação de impacto. Quanto à avaliação de processo, segundo , p. 980):

Seu objetivo é detectar possíveis defeitos na elaboração dos procedimentos, identificar barreiras e obstáculos à sua implementação e gerar dados importantes para sua reprogramação, através do registro de eventos e de atividades. Assim, o uso adequado das informações produzidas durante o desenvolvimento do programa permite introduzir mudanças no seu conteúdo durante a própria execução.

Com propósitos semelhantes aos da avaliação formativa descrita por ), a avaliação de processos averigua de modo sistematizado a evolução das políticas ou programas, bem como acompanha seus processos internos. Seus usos permitem contemplar o conteúdo do programa, a relação entre o que foi planejado e o que vem sendo executado, o alcance dos usuários-alvo e o sucesso ou fracasso na entrega correta dos benefícios (; ).

Em prosseguimento, tem-se a avaliação de metas, descrita por ) como a mais tradicional entre as metodologias de avaliação. Ela visa a “medir o grau de êxito que um programa obtém com relação ao alcance de metas previamente estabelecidas” (, p. 979). Pode-se considerar esse tipo de avaliação como uma avaliação ex post, pois requer que o programa tenha sido concluído para avaliá-lo (). ) apresentam uma conceituação diferente, denominada avaliação de resultados, porém, com objetivos similares à avaliação de metas; nesse contexto, medem-se os efeitos e as consequências de dada política, determinando seu sucesso ou fracasso com base em mudanças efetivas nas populações beneficiadas.

A avaliação, uma vez considerada como forma de mensurar o desempenho de políticas ou programas, sendo tal desempenho o alcance de metas () ou a avaliação dos resultados (), necessita de critérios para se estruturar e, por fim, mensurar a consequência contraída (). Desse modo, prevalecem três dimensões básicas para mensurar os resultados obtidos (; ; ):

  • Eficiência: de origem econômica, significa atingir os objetivos do programa, priorizando as normas estabelecidas, com a menor relação custo-benefício possível;

  • Eficácia: mede o grau em que as metas e os objetivos foram alcançados, traduzindo de modo simplificado o resultado atingido;

  • Efetividade: também tratado na literatura como medida de impacto, indica os efeitos positivos relacionados ao público-alvo do programa. É uma dimensão mais ampla, pois analisa os aspectos econômicos, socioculturais, ambientais e institucionais, ou seja, a efetividade mede tanto a quantidade quanto a qualidade das metas alcançadas pelo programa.

No encadeamento de ideias, ) e ) concordam na última definição proposta: a avaliação de impacto. Infere-se, portanto, que avaliação de impacto abrange não apenas os resultados alcançados em termos de eficiência, efetividade e eficácia, mas também as alterações ocorridas na população-alvo em decorrência da implantação da política ou programa avaliado. , p. 113) acrescenta que:

A diferença entre a avaliação de resultados e avaliação de impacto, portanto, depende eminentemente do escopo da análise: se o objetivo é inquirir [acerca dos] efeitos de uma intervenção sobre a clientela atendida, então, trata-se de uma avaliação de resultados; se a intenção é captar os reflexos desta mesma intervenção em contexto mais amplo, então, trata-se de uma avaliação de impacto. Ou, dito de outra forma, a avaliação de resultados visa [a] aferir os resultados intermediários da intervenção, e a avaliação de impacto, seus resultados finais.

Pode-se relacionar a avaliação de impacto com a avaliação somativa proposta por ), que é realizada ex post à realização do programa ou projeto. Em síntese, esse modelo avaliativo recorre a estruturas metodológicas que forneçam relações de causa e efeito entre as ações desempenhadas pelo programa e os efeitos promovidos na comunidade-alvo (; ). Para tanto, é necessário o acompanhamento de duas diretrizes apontadas por ): a) os objetivos devem ser definidos para comportar a identificação de metas mensuráveis; e b) a implementação da política ou programa deve ser no mínimo satisfatória, para suportar uma avaliação de impacto sem vieses ou até inviabilizá-la.

Vale ressaltar, ainda, a importância dos desenhos e desfechos investigativos para cada um dos tipos de avaliação: de processo, metas/resultados ou de impactos, em função do problema que ela responde. Diante dessa necessidade, o descreve, sem a pretensão de esgotar, cada um dos desenhos e desfechos apresentados na literatura (; ; ; ; ; ; ; ; ).

Durante a fase de avaliação da política pública, qual é a principal vantagem da avaliação externa?

Quadro 2
Descrição dos desenhos e desfechos investigativos
Fonte: Elaborado pelas autoras.

Em conclusão, diante da variedade e complexidade das aplicações, métodos, ferramentas, abordagens, momentos e atores envolvidos no processo de avaliação, a próxima seção explora as tendências internacionais acerca da evolução dos estudos de avaliação, com o intuito de relacioná-los sob o ponto de vista dos tipos, metodologias e desfechos.

TENDÊNCIAS NACIONAIS E INTERNACIONAIS RECENTES

Diante de cenários cada vez mais complexos e turbulentos, as tendências mundiais convergem para a estruturação e o fortalecimento de ações internacionais de avaliação, apoiadas por órgãos governamentais, agências independentes, organizações multilaterais e organizações da sociedade civil. É claro o entendimento das partes que atividades avaliativas são importantes para a boa governação e podem contribuir com o avanço de políticas públicas sociais mais efetivas, eficazes e eficientes (; ). Para tanto, este tópico mapeia, sem a pretensão de esgotamento, as ações desenvolvidas e apresenta ações levadas a cabo por organismos internacionais.

As organizações internacionais, como Banco Mundial, ONU e OCDE, participam e desempenham um papel fundamental na construção e no fortalecimento de práticas avaliativas institucionalizadas. Tem-se como ação o desenvolvimento de arcabouços metodológicos e ferramentas destinadas a aprimorar os desenhos, a execução e a avaliação de programas ou projetos ao redor do mundo ().

Nesse contexto, 2015 foi estabelecido pela EvalPartners e aprovado pela ONU como o ano internacional da avaliação. A organização, construída por meio de parceiras entre a Organização Internacional para a Cooperação em Avaliação (IOCE) e o Fundo das Nações Unidas para a Infância (Unicef), em parceria com várias organizações importantes, tem como meta a criação de uma rede mundial de avaliadores voluntários que possam contribuir com as avaliações de políticas públicas em seus países (). De acordo com as diretrizes da organização, a iniciativa visa a contribuir com o melhoramento das capacidades das organizações da sociedade civil (OSC), bem como envolvê-las de modo estratégico e expressivo nos processos de avaliação nacionais, com o intuito de desenvolver sistemas de avaliação e garantir a equidade nas ações (). Para isso, desenvolveram a Agenda Global de Avaliação (ou EvalAgenda2020). O documento, aprovado pelos delegados do Fórum Global de Avaliação, realizado no Nepal, em 2015, viabiliza um roteiro de ações para o futuro da avaliação e o fortalecimento dos avaliadores de diferentes países e organizações ().

A União Europeia também desenvolveu um projeto para avaliação das políticas estruturais do bloco, bem como a identificação e utilização de práticas inovadoras de metodologias de avaliação, além de envolvimento multissetorial, com o intuito de reduzir a pobreza ().

No contexto da América Latina, a Rede de Monitoramento, Avaliação e Sistematização da América Latina e do Caribe (ReLAC), em conjunto com o Projeto Fomento das Capacidades em Avaliação (Foceval), do Ministério de Planejamento e Política Econômica da Costa Rica (Mideplan), e o Instituto Alemão de Avaliação da Cooperação para o Desenvolvimento (DEval) realizaram uma série de consultas públicas a especialistas e profissionais de avaliação durante os anos de 2014 e 2015, e apresentaram os primeiros esboços na IV Conferência ReLAC, no Peru, em 2015. Recentemente, em agosto de 2016, lançaram um documento com o resumo dessa proposta intitulado Diretrizes para avaliação para a América Latina e o Caribe, cujo objetivo é enriquecer o marco comum de orientação para o alcance de avaliações com padrão superior de qualidade, promover a formação teórica e prática dos avaliadores na região e instigar a cultura da avaliação no continente ().

Constata-se a atuação do Centro de Aprendizagem em Avaliação e Resultados para o Brasil e a África Lusófona (FGV EESP-Clear), com sede na Fundação Getulio Vargas (FGV) em São Paulo, que se beneficia do ambiente multidisciplinar da FGV e é um dos seis centros regionais que compõem a iniciativa Clear - que envolve diversos países e visa a aperfeiçoar políticas e programas com o desenvolvimento de capacidades e sistemas de monitoramento e avaliação. Dentre os eixos de pesquisa de monitoramento e avaliação, sobressaem-se: a) capacitação; b) assistência técnica; c) geração de novas evidências; e d) difusão de evidências e conhecimentos ().

Ainda no Brasil, outra iniciativa ganha notoriedade entre a comunidade científica: o Centro de Integração de Dados e Conhecimentos para Saúde (Cidacs), criado em 2016 e vinculado à Fundação Oswaldo Cruz da Bahia (Fiocruz Bahia), que promove pesquisas e projetos interdisciplinares com base no processamento, na integração e na análise de grandes volumes de dados (big data). Com isso, almeja-se contribuir com a utilização de metodologias inovadoras, proporcionar a capacitação profissional e científica e apoiar os tomadores de decisão em relação às políticas públicas sociais, especialmente as determinantes de saúde e as condições ambientais ().

Vale ressaltar, ainda, que há um esforço global voltado à construção de uma agenda baseada na integração entre todos os organismos internacionais, guiada principalmente pela consecução dos 17 Objetivos de Desenvolvimento Sustentável (ODS) do Programa das Nações Unidas para o Desenvolvimento (). Os primeiros cinco anos vislumbrados pela EvalAgenda2020 tem como prioridade a criação e o fortalecimento de mecanismos para avaliação dos ODS. O sintetiza as principais ações (; ; ; ; ; ; ; ; ).

Durante a fase de avaliação da política pública, qual é a principal vantagem da avaliação externa?

Quadro 3
Ações de estruturação de indicadores e avaliação desenvolvidas por organismos nacionais e internacionais
Fonte: Elaborado pelas autoras.

É claro o entendimento de que atividades avaliativas são importantes para a boa governação e podem contribuir com o avanço de políticas públicas mais efetivas, eficazes e eficientes (; ). Cabe destaque, como se pode deduzir, no meio acadêmico e nas organizações governamentais de pesquisa, para o fortalecimento do estudo da avaliação para buscar as melhores práticas e teorias, contribuindo sobremaneira com a criação de uma “cultura” avaliativa capaz de abarcar a complexidade e as especificidades de cada política ou programa em questão (; ).

Com base no referencial teórico construído e nas avaliações realizadas pelos organismos multilaterais, as principais lacunas teóricas observadas são: a) estudos que envolvam múltiplos países; b) utilização da abordagem de métodos mistos; c) estudos avaliativos que combinam duas ou mais políticas públicas; d) fortalecimento, capacitação e estruturação das práticas avaliativas nos países desenvolvidos e em desenvolvimento; e) utilização dos resultados das avaliações para informar e melhorar as políticas públicas; e f) avaliações participativas - contemplação de todos os atores envolvidos (gestores, tomadores de decisão, formuladores, implementadores, executores e beneficiários).

Diante dos esforços apresentados, fica evidente a importância de estudos avaliativos robustos, imparciais e que contemplem abordagens multimétodos. De acordo com o exposto, observa-se que os países desenvolvidos já incorporaram na agenda política a avaliação como processo, diferente do que ocorre no Brasil e em outros países em desenvolvimento, onde a avaliação de políticas e programas públicos ainda sofre com descontinuidade e indisponibilidade de dados confiáveis e completos, além de sistemas informacionais integrados que facilitem o acesso à informação, o que contribuiria sobremaneira com a tomada de decisão.

CONSIDERAÇÕES FINAIS

Em consonância com a busca de modelos articulados para o desenvolvimento de estratégias governamentais de combate à pobreza e a promoção da cidadania no Brasil, diversos organismos internacionais vêm desenvolvendo propostas integrativas e intersetoriais, com o intuito de melhorar a qualidade de vida da população mundial. Ações como o estabelecimento dos ODS do PNUD e estudos comparativos e compartilhados entre os países pertencentes à OCDE constituem exemplos de tais esforços.

Na América Latina, percebe-se uma busca crescente por ações avaliativas para o fortalecimento e a melhoria das políticas públicas adotadas na região, principalmente relacionadas ao enfrentamento das vulnerabilidades sociais. Entretanto, o cenário demanda desenvolvimento de capacidades profissionais dos governos e aumento da atuação da sociedade civil no acompanhamento e controle. A evolução e a internalização de processos avaliativos contribuem com o desenvolvimento de metodologias robustas e abrangentes. Observa-se, a partir da década de 1980, uma busca crescente por modelos capazes de conjugar informações quantitativas e qualitativas (métodos mistos), com vistas a aperfeiçoar e tornar a avaliação mais realista no que se refere à complexidade das políticas analisadas. A busca por novas metodologias de avaliação robustas e abrangentes se mostra essencial para o desenvolvimento e a evolução das atividades de avaliação, proporcionando aos gestores dados concretos, reais e aplicáveis. Portanto, almeja-se o uso de metodologias inovadoras, proporcionando capacitação profissional e científica e apoiando os tomadores de decisão em relação às políticas públicas sociais - especialmente as de saúde.

Entretanto, vale destacar que, no caso brasileiro, as bases de dados públicas disponíveis apresentam problemas de confiabilidade, dados indisponíveis e descontinuidade na produção de indicadores; tais fatores podem contribuir com a baixa adesão a estudos avaliativos quantitativos. Assim, as avaliações no Brasil estariam com maior quantidade de avaliações qualitativas de caráter local e com análise de políticas especificas, voltadas principalmente a prestação de contas e medição de desempenho e em busca da qualidade dos serviços prestados. Também há experiências que promovem pesquisas e projetos interdisciplinares com base no processamento, na integração e na análise de grandes volumes de dados (big data).

Felizmente, vale destacar que os dados demonstram o fortalecimento do estudo da avaliação no Brasil, para buscar as melhores práticas e teorias, contribuindo sobremaneira com a criação de uma “cultura” avaliativa capaz de abarcar a complexidade e as especificidades de cada política ou programa em questão. Não obstante, também se mostra necessário pontuar a importância de ações avaliativas contínuas, principalmente em cenários com escassez de recursos financeiros, humanos e materiais. Tais avaliações podem contribuir com a destinação adequada dos recursos e o fortalecimento das ações de controle por parte dos órgãos responsáveis

Qual é a principal vantagem da avaliação externa?

A lista de vantagens de uma avaliação externa é extensa: além de prover dados sobre cada aluno individualmente e sobre as turmas, uma avaliação externa de qualidade permite comparar os resultados de uma escola com o cenário externo – redes, escolas particulares ou desempenho em exames nacionais, por exemplo.

Qual a importância do processo de avaliação das políticas públicas?

A avaliação de políticas públicas, executada como um processo sistemático, integrado e institucionalizado, tem como premissa básica verificar a eficiência dos recursos públicos e, quando necessário, identificar possibilidades de aperfeiçoamento da ação estatal, com vistas à melhoria dos processos, dos resultados e da ...

Quais são os resultados mais relevantes fornecidos pelo processo de avaliação de políticas públicas?

QUESTÃO 9 Quais são os resultados mais relevantes fornecidos pelo Processo de Avaliação de Políticas Públicas? a ) A avaliação dos impactos negativos gerados pela adoção de uma determinada política. b ) O fornecimento de relatórios de desempenho no processo de implementação.

Qual a importância da avaliação de desempenho dos planos e das políticas públicas?

PARA QUE SERVE ESSE GUIA? O monitoramento e a avaliação (M&A) de políticas, programas e projetos consistem na atribuição de valor a diferentes aspectos das intervenções públicas, tais como: o problema que as motivam, o seu desenho, a sua implementação ou ainda, a sua eficiência, eficácia e efetividade.