Operaciones de limpieza
El procesamiento de la información se realiza en varias etapas que se detalla a continuación:
1.- Crítica de la información
2.- Codificación de la información
3.- Tabulación
4.- Validación de la información
5.- Análisis de la Información.
Crítica de la información:
Se verifica la consistencia de los datos contenidos en cada uno de las secciones del cuestionario para asegurar la calidad y confiabilidad. Existen dos niveles de crítica: de manera simultánea durante la recolección por parte de los supervisores y/o Técnico Normalizador. A través de Carga de Datos y Sintaxis elaborados para la consistencia de los datos que trabaja con rangos y flujos incorporados en la manual de validación.
Crítica durante la recolección:
La crítica de la información es realizada por los Supervisores y Técnicos normalizadores, esta se ejecuta en paralelo a la recolección de la información. Este proceso consiste en la revisión de cada pregunta a fin de definir el nivel y la estructura declarada por el informante. Se determina la consistencia de la información para establecer el nivel de validez, calidad y coherencia dentro de la estructura de los cuestionarios.
Crítica de la información a través de Carga de Datos y Sintaxis en paquetes estadísticos:
Los datos que han sido ingresados por los digitadores a través del sistema para captura mediante programación en CSPro Software - Census Bureau, que son generados a través del sistema informático, que contiene reglas de validación cuya finalidad es señalar registros o casos que tienen información inconsistente o no válida, la misma que debe ser revisada para su respectiva corrección o en ciertos casos la información inconsistente debe ser corroborada con el informante.
Mediante la programación de una sintaxis de validación de los datos ingresados en el sistema se logró realizar varios controles de consistencia una generada por el programa de carga CSPro y otra más potente que es la gestión de control de calidad mediante la ejecución de sintaxis de validación mediante la utilización de software estadísticos.
Cuando se determina que la información está incompleta, o se han detectado inconsistencias en los dos niveles de crítica, personal de las Coordinaciones Zonales del INE, se encarga de solicitar la aclaración, a fin de completar o corregir los datos, este proceso se lo hace vía teléfono o a través de visitas personales a las instituciones.
Codificación de la información:
Se definen los códigos para cada categoría de respuesta.
Tabulación:
Con la información validada, y en base al plan de tabulación, se construyen cuadros y tablas resumen (reportes) con información estadística a través del paquete estadístico SPSS (Statitistical Package for Social Sciencies).
Los reportes son sometidos a análisis y revisión para su posterior publicación.
Validación de la Información.
El proceso de validación de información estadística tiene por objeto depurar las bases de datos preliminares de la operación estadística, señalando los registros o casos que tienen información inconsistente o no válida para que éstos se confirmen o corrijan en campo, de ser necesario. Este proceso se debe repetir por varias veces -conocidas como rondas de validación-, debido a que usualmente ingresan nuevos datos / registros junto con los datos confirmados o corregidos de la ronda de validación anterior. Casi seguramente, estos nuevos datos también tienen un porcentaje de información inconsistente o no válida que deberá enviarse a campo para una nueva ronda de validación. Una vez que ya no ingresan nuevos datos de campo y/o se han validado todos los datos existentes, se llega a una base de datos estable la cual es prácticamente la base de datos de publicación, salvo detalles de formato y/o de normalización de metadatos.
Se debe depurar las bases de datos preliminares, ya que los datos pueden tener errores generados en etapas anteriores de la operación estadística, sea en levantamiento, crítica / codificación o digitación. Existe un procedimiento estándar para depurar las bases preliminares, conocido generalmente como Plan o Malla de Validación, el cual consiste en:
a) Determinar los casos en los cuales determinadas variables cuantitativas escalares caen fuera de un rango establecido -por estándares, por valores históricos, o por relaciones con otras variables.
b) Determinar los casos en los cuales determinadas variables tienen valores válidos cuando deberían tener faltante -missing- por flujo, esto es, que estaban impedidas de registrar valores debido al contenido de una variable de control la cual actúa como filtro para la variable analizada.
c) Determinar los casos en los cuales ciertas combinaciones de valores de variables, tanto cuantitativas escalares como cuantitativas categóricas o nominales, son no válidos para la operación estadística actual -p.ej., tener una gran empresa con 7 empleados y cuyo ingreso promedio sea menor a un sueldo básico.
d) Determinar los casos en los cuales hay variables que debían registrar información de forma obligatoria, sobre todo cuando son independientes de “variables filtro”.
Este procedimiento concluye cuando se genera listas de casos / registros que caen dentro de las anomalías mencionadas, agrupadas por tipo o clase de inconsistencia, listas que son enviadas a la oficina de coordinación zonal de donde procedieron para que el personal a cargo de las fases previas de la operación estadística -campo, levantamiento, crítica / codificación o digitación- confirmen o corrijan la información enviada en las bases de datos preliminares.
Análisis de la Información:
Cuando la operación estadística ha concluido la fase de validación de información, se pasa a la fase de Análisis, cuyo objeto es desarrollar conjeturas o hipótesis acerca de variables y/o relaciones entre variables en función de uno o varios objetivos de investigación concretos. Esta fase, a su vez, consta de tres subfases:
1) Pre-análisis: Es la subfase en la cual se generan tabulados y/o indicadores de control de validez de la información de la operación estadística actual, la cual se contrasta con información similar generada en operaciones pasadas. Con mucha frecuencia, esta subfase se incluye como una subfase final de validación, ya que es aquí cuando pueden aparecer incoherencias entre la información actual y la información histórica y/o de otras fuentes, las cuales en teoría deberían estar próximas en sus valores. Cuando termina esta subfase, se puede decir que la información de la operación estadística es robusta, además de ser declarada como válida previamente.
2) Análisis propiamente dicho: En esta fase, se detecta la existencia de fenómenos de variación de los valores de las variables -sobre todo de las que no son las más importantes de una operación estadística, denominadas a veces como estructurales-, tanto en el tiempo como en relación a otras fuentes estadísticas válidas. Luego, se trabajan conjeturas acerca de las posibles causas de esas variaciones, para finalmente elegir algunas de ellas para convertirlas en hipótesis estadísticas -típicamente del tipo causales- en donde se establecerá, con cierto margen de error y con un determinado nivel de confianza, cuáles son las causas de esas variaciones un tanto inesperadas o abruptas y cuál es la medida de esa variación. Generalmente, las causas de esas variaciones son de naturaleza y tipo variable, incluyendo causas que apunten a variables no investigadas en la presente operación estadística. Sin embargo, en la mayor parte de análisis, lo que se busca es explicar la variabilidad de las variables no estructurales en base a los valores de las variables estructurales. Por ejemplo, se busca explicar un aumento abrupto en las enfermedades de transmisión sexual, presuntamente debido a posibles causas como empleo no decente, subempleo, desempleo, bajo nivel de instrucción, ausencia de subcentros de salud en zonas cercanas al domicilio de las personas afectadas, etc. Así, en esta fase se genera un importante conocimiento del entorno en el cual se ha detectado un fenómeno socioeconómico o ambiental, a partir de la información válida y robusta de la operación estadística.
3) Post-análisis: En esta fase, se realizan nuevas variantes de los modelos causales y/o relacionales entre variables no estructurales generados en la subfase anterior, con el fin de confirmar los hallazgos hechos por los analistas de la información de la operación estadística, así como para contrastar con información de otras fuentes analizada por otros expertos pero sobre la misma realidad o fenómeno. Otro objetivo de esta fase es tratar de explicar la variabilidad de las variables estructurales, que en la fase anterior se supusieron estáticas o invariables. Con frecuencia, esto se logra cruzando información de varias fuentes, cuyas unidades de análisis son idénticas o compatibles, esto es, que están libre de disputa, independientemente de las fuentes de información y de la ideología de los analistas. Posibles unidades de análisis son regiones geográficas, estratos de niveles de ingresos o de consumo, estratos de edad de las personas. Entonces, los analistas proceden a comparar las conclusiones de sus investigaciones realizadas en forma independiente por cada fuente de información. Cuando se tienen los resultados del análisis de un fenómeno por todas las posibles fuentes, entonces se puede decir que se ha detectado las “causas estructurales” del cambio en las variables del fenómeno. El resultado de esta fase de Análisis generalmente se denomina Análisis del entorno o de situación.
Una vez que se concluye con esta fase de Análisis, habrá una posterior fase de toma de decisiones, la cual no forma parte de las fases de la operación estadística y es posterior a ésta. Esta fase la desarrollan politólogos y/o tomadores de decisión técnico-políticos, a quienes les corresponde decidir qué acciones se debe tomar con el fin de que un fenómeno dado mejore en su situación -en caso de que tenga impacto negativo en su entorno o con el fin de que continúe o mejore en caso de que el impacto en el entorno sea positivo.
Otro procesamiento
El proceso de recolección de datos comprende 2 etapas:
1.- Etapa preparatoria o previa a la recolección, y
2.- Recolección de la información.
1.- Etapa preparatoria o previa a la recolección:
1.1 Se realizó la prueba piloto con el objetivo de validar las preguntas del cuestionario a utilizar en la Encuesta sobre Victimización se realizó la prueba piloto con Técnicos y encuestadores de la DEE previa capacitación del instrumento. Las personas involucradas directamente en la prueba piloto fueron del área de campo; 4 encuestadores, 1 técnico, 1 supervisor, y 2 choferes acompañados por la Responsable del área de Campo.
La carga de trabajo estimada para cada encuestador fue de por lo menos 6 viviendas por encuestador.
Previa a la salida de campo se realizó una capacitación sobre el cuestionario y la finalidad de la prueba piloto.
La prueba piloto tuvo dos principales objetivos:
a. Probar el cuestionario elaborado y;
b. La duración de la encuesta.
- El periodo de realización fue de dos días (30 a 31 de mayo de 2019).
- La cobertura geográfica de la Prueba Piloto fue en la ciudad de San Lorenzo, en el Barrio Espíritu Santo. Con esto se logro medir el nivel de calidad de información y además establecer el buen direccionamiento de las variables, flujos, y metodología de las preguntas principales, la prueba piloto se la realizó en comisarias seleccionadas al azar, como resultado de esto se mejoró el enfoque de algunas de las variables.
1.2 El Responsable de Proyecto la Dirección de Estadísticas Económicas fue la encargada de la capacitación cuyo objetivo fue preparar al personal para la ejecución eficiente de sus responsabilidades en los puestos que ocupan. El contenido desarrollado abarcó los siguientes aspectos: Introducción Institucional, Dinámica, Aspectos Cartográficos, Técnicas de Entrevista - Caratula, Características de la Población, Características de la vivienda, Educación y Empleo, Opinión general sobre Violencia, percepción de Seguridad y Desempeño de Instituciones, Apartado de Victimización, Preguntas, Filtros de los Delitos, Apartado de Victimización (Caracterización de los Delitos), Charla Código de Ética y Práctica en aula.
2.- Recolección de la información
2.1 El relevamiento de los datos inició el 18 de setiembre del corriente, con un primer grupo de encuestadores y supervisores, y gradualmente se fueron completando en la semana siguiente el equipo total planificado y necesario. La asignación de trabajo para los equipos fue establecida de acuerdo al tiempo de llenado del cuestionario y las ubicaciones de las Unidades Primarias de Muestreo (UPM). Para las actividades de recolección, fueron entregados al personal de campo los materiales e insumos necesarios (cuestionarios, cartas de presentación, credenciales, indumentarias y cartografía impresa). La entrevista es realizada de manera directa (cara a cara) en papel y sé recolectó la información en los diferentes hogares seleccionados, según la muestra.
Equipo de trabajo de campo
Cada equipo de trabajo de campo está conformado por un supervisor y tres encuestadores para el traslado hasta la zona y UPM, con vehículos alquilados en el marco del proyecto al servicio de la DGEEC. También acompañan los sub coordinadores y coordinador general según planificación de acompañamiento y visitas elaborado para cada equipo.
Supervisión en campo
2.1 La supervisión del trabajo de campo es permanente y se encuentra a cargo de los coordinadores y técnicos de la institución, con una organización semanal para la tarea, de acuerdo al plan de trabajo. La metodología aplicada en campo, según asignación se visita la zona y UPM, supervisar la actualización, la selección de las viviendas y realizar la re-entrevista de algunos cuestionarios elegidos al azar y/o según situación del encuestador, se verifican las preguntas del cuestionario en las viviendas, a fin de disipar dudas, si los hubiera o corregir posibles errores, medir el progreso, revisar los cuestionarios completados y proveer retroalimentación.
2.2 Una vez que el Técnico Estadístico del INE verifica que la información esté completa procede a realizar la Crítica de la información registrada.
2.3 En caso de que la información no sea consistente, solicita al informante a través de re-visita o llamada telefónica se verifique o rectifique el dato en caso de que la inconsistencia sea correcta o a su vez se justifique lo descrito en el formulario. Luego de haber solventado las inconsistencias encontradas se procede a la validación del mismo.
El equipo de campo estuvo conformado de la siguiente manera:
Técnico Estadístico: 0 Analisís de Datos y capacitación
Supervisor: 1 Responsable de controlar y apoyo
Encuestador: 2 Responsable de captar la información
Normalizador: 3 Responsable de la crítica, codificación y carga de los datos