Esta entrada en el blog se me ocurrió escribirla anoche después que un exprofesor y actual colega (claro, porque ambos somos sociólogos) a quien personalmente respeto mucho me pidiera mi opinión respecto a un modelo de regresión logística multinomial.

No entraré a detallar procesos ni tampoco es mi intensión dar cátedra de métodos de análisis cuantitativo. La idea es reflexionar respecto a como realizamos análisis estadístico  y a veces nos tentamos con ciertos resultados que nos pueden llevar a cometer errores.

Muchas veces cuando desarrollamos modelos estadísticos de alta complejidad, principalmente regresiones multinomiales (de cualquier tipo) o modelamiento de ecuaciones estructurales, la búsqueda de un mayor ajuste puede hacernos forzar las variables con las que estamos trabajando, llevándonos a veces a incorporar elementos al análisis que no generan un aporte real al modelo, a pesar de que nuestro instinto  como investigador nos dice que son relevantes en el fenómeno que estamos observando.

Es cierto que la teoría manda (decía una profesora que tuve en la universidad), pero no por ser fieles a ésta debemos pasar por sobre los principios que dan cimiento al análisis estadístico y que dan cierto respaldo epistemológico a las ciencias sociales. Debemos hallar un equilibrio entre lo que la teoría nos sugieres y lo que los datos nos dicen.

En última instancia, estos errores no son garrafales y simplemente responde a  nuestra búsqueda por analizar e interpretar la realidad social con la mayor exactitud posible. Sin embargo, esta busqueda de exactitud no debe llevarnos a descuidar los procesos de análisis y terminar cayendo en una falacia del francotirador (la información que no tiene relación alguna es manipulada hasta que tenga sentido) o en el peor de los casos, justificar estos resultados en base a nuestro “grado” de investigadores y caer en una falacia lógica de caracter “argumentum ad verecundiam” (justificación o refutación de un argumento aludiendo al prestigio del actor).