Una forma conveniente que tenemos para entender el mundo cuantitativo en el que vivimos es el promedio. En particular, el promedio aritmético. Este es el cociente de la suma de los valores de una muestra y la cantidad de cosas en la muestra. Por lo tanto, el promedio nos da una calificación del valor de las cosas en la muestra.
Por ejemplo, si tomamos un grupo de estudiantes universitarios, y medimos la altura de cada uno, en centímetros, y calculamos el promedio (la suma de altura en centímetros divido por el número de estudiantes) tendríamos un valor representativo de la estatura de éste grupo de estudiantes.
Otro ejemplo sería el precio promedio de un mismo artículo en diferentes tiendas en una ciudad. Visitaríamos cada tienda y buscamos el artículo dado, registrando su precio. Luego que visitamos todas las tiendas, sumamos los precios y dividimos entre el número de tiendas visitadas, resultándonos en el precio promedio.
Una premisa de los ejemplos anteriores es que usamos unidades de medida estándar. Por ejemplo, un centímetro no cambia de longitud dependiendo de la cosa que medimos. Otra premisa no declarada es que las cosas que medimos son independientes entre sí, y que la medida de uno no influye en la medida de otro.
Sin embargo, ya que estas premisas no están declaradas de forma explícita, es común que no las tomemos en cuenta y usamos el promedio de forma incorrecta cuando estas premisas no se cumplen.
Por ejemplo, en el caso de los precios de las tiendas. La unidad de medida sería la moneda corriente en la tienda. Por ejemplo, en Canadá seríe el dólar Canadiense, en los EEUU sería el dólar Estadounidense, en México sería el peso Mexicano, etc. De esta forma, los precios en cada tienda se mostrarían en la moneda del país en que la tienda está ubicada. Pero las unidades entre países no son directamente equivalentes.
Si la muestra de tiendas abarca más allá del ámbito de una unidad monetaria, entonces el promedio no tiene sentido, su poder comparativo estaría negado, ya que se están mezclando unidades que no son comparables ni equivalentes entre sí. El precio promedio, literalmente, no tendría sentido. En el caso de la altura promedio, tendríamos un problema similar si algunas medidas estuvieran en unidades métricas, y otras en unidades imperiales.
Si hay factores de equivalencia entre las unidades diferentes, entonces se podría aplicar estos factores de forma que se podrían normalizar las medidas en términos equivalentes. Por ejemplo, las unidades métricas se podrían convertir en imperiales o viceversa; las unidades monetarias podrían plantearse en una moneda particular, siempre que las monedas tengas tasas de cambios entre ellas. Aplicando la factorización, el promedio tendría sentido y sería de valor útil.
Sin embargo, no siempre existen esos factores de equivalencia. Por ejemplo, en las encuestas de satisfacción, es común plantearle al encuestado que responda a una cantidad de preguntas usando alguna escala numérica o seudo-numérica (0-100, 0-10, número de "estrellas"), o no numérica pero que puede codificarse como tal (v.gr., "Absolutamente Insatisfecho", "Fuertemente Insatisfecho", "Insatisfecho", "Neutral", "Satisfecho", "Fuertemente Satisfecho", "Absolutamente Satisfecho"; con una codificación de 0, 1, 2, 3, 4, 5, 6, respectivamente).
Aunque el encuestado tiene la misma escala de la cual seleccionar, su "divisa" es diferente a la de sus co-encuestados, y no hay forma de aplicar un factor de equivalencia para normalizarlos. Por ejemplo, un encuestado podría tener un rango amplio de tolerancia, mientras que otro encuestado puede tener un rango más estrecho. De forma que, ante el mismo nivel de servicio (por ejemplo, exáctamente las mismas medidas en términos de tiempo de entrega, puntualidad de entrega, precisión en la cantidad entregada, etc), un encuestado podría sentirse calificar la experiencia como 80, mientras que el otro la podría calificar como 20 (o bien, 5 versus 1, o bien "Fuertemente Satisfecho" versus "Fuertemente Insatisfecho"). Es decir, la satisfacción es una medida subjetiva; tan subjetiva como el gusto (o disgusto) por el arte moderno.
Si tomamos un promedio de los valores de las encuestas, y nos resulta un promedio de satisfacción (por ejemplo, en la escala de 0 a 100), de 58.4, ese valor es inservible; no tiene sentido alguno. No hay forma de equiparar la subjetividad de la experiencia de cada quien --suponiendo, además, que la respuesta es absolutamente honesta.
Este es uno de los abusos del promedio. Si tu organización usa este tipo de medidas para la toma de decisiones, entonces estás caminando sobre arena movediza, y hay que andarse con mucho cuidado.