sábado, 11 de mayo de 2013

Los números primos también siguen patrones estadísticos




Distribuciones de Probabilidad
Los Números Primos y Los sistemas Complejos


El mundo de los números siempre tiene particularidades por conocen. Dejo para ustedes una particularidad  sobre cierta regularidad de los números primos que se analiza desde una distribución estadística, por medio de la ley de Benford..
 En matemáticas, un número primo es un número natural mayor que 1 que tiene únicamente dos divisores distintos: él mismo y el 1. Los números primos se contraponen así a los compuestos, que son aquellos que tienen algún divisor natural aparte de sí mismos y del 1. El número 1por convenio, no se considera ni primo ni compuesto.

La ley de Benford, también conocida como la ley del primer dígito, asegura que, en los números que existen en la vida real, la primera cifra es 1 con mucha más frecuencia que el resto de los números. Además, según crece este primer dígito, más improbable es que se encuentre en la primera posición.


Más precisamente la ley de Benford establece que la primera cifra no nula n (n = 1, ..., 9) ocurre con una probabilidad igual a ( log10(n + 1) − log10(n) ), o
Primera cifraProbabilidad
130.1 %
217.6 %
312.5 %
49.7 %
57.9 %
66.7 %
75.8 %
85.1 %
94.6 %
Podemos formular una ley para las dos primeras cifras: la probabilidad de que las dos primeras cifras no nulas sean igual a n (n = 10, ..., 99) es igual a ( log10(n+1) − log10(n) ).
De un modo similar se puede enunciar una ley para las tres primeras cifras, para las cuatro primeras cifras, etc.

Gráficamente:

Para finalizar dejamos para ustedes un vídeo instructivo sobre este tema


jueves, 18 de abril de 2013

Análisis de Regresión y Correlación


DESCRIPCIÓN BIVARIANTE DE DATOS


Muchos estudios empíricos dependen en máximo grado del análisis de regresión y correlación, adquiriendo estas herramientas estadísticas un valor muy grande en el momento de tomar un gran número de decisiones empresariales y económicas. Si los responsables de la toma de decisiones pueden determinar cómo lo conocido se relaciona con el evento futuro, pueden ayudar considerablemente al proceso de toma de decisiones

El primero en desarrollar el análisis de regresión fue el científico inglés Sir Francis Galton (1822-1911), comenzando sus experimentos de regresión en el intento de analizar las tendencias hereditarias de los guisantes y las estaturas entre padres e hijos. Para el análisis de regresión es crucial determinar cuál es la variable dependiente y cuál la independiente, esta determinación depende de la lógica común y de lo que el estadístico trate de investigar; por ejemplo, supongamos que las ventas de una empresa dependen (al menos en parte) de la cantidad de publicidad que ésta hace, las ventas se consideran la variable dependiente y es función de la variable independiente, que es la publicidad.

La variable dependiente Y se denomina también regresando o variable explicada, mientras que la variable independiente X se llama regresor o variable explicativa.
La regresión y la correlación son en realidad conceptos diferentes, pero que guardan una íntima relación.

REGRESIÓN


La regresión es una expresión cuantitativa que describe la naturaleza básica de la relación entre las variables dependiente(s) e independiente, el modelo determinará:

1.      Si las variables tienden a desplazarse en la misma dirección.
  1. Si las variables tienden a desplazarse en sentidos opuestos.
  2. La cantidad en que Y cambiará cuando la(s) variable(s) independiente(s) varíe en una unidad. 


ANÁLISIS DE CORRELACIÓN


                El análisis de correlación es la herramienta estadística que podemos usar para describir el grado de interconexión entre las variables. Con frecuencia, el análisis de correlación se utiliza junto con el análisis de regresión para medir qué tan bien la línea de regresión explica los cambios de la variable dependiente Y. 


Para medir el grado de interconexión tenemos el Coeficiente de correlación, el cual mide  qué tan bien se ajusta una curva de regresión a los datos muestrales. Además disponemos del Coeficiente de determinación que mide el poder explicativo del modelo de regresión, es decir, la parte de la variación de Y explicada por la variación de X.


El análisis de regresión y correlación permite analizar la influencia que una(s) determinada(s) variable(s) independiente(s) tienen sobre una variable dependiente. Permitiendo conocer por medio de la correlación el grado de conexión y el sentido que ella posee, y por medio del análisis de regresión describir cuantitativamente la relación por medio de una ecuación, que en el caso más simple es de tipo lineal.

En la red se encuentran sitios que permiten calcular los indicadores más importantes para el análisis de regresión y correlación.  Dispones también de páginas con ejercicios resueltos que permiten profundizar estos conceptos. 

Por último queremos dejarte un desafío (problema) para el cual queremos que indagues, las limitaciones en el análisis de regresión y de correlación, aquí el desafío:
 


La Fundación de Protección a la Cigüeñas desea mostrar con estadísticas que, contrariamente a la creencia popular, las cigüeñas sí traen a los bebés. Para esto ha recolectado datos sobre el número de cigüeñas  y el número de bebés (ambos en miles)  en varias ciudades grandes de Europa Central.

  Cigüeñas
27
38
13
24
6
19
15
Bebés
35
46
19
32
15
31
20

Calcule el coeficiente de determinación de la muestra y el coeficiente de correlación de la muestra para estos datos. ¿Contradijo la ciencia estadística la creencia popular?

Esperamos por tus aportes, siempre son bienvenidos, enriquecen el conocimiento y permiten que otras personas también se beneficien...