Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
1
UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALESFacultad de Psicología y Ciencias Sociales
Licenciatura en Sociología
ESTADÍSTICA II (Plan 2008)
INTRODUCCIÓN AL ANÁLISIS MULTIVARIADO
Prof. TitularLic. Rubén José Rodríguez
3 de abril de 2009
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
2
ÍNDICE
Definición y finalidad del AM
Tipo de relaciones entre variables
Criterios para la Clasificación de AM
Clasificación de los Métodos de AM
Definición de las Técnicas de AM
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
3
ANÁLISIS MULTIVARIADODefinición
Engloba a múltiples técnicas estadísticas que describeny explican las relaciones entre más de dos variables.La complejidad matemática del AM aumenta con el númerode variables.
El cálculo de los algoritmos y fórmulas del AM se puedenhacer por el crecimiento de las capacidades deprocesamiento de las PC’s, los paquetes informáticosde estadística (SPSS, SAS, Systat, SPAD, Minitab,Mystat, Statgraphics, SphinxSurvey, StatSoft) y programasespecíficos de AM (AnwwerTree, Clementine, NeuralConnection, Conjoint Analyzer, EQS Multivariate Software).
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
4
ANÁLISIS MULTIVARIADOFinalidades del análisis
ExplicarV1
V2
V3
V4Si los efectos en la V4 se deben a las varia-ciones de las variables V1-V2-V3.
SintetizarReducir múltiples varia-bles o indicadores a un menor número de Fac-tores explicativos.
ClasificarAgrupar unidades, mar-cas, compañías, ideas, objetos en clases homo-géneas dentro de sí y heterogéneas entre sí.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
5
TIPOS DE RELACIONES ENTRE VARIABLES (a) *
Las proposiciones relacionan variables entre sí: “Cuanto más conocimiento (X1) posee un hombre, tanto
mayor es su prestigio (Y1)”. Proposición bivariada: X Y
“A mayor inversión publicitaria (X1) , mayor incrementoen las ventas (Y1), siempre y cuando la comunicación impacteen el target (Z1)”. Proposición multivariada: X Z Y
Se puede afirmar que una variable X es la causa de otra Ycuando se dan tres tipos de evidencias:1. Que X e Y varían concomitantemente en la forma
prevista en la hipótesis.2. Que Y no precede a X en el tiempo.3. Que no haya otros factores (antecedente o
interviniente) (Z, K..) que determinen Y. El concepto de asociación o correlación entre variables no
implica nexo causal. La causalidad implica asociación, perono a la inversa.
* Zetterberg, Hans, Teoría y Verificación en Sociología, Buenos Aires: Ed. Nueva Visión, l968, cáp. IV: Sobre las proposiciones en sociología, págs. 55-70
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
6
TIPOS DE RELACIONES ENTRE VARIABLES (b)
1. REVERSIBLE (Si X, entonces Y, y si Y entonces X)
(X Y : Relación Simétrica)“Si la frecuencia de interacción entre dos personas
aumenta, el grado de simpatía mutua, aumenta, y viceversa”
2. IRREVERSIBLE(Si X, entonces Y, pero si Y, entonces ninguna
conclusión acerca de X)(X Y : Relación Asimétrica)
“Las condiciones habitacionales influyen en la mortalidad infantil.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
7
TIPOS DE RELACIONES ENTRE VARIABLES (c)
3. DETERMINÍSTICA(Si X, entonces siempre Y)
“Si hay aumento en el número de miembros de un grupo completamente inestructurado, siempre hay
aumento en el anonimato de las acciones del grupo”
4. ESTOCÁSTICAS(Si X, entonces probablemente Y)
“Si una persona debe elegir entre conformarse a una norma y abandonar una alta posición (se predice que en un número grande de personas – n ∞ - ) la mayoría se
desviará de la norma y conservará el rango”
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
8
TIPOS DE RELACIONES ENTRE VARIABLES (d)
5. SECUENCIAL(Si X, entonces más tarde Y)
“Si los votantes están sujetos a influencias contradictorias de sus grupos primarios durante una campaña electoral, posiblemente demoren en tomar
una decisión”
6. CONCOMITANTE(Si X, entonces también Y)
“Cuanto mayor es el porcentaje de movilidad social, menor es la medida en que las clases bajas aceptan
ideologías clasistas militantes”
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
9
TIPOS DE RELACIONES ENTRE VARIABLES (e)
7. SUFICIENTE *(Si X, entonces Y, independientemente de cualquier otra
variable) “La compra de un producto (Y) en el canal ‘self service’
depende de su presencia y visibilidad en la góndola (X)”
8. CONTINGENTE(Si X, entonces Y, pero sólo si Z)
“A mayor nivel de ingreso (X) de una familia, mayor posibilidad de educación (Y) para los hijos, sólo si los
padres tienen interés”
* X es condición suficiente cuando es el único factor relevante que se mantiene constante dadoque los restantes factores: m, n , p , q, r, s pueden o no estar presentes. En forma simbólica:m, n, XY; p, q, X Y; r ,s, X Y. En forma tabular: X * Y = N; X * No Y = 0. Nunca puede darseel caso en que esté presente X pero no esté Y, la celda X* No Y = 0, por definición de condiciónsuficiente. Esta condición fue establecida por John Stuart Mill (1806-73). Orlansky, Dora,Metodología de la Ciencias Sociales. El problema del Análisis Multivariable (Modelo de PaulLazarsfeld), Buenos Aires: Ed. Nueva Visión, Ficha nº 134, Serie Metodología, págs. 4-5.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
10
TIPOS DE RELACIONES ENTRE VARIABLES (f)
9. NECESARIA *(Si X, y sólo si X, entonces Y)
“Se requiere haber recibido un alto impacto de un spot de TV (X) para poder recordar espontáneamente (Y) la
marca del comercial publicitado”10. SUSTITUIBLE
(Si X, entonces Y; pero si Z, entonces también Y)“La compra de una marca (Y) depende de haber estado
expuesto al spot (X), pero también de la promoción en el P. de V. (Z) “
* X es condición necesaria cuando se mantienen constantes, los factores relevantes m, n, p, q..., y el fenómeno Ysólo se observa si está presente X, entonces se dice que X es una condición necesaria para la ocurrencia de Y.Simbólicamente: m, n, p no Y; m, n, q no Y; m, n, X Y; X Y. En forma tabular: No X * Y = 0. No puedeexistir ningún caso en que Y esté presente sin que lo esté X, por definición de condición necesaria. Galileo Galilei(1623) definió la causa eficiente como la condición necesaria y suficiente para la aparición de algo: “aquella y nootra, debe llamarse causa, a cuya presencia siempre sigue el efecto y a cuya eliminación el efectodesaparece”. La causa sine qua non, es la condición necesaria. Bunge, Mario, Causalidad. El principio decausalidad en la ciencia moderna, Buenos Aires: Ed. Eudeba, l965, págs. 45-46.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
11
CRITERIOS DE CLASIFICACIÓN DE LOS MÉTODOS MULTIVARIADOS (a)
1. Según la distinción del rol de las variables: MÉTODOS DE INTERDEPENDENCIA: No hay distinción
entre las variables, todas cumplen similar rol. Son MÉTODOSDESCRIPTIVOS: sintetizan información, muestran laestructura de los datos o establecen clasificaciones.Ejemplos: Análisis Factorial, Cluster Analysis, Análisis Factorialde Correspondencias, Análisis Multidimensional.
MÉTODOS DE DEPENDENCIA: Diferencias entre variablesexplicativas, independientes (VI) o predictivas (X) y variablesexplicadas, dependientes (VD) o criterios (Y). Son MÉTODOSEXPLICATIVOS: explican los efectos multivariados de lasVI’s. Ejemplos: Análisis de Regresión Múltiple, Análisis deVarianza y Covarianza, Análisis Discriminante, AnálisisConjunto, Análisis CHAID, Análisis de Correlaciones Canónicas.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
12
CRITERIOS DE CLASIFICACIÓN DE LOS MÉTODOS MULTIVARIADOS (b)
2. Según el nivel de medición de las variables: ESCALA MÉTRICA: Algunos Análisis requieren que las
variables sean Cuantitativas: Factorial, Cluster,Multidimensional Métrico
ESCALA NO MÉTRICA: Otros Análisis requieren que lasvariables sean Cualitativas o Categoriales:Multidimensional No Métrico (Similitudes y Preferencias),Cluster No Métrico, Correspondencias Múltiples.
VD-VI MÉTRICA: Regresión Lineal Múltiple, Análisis deCorrelaciones Canónicas, Análisis de EcuacionesEstructurales.
VD NO MÉTRICA-VI MÉTRICA: Análisis Discriminante. VD NO MÉTRICA-VI NO MÉTRICA: Análisis Conjunto. VD MÉTRICA-VI NO MÉTRICA: Análisis de Varianza y
Covarianza, Análisis Multivariado de Varianza yCovarianza, Análisis CHAID.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
13
CRITERIOS DE CLASIFICACIÓN DE LOS MÉTODOS MULTIVARIADOS (c)
3. Según el número de variables: En el caso de los MÉTODOS DE INTERDEPENDENCIA el
número de variables está condicionado por los límitesoperativos del Programa utilizado.
En el caso de los MÉTODOS DE DEPENDENCIA sesubdividen según en nº de variables a explicar (VD):o Una VD: Regresión Lineal Múltiple, Análisis de
Varianza y Covarianza, Análisis Discriminante,Análisis Conjunto.
o Varias VD: Análisis de Correlaciones Canónicas,Análisis de Ecuaciones Estructurales, AnálisisMultivariado de la Varianza y la Covarianza, AnálisisLog-Lineal
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
14
CLASIFICACIÓN DE LOS MÉTODOS DE AM (1)
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
15
CLASIFICACIÓN DE LOS MÉTODOS DE AM (2)
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
16
CLASIFICACIÓN DE LOS MÉTODOS DE AM (3)
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
17
CLASIFICACIÓN DE LOS MÉTODOS DE AM (4)
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
18
CLASIFICACIÓN DE LOS MÉTODOS DE AM (5)
C L A S IF IC A C IÓ N D E L O S M É T O D O S D E A N Á L IS IS M U L T IV A R IA N T E
¿ S o n a lg u n asvariab les
d ep en d ien tes d e las o tras
M éto d o s D escrip tivo so d e In terd ep en d en cia
M éto d o s E xp licativo so d e D ep en d en cia
N º d eV ariab lesa exp licar
T ip o s d eV ariab lestra tad as
C u an tita tivas C u alita tivas¿ E s
cu an tita -tiva?
¿ S o ncu an tita -
tivas?
¿Las V ariab lesE xp licativ as son
cuantita tiv as?
O rd in a les N o m in ales
-An ális isF acto ria ld e C o m p o -n en tesP rin c ip a les
-E scalasM u ltid i-m en sio -n alesM étricas.
- E scalasM u ltid im en -sio n ales N oM étricas.
- An ális isd e C o rres-p o n d en cia.
-R eg re-s ió nL in ealM ú ltip le
-AN O V AM ú ltip le
-D etecto rAu to m á-tico d eIn terac-cio n es(A ID ,C H AID )
-An ális isD iscrim i-n an te
-C o n jo in tAn alysis
.R eg re-sió nL o g ística
-C o rre la -c ió nC an ó n ica
-M o d elod eE cu acio -n esE stru ctu -ra les
-M AN O V A
-An ális isD iscrim in an teM ú ltip le
-M o d eloL o g -lin eal
N O
N O
U N A V AR IAS
S I
S I
S I
S I N ON ON ON O S I S I
N O S I
¿Las V ariab lesE xp licativ as son
cuantitativ as?
¿Las V ariab lesE xp licativ as son
cuantita tiv as?
¿Las V ariab lesE xp licativ as son
cuantita tiv as?
Ped re t, Ram ón e t. a l. (2000): H erram ien tas para segm en tar m ercados y pos icio n ar produ cto s. A n á lis is de in fo rm ación cu an itativa en In vestigación C o m ecia l, B ilb ao,Ed icones Deusto , 2000, p . 35 .
An ális isT ip o -
ló g ico(C lu ster
An alys is ).
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
19
CLASIFICACIÓN DE LOS MÉTODOS DE AM (6)
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
20
CLASIFICACIÓN DE LOS MÉTODOS DE AM (7)
TécnicasMultivariantes
Métodos deDependencia
DependienteMétrica
DependienteNo Métrica
Análisis de RegresiónAnálisis de SupervivenciaMANOVACorrelación Canónica
Análisis DiscriminanteRegresión LogísticaAnálisis Conjoint
Modelos estructurales
Métodos deInterdependencia
Datos Métricos
Datos No Métricos
A. Comp. PrincipalesAnálisis FactorialEscalas MultidimensionalesAnálisis Cluster
Análisis de CorrespondenciasModelos log-linealesEscalas MultidimensionalesAnálisis Cluster
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
21
DEFINICIÓN DE LAS TÉCNICAS MULTIVARIANTES DESCRIPTIVAS (1)
AnálisisFactorial
Reduce un gran número devariables intercorrelacionadas aun serie de factores comunessubyacentes, graficándose en losejes cartesianos.
Análisis de Conglomerados‘Cluster Analysis’
Clasifica los elementos de lamuestra en grupos que pre-sentan mediciones semejantes(homogeneidad).
Análisis Factorial de Correspondencias
Analiza tablas de contingencia ytransforma la f en distancias X2
(chi cuadrado), utilizándolas paravisualizar los datos en el espaciocartesiano (‘perceptual maps’).
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
22
DEFINICIÓN DE LAS TÉCNICAS MULTIVARIANTES DESCRIPTIVAS (2)
Análisis Multi-dimencionalMétricoyNo Métrico:
A partir de datos sobre semejanzas opreferencias percibidas, se representan por unconjunto de puntos en el espacio, de modo quelas relaciones geométricas entre los puntosreflejen las relaciones empíricas entre losdatos. Se construyen Mapas Perceptuales querepresentan espacialmente la estructura de losdatos.Se determina: a) qué dimensiones utilizan losencuestados cuando evalúan, b) cuántasdimensiones se utilizan, c) importancia relativade cada dimensión y d) cómo se relacionanperceptualmente los objetos evaluados.Las dimensiones percibidas son graficadas enun mapa espacial, donde se muestra lasituación relativa de cada objeto.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
23
DEFINICIÓN DE LAS TÉCNICAS MULTIVARIANTES EXPLICATIVAS (1)
Análisis de Regresión Múltiple
Extensión de la Regresión simplelineal, entre la VD (Y) y dos omás VI’s (Xj), de tipo métrico.
Análisis de Varianza y Covarianza (ANOVA-CANOVA-MANOVA-MANCOVA)
Extensión de la prueba designificación (t) para dos o másvariables métricas y una o másvariables categoriales, para deter-minar si existen diferencias entre lasmedias . Test F (Fisher-Snedecor).
Medición Conjunta‘Conjoint Analysis’
Medición de las evaluacionesconjuntas de combinaciones deatributos para determinar laspreferencias e intenciones decompra de un nuevo producto.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
24
DEFINICIÓN DE LAS TÉCNICAS MULTIVARIANTES EXPLICATIVAS (2)
Análisis Discriminante
Calcula los Coeficientes discriminantesde las variables que segmentan a lapoblación en dos grupos con pesosdistintos.
Análisis de correlaciones canónicas
Extensión del Análisis de RegresiónMúltiple para dos o más VD’s (Yj) de tipométrico.
Análisis CHAID(Chi Squared Automatic Interaction Detection)
Técnica de AM para segmentar basada en el‘Automatic Interaction Detection’ (AID) y el‘Classification and Regresión Trees’ (CART).Permite generar árboles jerárquicos basadaen X2, y obteniendo dendogramas, con nodosque indican el tamaño del subgrupo y elpuntaje de una Escala Likert de 5 puntos deintención de compra.
Autor: Lic. Rubén J. Rodríguez Estadística IILicenciatura en Sociología - UCES
25