50
QUÍMICA ANALÍTICA AVANÇADA – 1S 2015 MÓDULO 2 3ª aula Estatística - Conceitos básicos Notas de aula: www.ufjf.br/baccan Prof. Rafael Arromba de Sousa Departamento de Química - ICE [email protected]

MÓDULO 2 3ª aula Estatística - Conceitos básicos - ufjf.br · Precisões (Teste F) Médias (Teste tde Student) TesteF(ouTestede Snedecor) F= SA 2 SB 2 ... Regressão não-linear

Embed Size (px)

Citation preview

QUÍMICA ANALÍTICA AVANÇADA – 1S 2015

MÓDULO 2

3ª aula

Estatística

- Conceitos básicos

Notas de aula: www.ufjf.br/baccan

Prof. Rafael Arromba de SousaDepartamento de Química - [email protected]

Estatística Aplicada à Química Analítica

Aula 2:- Conceitos e definições básicos� Não existe um valor absoluto para um

resultado analítico� Forma correta de expressar os resultados� Definição de exatidão e precisão� Importância de rejeitar resultados anômalos

Aula 3:- Conceitos básicos (continuação)

- Noções de Quimiometria3

RELAÇÃO ENTRE EXATIDÃO E PRECISÃO

A Exatidão e a Precisão se relacionam de 3 formas principais:

Métodode análise

C

B

A

preciso e exato !

preciso mas inexato

impreciso e inexato

Conc. do analitovalor verdadeiro

EXEMPLOS PRÁTICOS ?? 3

Algumas formalidades... TERMINOLOGIAS

Codex Committee on Methods of Analysis and Sampling. Guidelines on Analytical Terminology (CAC/GL72 – 2009)

1) Boa precisão = Boa repetibilidade ≠ reprodutibilidade

4

5

TERMINOLOGIAS

2) Precisão intermediária

1. Definição do problema analítico2. Escolha do método de análise

3. Amostragem

4. Tratamento da amostra (e separação da espécie de interesse)

5. Calibração

6. Medida analítica RESULTADO (MÉDIA ± INCERTEZA)7. Avaliação dos resultados : RESULTADO OBTIDO x RESULTADO ESPERADO

8. Ação

A ESTATÍSTICA NA ANÁLISE QUÍMICA

Comparação de Resultados:

6

ComparaçãoPrecisões (Teste F)

Médias (Teste t de Student)

Teste F (ou Teste de Snedecor)

F = SA

2

SB2

SE Fcalculado ≥ Ftabelado para a confiabilidade desejada

Existe diferença significativa entre os conjuntosde dados

SE Fcalculado < Fcrítico para a confiabilidade desejada

Não existe diferença significativa entre os conjuntosde dados

�Comparar precisões(ou variâncias)

de duas médias (A e B)“A” refere-se à média com o maior desvio

7

Ex: Valores críticos para F ao nível de 5%*

* A tabela indica as probabilidades dos valores serem diferentes(confiabilidade de 95% para não haver diferença significativa entre os resultados)

3 4 5 6 12 20 Numer.

3 9,28 9,12 9,01 8,94 8,74 8,644 6,59 6,39 6,26 6,16 5,91 5,80 5 5,41 5,19 5,05 4,95 4,68 4,566 4,76 4,53 4,39 4,28 4,00 3,8712 3,49 3,26 3,11 3,00 2,69 2,5420 3,10 2,87 2,71 2,60 2,28 2,12Denom.

Graus lib.

8

Tabelas para os valores críticos de F

EXERCÍCIO

Exerc 3-Comente sobre a diferença na precisão obtida nos laboratóriosA e B para a determinação de Mg em uma mesma amostra deleite considerando um nível de confiança de 95%.Dados:Lab. A : 34,97; 34,85; 34,94 e 34,88 mg L-1 e Lab. B : 35,02; 34,96; 34,99; 35,07 e 34,85 mg L-1

(Precisões semelhantes, comparáveis)9

Após “entender” os conceitos de precisão e exatidão, que erros afetam esses parâmetros ?

TIPOS ERROS:

- SISTEMÁTICOS (rastreados e evitados)

- ALEATÓRIOS (sempre presentes)

10

Erros de Método : surgem do comportamento químico ou físico não ideal de sistemas analíticos

Erros Pessoais : resultam da falta de cuidado, falta de atenção ou limitações pessoais do analista

Erros Instrumentais: causados pelo comportamento não ideal de um instrumento, por calibrações falhas ou pelo uso de condições inadequadas

1) Erros Sistemáticos ou Determinados(Podem ser conhecidos e rastreados)

afetam a exatidão

11

Como detectar um erro sistemático?

• Material certificado (CRM)

• Método de adição e recuperação

• Método comparativo

• Testes interlaboratoriais

Erros Sistemáticos ou Determinados(Podem ser conhecidos e rastreados)

12

afetam a precisão

Variam de acordo comuma distribuição normal

Medidas flutuam aleatoriamente

ao redor da média

2) Erros Indeterminados(aleatórios ou randômicos)

� Não podem ser localizados…

13

Ex de uma Distribuição Normal (Calibração de uma pipeta)

50

9.9699.971

9.9819.983

9.9939.995

9.9879989

9.9759.977

% d

as m

edid

as

30

10

Curva de Gauss(Perfil da distribuição)

OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)

volume (mL)

Histograma mostrando a distribuição de 50 medidas do volume escoado por uma pipetade 10 mL

14

Característica de uma Distribuição Normal

Os resultados são alterados ora para menos, ora para mais,por erros que parecem se dar ao acaso (aleatórios), que é um

comportamento esperado e, por isso, “normal”

Karl F. Gauss

15

Y =1

σ √2πexp -

12

(Xi - µ)2

σ2

� Probabilidade de ocorrência de um resultado (Y)

Distribuição Normal de Gauss

µ corresponde a média da população(situação de várias medidas)

OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)

� Assim, pode-se calcular uma faixa para um resultado R supondo que os desvios observados seguem uma distribuição normal

16

Distribuição Normal e a Estatística Clássica

Para a estatística clássica os desvios da normalidade não afetam osresultados do ponto de vista estatístico (métodos robustos) e istaidéia é apresentada no “Teorema do Limite Central”:

17

“Se a flutuação total numa certa variável aleatória for o resultado da soma das flutuações de muitas variáveis independentes e de

importância mais ou menos igual, a sua distribuição tenderá para a normalidade, não importa qual seja a natureza das distribuições das

variáveis individuais”

W S Gossett (1868 – 1937):

Desenvolveu a distribuição de Student para analisarresultados do teor de álcool em cerveja

00

0,1

0,2

0,3

0,4

+_

+1σ+2σ-2σ -1σ

µµ = x ± z σ

√ NF

requ

ênci

a re

lativ

a

Limites de confiança para a media de um resultado

Níveis de Confiança para Z %

50 0,67

68 1,00

80 1,28

90 1,64

95 1,96

95,4 2,00

99 2,58

99,7 3,00

99,9 3,29Distribuição Normal de Gauss

OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp) 18

µ = x ± t S

√ N

Limites de confiança da média quando não se tem µ

µ = x ± z σ√ N

Graus de liberdade 95% 99%

1 12,71 63,662 4,30 9,933 3,18 5,844 2,78 4,605 2,57 4,036 2,45 3,717 2,36 3,508 2,31 3,369 2,26 3,2510 2,23 3,17. . .. . .

∞ 1,96 2,58

OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp) 19

Exemplo 4 (aplicação do conceito na expressão de um resultado):

Um indivíduo fez quatro determinações de ferro em umaliga metálica, encontrando um valor médio de 31,40% m/me uma estimativa do desvio padrão de 0,11% m/m. Qual ointervalo em que deve estar a média da população, com umgrau de confiança de 95%?

µ = ?

µ = 31,40 ± (3,18 x 0,11) / 4

µ = 31,40 ± 0,17 � C Fe = (31,23 – 31,57)% m/m

µ = x ± t S

√ N

20

Exemplo de aplicação deste conceito (Aula 4: Experimento de amostragem)

Ex: Comparação da distribuição de cores de confeitos M&Mcom a especificação do fabricante

� Amostragem dos analistas diferentes

� média (X) e estimativa do desvio (S) para cada cor

� Média do fabricante (µ)

� Calcula-se t com a confiança desejada e compara-se com o valor tabelado:

Se o t calc < t tab� não existe diferença significativa entre as médias 21

µ - xS

√ Nt =

Outra aplicação para o Limite de confiança da média

Comparação de uma média com um valor de referênciaquando não se tem o desvio do valor de referência e nãose pode calcular Sp

µ = x ± t S

√ N

22

IC para o resultado “R”

Valor referênciaEx de situação em que o resultado

obtidoconcorda com o

valor de referência

ν t tabelado = N-1

� Principalmente quando as precisões são comparáveis,pode-se também comparar as médias: Teste t, deStudent

� Avaliar métodos diferentes

(n1-1) S12 + (n2 -1) S2

2

n1 + n2 - 2Sp=

SE tcalculado < tcrítico para o nível de confiança desejado: não existe diferença significativa entre as médias e as

diferenças observadas se devem a erros aleatórios

n é o número das medidaspara cada média

Sp corresponde a S “agrupado”

x1 - x2

Sp

t =n1 + n2n1 . n2

23

ν t tabelado = n1+n2-2

Graus de liberdade 95% 99%

1 12,71 63,662 4,30 9,933 3,18 5,844 2,78 4,605 2,57 4,036 2,45 3,717 2,37 3,508 2,31 3,369 2,26 3,2510 2,23 3,17. . .. . .

∞ 1,96 2,58

Valores críticos para t nos níveis de 95 e 99%(P= 0,025 e P= 0,005)

� Testes estatísticos são válidos quando os erros envolvidos são aleatórios

� Mais confiáveis serão os testes quanto maior o ν (graus de liberdade)24

Outras formas de utilizar o teste-t

Comparação de dados em pares (teste-t pareado)

dSd√ N

t =

25

Amostras diferentes (do mesmo tipo ou de lotes diferentes) analisadas por métodos diferentes ou analistas diferentes

Procedimento:

1) Organizar os dados em pares2) Calcular o “desvio padrão” entre as diferenças das médias (dos pares)3) Calcular o valor de t:

ν t tabelado = N-1

ν= número de graus de liberdade

EXERCÍCIO

Exerc 4-

No seu trabalho de pós-graduação você fará comparação de resultados? Em caso afirmativo, qual teste será usado? Por quê?

26

27

Testes estatísticos para comparação de resultados

-Precisão-Exatidão

Testes de hipóteses

-Hipótese nula (H0)H0: µ = µ0

(µ0 é o valor verdadeiro ou de referência)

-Hipótese alternativa (Ha)Ha: µ ≠ µ0

Propagação de erros para um resultado R: alguns exemplos(Erros em cada etapa do processo)

R = A + B – C (soma e sub.)

SR = √ SA2 + SB

2 + SC2

R = AB

C

SR

R= ±

SA

A

2SB

B

2SC

C

2

Erros indeterminados

+ +

(multiplicação e divisão)

28

±

Propagação de ErrosPara “casa”

Exerc. 5:Considerando que o S de uma balança seja de 0,0001 g,calcule a estimativa do desvio-padrão de uma pesagemfeita nesta balança.

(SR= 0,0001g)

29

CASO DE MÉTODOS INSTRUMENTAIS DE ANÁLISE

O TRATAMENTO ESTATÍSTICO INCLUE TAMBÉM:

� Regressão linear

� Curva de calibração (ou analítica)Tipos: - univariada (“convencional”)

- multivariada (métodos quimiométricos)

� Estimativa dos Limites de detecção e quantificação

� Cálculos baseados na Estimativa do desvio padrão do branco para prever a detectabilidade do método

30

REGRESSÃO LINEAR

É a reta que melhor representa a relação entre a propriedade medida (Abs, p. ex) e a concentração dos

padrões

Concentração (mg L-1)0 1

Ab

sorb

ân

cia

Padrões

Branco

Concentração (mg L-1)0 1

Ab

sorb

ân

cia

Padrões

Branco

Abs= 48,3x + 0,24r= 0,9987

- O coeficiente de correlação (r) varia entre -1 e +1- Quanto mais próximo da “unidade”, melhor é a correlação

31

REGRESSÃO LINEAR

� Uma Curva analítica linear nem sempre é possível e uma Regressão não-linear pode ser usada desde que apresente “boa correlação”

� As Regressões lineares são as mais usuais e podem ser obtidas por meio de softwares, que usam o Método dos mínimos quadrados:

n= no de pontos (x1;y1) da calibração

Para y= ax + b, com coef. correlação “r”:

a = ______________n Σxiyi – ΣxiΣyi

n Σxi2 – (Σxi)2

b = y - x

r = _______________________________n Σxiyi – ΣxiΣyi

{ [nΣxi2 – (Σxi

2)] [nΣyi2 – (Σyi )2] } 1/2 32

REGRESSÃO LINEAR

“Para casa”:

Vide ex. 4.9 e 4.10 do “Vogel – Análise Química Quantitativa”, 6ª Ed:

Para determinar quitina por fluorescência molecular utilizou-sepadrões de quitina nas seguintes concentrações: 0,10; 0,20; 0,30 e0,40 µg mL-1 e que resultaram nos seguintes valores de emissão,respectivamente: 5,20; 9,90; 15,30 e 19,10, Cps sendo que o brancogerou leitura de 0,00 Cps. Considerando-se que um coeficiente decorrelação linear superior a 0,99 é satisfatório, calcule a concentraçãode quitina de uma amostra cujo sinal analítico foi de 16,10 Cps.

(r= 0,9987 e C quitina = 0,32 µg mL-1)

33

REGRESSÃO LINEAR E EFEITO MATRIZ

�Sendo a Regressão linear uma reta “média” pode-se calcular a incerteza dos seus coeficientes angulares e lineares

� As incertezas desses coeficientes podem ser usadas para avaliar a própria regressão bem como outros parâmetros

� Avaliação do efeito matriz no desenvolvimento de um método analítico (comparação dos coef. angulares, a):

0 2 4 6 8 10-0.002

0.000

0.002

0.004

0.006

0.008

0.010

0.012

0.014

0.016

0.018

0.020

AI

Concentração de Pb (ug/L)

Curva de adição de padrãoCurva analítica em meio ácido a

meio alcalino

a

meio ácido

1,60 10-3 ± 0,05 10 -3 1,78 10-3 ± 0,03 10-3

Comparação para um nível de 95% de confiança para saber se a calibração

poderia ser feita em meio ácido !

( y= ax + b )

34

REGRESSÃO LINEAR E EFEITO MATRIZ

� Cálculo das incertezas de a e b :

S y/x = [ Σ(yi – y )2 / (n-2) ] 1/2^

Obtido usando a própria equação de regressão

S a = ______________S y/x

[ Σ(xi – x )2 ]1/2S b = S y/x [ Σxi

2 / nΣ(xi- x )2 ]1/2

Uma observação cuidadosa dos valores de yi - y mostram que o erro da regressão é menor nas vizinhanças do centro da curva de calibração !

^

35

REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO

� Estimativa dos LIMITE DE DETECÇÃO (LOD) eLIMITE DE QUANTIFICAÇÃO (LOQ)

� Representam a DETECTABILIDADE DO MÉTODO

LEMBRAR: LOD instrumental é diferente do LOD método

Exemplo:Para quantificar 0,02 mg.kg-1 Pb em uma amostra de peixe por GF AASo LOQ deve ser consideravelmente menor que 0,02 mg.kg-1 Pb

(Análise elementar = Amostra é digerida)� Na solução final a amostra fica diluída (10x p. ex)

�C Pb sol. amostra= 0,02 mg kg-1 / 10 = 0,002 mg kg-1

� LOQ instrumental ≤ 0,002 mg.kg-1 Pb e não 0,02 mg kg-1

36

REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO

� Estimativa dos LIMITE DE DETECÇÃO (LOD) eLIMITE DE QUANTIFICAÇÃO (LOQ)

Definições

Limite de detecção:

É a menor concentração ou massa de analito que pode ser detectado com uma certa confiança

Depende da magnitude do sinal analítico em relação à flutuação do branco:

3 SbrancoLOD=

m m= inclinação curva analítica

37

REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO

� CÁLCULO do LIMITE DE DETECÇÃO (LOD)

CONSIDERAÇÃO:

LOD � concentração correspondente ao Menor sinal detectável

Menor sinal detectável = Sinal branco + 3 S branco

Para que se tenha 99% de confiança

SE Curva analítica: (1) Y= m X + b � b= Sinal branco

Na concentração limite Y = Menor sinal detectável (2)X = LOD

� Substituindo (2) em (1): Sinalbranco + 3 Sbranco = m LOD+ Sinalbranco

3 Sbranco = LODm

38

REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO

� O LIMITE DE QUANTIFICAÇÃO (LOQ)

� No nível do LOD a medida é significativamente afetada pelo ruído instrumental (baixa precisão)

� As medidas quantitativas devem ser feitas num nível superior ao LOD, geralmente:

� PODE ser determinado experimentalmente (em função da precisão) ou considerado igual ao primeiro ponto da curva analítica

10 SbrancoLOQ=

m

39

Outros Usos da Estatística no Laboratório

Métodos quimiométricos para planejamento eotimização de experimentos, análise multivariada de dados ecalibração multivariada

“A quimiometria pode ser definida como sendo a aplicação demétodos matemáticos e estatísticos no planejamento ou naotimização de procedimentos e na obtenção de informaçõesquímicas através da análise de resultados relevantes”

40

41

Recomendação

� Literatura básica para estudos iniciais

Bruns, RE; Faigle, FG. “Quimiometria”, Quím. Nova, 8 (1985) 84

Gemperline, PJ. Practical Guide to Chemometrics (2nd Ed),CRC Press Taylor and Francis, New York (2006)

1- Planejamento fatorial e otimização multivariada

- Conhecer como os diferentes parâmetros experimentais afetamo resultado do experimento (ou análise).

42Tpyr Tat tpyr Mod

Seleção das condições instrumentais do GF AAS

1- Planejamento fatorial e otimização multivariada

- Estabelecer condições experimentais (instrumentais) otimizadas

43

Seleção das condições instrumentais do ICP OES

Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N. “Study of Instrumental Parameters for the Analysis of Milk by

ICP OES Employing Factorial Design”, Brazilian Meeting on Chemistry of Food and Beverages, 2004.

Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N. “Study of Instrumental Parameters for the Analysis of Milk by

ICP OES Employing Factorial Design”, Brazilian Meeting on Chemistry of Food and Beverages, 2004.

-1,2

-0,72

-0,24

0,24

0,72

1,2

1,2

0,96

0,72

0,480,24

0

-0,24-0,48

-0,72-0,96

-1,2

0

2

4

6

8

10

12

14

16

Mg

II / M

g I

N

P

y= 6.74 + 1.89 P –4.34 N – 0.59 A – 0.69 PN – 0.34 PA + 0.34 NA

2- Análise multivariada de resultados

Um exemplo na área de Química analítica:

ACP ACN

Ca (mg L-1) 178 - 232 107 – 237

Mg 87 - 129 50 – 88

Mn 1,8 – 2,8 1,0 – 4,8

Fe 0,08 – 0,18 0,04 – 0,18

Zn 0,20 – 0,36 não detectado

Cu 0,09 – 0,19 não detectado

Dados experimentais obtidos para as diferentes amostras:

44

2- Análise multivariada de resultados

� Considerando as variações para cada parâmetro (analito), busca-se as possíveis similaridades entre as amostras

UTILIZAR: Recursos para Análise exploratória, como PCA

Gráfico de scores:

Amostras num espaço multidimensional

PCA: Análise de Componentes Principais45

� Na PCA realizada compara-se o Gráfico de scores com o de loadings para se entender as “separações” encontradas

Verificação de correlações entre dados

46

3- Calibração multivariada para análise de solos, alimentos, medicamentos e fluidos biológicos

- Utiliza-se um único método analítico para detectar equantificar vários parâmetros em uma mesma análise

47

3- Calibração multivariada para análise de solos, alimentos e medicamentos

48

TABLE I:

Correlation Coefficient Values for Both Calibration and Validation Models Obtained via PLSR 1 for All Inorganic Elements

Element

Correlation Coefficient

Element

Correlation Coefficient

Calibration Validation Calibration Validation

Ca 0.99992 0.84705 K 0.99751 0.99558

P 0.98802 0.96488 Mg 0.96973 0.90379

Na 0.99367 0.98957 Cl 0.99982 0.99275

3- Calibração multivariada para análise de solos, alimentos e medicamentos

49

TABLE II: Correlation Coefficient Values for Calibration a nd ValidationModels Obtained via PLSR 1 for the Organic Compounds

Compounds

Correlation Coefficient

Calibration Validation

Glucose 0.99165 0.94337

Urea 0.99925 0.95103

Creatinine 0.99093 0.96018

BIBLIOGRAFIA

1) D. A. Skoog, D. M. West, F. J. Holler, Stanley R. Crouch Fundamentos de Química Analítica, 8a Ed., CENGAGE Learning, 2009

2) J. Mendham, R. C. Denney, J. D. Barnes, M. Thomas Vogel - Análise Química Quantitativa, 6a ed., LTC, 2002

3) D. C. Harris, Análise Química Quantitativa, 7a ed., LTC, 2008

4) B. B. Neto, I. E. Scarminio, R. E. Bruns,Como Fazer Experimentos,Editora da Unicamp, 2001

5) J. N. Miller, J. C. Miller,Statistics and Chemometrics for Analytical Chemistry,5th Ed, Pearson Education Limited, 2005

50