Upload
vuonganh
View
215
Download
0
Embed Size (px)
Citation preview
QUÍMICA ANALÍTICA AVANÇADA – 1S 2015
MÓDULO 2
3ª aula
Estatística
- Conceitos básicos
Notas de aula: www.ufjf.br/baccan
Prof. Rafael Arromba de SousaDepartamento de Química - [email protected]
Estatística Aplicada à Química Analítica
Aula 2:- Conceitos e definições básicos� Não existe um valor absoluto para um
resultado analítico� Forma correta de expressar os resultados� Definição de exatidão e precisão� Importância de rejeitar resultados anômalos
Aula 3:- Conceitos básicos (continuação)
- Noções de Quimiometria3
RELAÇÃO ENTRE EXATIDÃO E PRECISÃO
A Exatidão e a Precisão se relacionam de 3 formas principais:
Métodode análise
C
B
A
preciso e exato !
preciso mas inexato
impreciso e inexato
Conc. do analitovalor verdadeiro
EXEMPLOS PRÁTICOS ?? 3
Algumas formalidades... TERMINOLOGIAS
Codex Committee on Methods of Analysis and Sampling. Guidelines on Analytical Terminology (CAC/GL72 – 2009)
1) Boa precisão = Boa repetibilidade ≠ reprodutibilidade
4
1. Definição do problema analítico2. Escolha do método de análise
3. Amostragem
4. Tratamento da amostra (e separação da espécie de interesse)
5. Calibração
6. Medida analítica RESULTADO (MÉDIA ± INCERTEZA)7. Avaliação dos resultados : RESULTADO OBTIDO x RESULTADO ESPERADO
8. Ação
A ESTATÍSTICA NA ANÁLISE QUÍMICA
Comparação de Resultados:
6
ComparaçãoPrecisões (Teste F)
Médias (Teste t de Student)
Teste F (ou Teste de Snedecor)
F = SA
2
SB2
SE Fcalculado ≥ Ftabelado para a confiabilidade desejada
Existe diferença significativa entre os conjuntosde dados
SE Fcalculado < Fcrítico para a confiabilidade desejada
Não existe diferença significativa entre os conjuntosde dados
�Comparar precisões(ou variâncias)
de duas médias (A e B)“A” refere-se à média com o maior desvio
7
Ex: Valores críticos para F ao nível de 5%*
* A tabela indica as probabilidades dos valores serem diferentes(confiabilidade de 95% para não haver diferença significativa entre os resultados)
3 4 5 6 12 20 Numer.
3 9,28 9,12 9,01 8,94 8,74 8,644 6,59 6,39 6,26 6,16 5,91 5,80 5 5,41 5,19 5,05 4,95 4,68 4,566 4,76 4,53 4,39 4,28 4,00 3,8712 3,49 3,26 3,11 3,00 2,69 2,5420 3,10 2,87 2,71 2,60 2,28 2,12Denom.
Graus lib.
8
Tabelas para os valores críticos de F
EXERCÍCIO
Exerc 3-Comente sobre a diferença na precisão obtida nos laboratóriosA e B para a determinação de Mg em uma mesma amostra deleite considerando um nível de confiança de 95%.Dados:Lab. A : 34,97; 34,85; 34,94 e 34,88 mg L-1 e Lab. B : 35,02; 34,96; 34,99; 35,07 e 34,85 mg L-1
(Precisões semelhantes, comparáveis)9
Após “entender” os conceitos de precisão e exatidão, que erros afetam esses parâmetros ?
TIPOS ERROS:
- SISTEMÁTICOS (rastreados e evitados)
- ALEATÓRIOS (sempre presentes)
10
Erros de Método : surgem do comportamento químico ou físico não ideal de sistemas analíticos
Erros Pessoais : resultam da falta de cuidado, falta de atenção ou limitações pessoais do analista
Erros Instrumentais: causados pelo comportamento não ideal de um instrumento, por calibrações falhas ou pelo uso de condições inadequadas
1) Erros Sistemáticos ou Determinados(Podem ser conhecidos e rastreados)
afetam a exatidão
11
Como detectar um erro sistemático?
• Material certificado (CRM)
• Método de adição e recuperação
• Método comparativo
• Testes interlaboratoriais
Erros Sistemáticos ou Determinados(Podem ser conhecidos e rastreados)
12
afetam a precisão
Variam de acordo comuma distribuição normal
Medidas flutuam aleatoriamente
ao redor da média
2) Erros Indeterminados(aleatórios ou randômicos)
� Não podem ser localizados…
13
Ex de uma Distribuição Normal (Calibração de uma pipeta)
50
9.9699.971
9.9819.983
9.9939.995
9.9879989
9.9759.977
% d
as m
edid
as
30
10
Curva de Gauss(Perfil da distribuição)
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
volume (mL)
Histograma mostrando a distribuição de 50 medidas do volume escoado por uma pipetade 10 mL
14
Característica de uma Distribuição Normal
Os resultados são alterados ora para menos, ora para mais,por erros que parecem se dar ao acaso (aleatórios), que é um
comportamento esperado e, por isso, “normal”
Karl F. Gauss
15
Y =1
σ √2πexp -
12
(Xi - µ)2
σ2
� Probabilidade de ocorrência de um resultado (Y)
Distribuição Normal de Gauss
µ corresponde a média da população(situação de várias medidas)
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp)
� Assim, pode-se calcular uma faixa para um resultado R supondo que os desvios observados seguem uma distribuição normal
16
Distribuição Normal e a Estatística Clássica
Para a estatística clássica os desvios da normalidade não afetam osresultados do ponto de vista estatístico (métodos robustos) e istaidéia é apresentada no “Teorema do Limite Central”:
17
“Se a flutuação total numa certa variável aleatória for o resultado da soma das flutuações de muitas variáveis independentes e de
importância mais ou menos igual, a sua distribuição tenderá para a normalidade, não importa qual seja a natureza das distribuições das
variáveis individuais”
W S Gossett (1868 – 1937):
Desenvolveu a distribuição de Student para analisarresultados do teor de álcool em cerveja
00
0,1
0,2
0,3
0,4
+_
+1σ+2σ-2σ -1σ
µµ = x ± z σ
√ NF
requ
ênci
a re
lativ
a
Limites de confiança para a media de um resultado
Níveis de Confiança para Z %
50 0,67
68 1,00
80 1,28
90 1,64
95 1,96
95,4 2,00
99 2,58
99,7 3,00
99,9 3,29Distribuição Normal de Gauss
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp) 18
µ = x ± t S
√ N
Limites de confiança da média quando não se tem µ
µ = x ± z σ√ N
Graus de liberdade 95% 99%
1 12,71 63,662 4,30 9,933 3,18 5,844 2,78 4,605 2,57 4,036 2,45 3,717 2,36 3,508 2,31 3,369 2,26 3,2510 2,23 3,17. . .. . .
∞ 1,96 2,58
OBS: Transparência preparada a partir de material do Prof Célio Pasquini (IQ-Unicamp) 19
Exemplo 4 (aplicação do conceito na expressão de um resultado):
Um indivíduo fez quatro determinações de ferro em umaliga metálica, encontrando um valor médio de 31,40% m/me uma estimativa do desvio padrão de 0,11% m/m. Qual ointervalo em que deve estar a média da população, com umgrau de confiança de 95%?
µ = ?
µ = 31,40 ± (3,18 x 0,11) / 4
µ = 31,40 ± 0,17 � C Fe = (31,23 – 31,57)% m/m
µ = x ± t S
√ N
√
20
Exemplo de aplicação deste conceito (Aula 4: Experimento de amostragem)
Ex: Comparação da distribuição de cores de confeitos M&Mcom a especificação do fabricante
� Amostragem dos analistas diferentes
� média (X) e estimativa do desvio (S) para cada cor
� Média do fabricante (µ)
� Calcula-se t com a confiança desejada e compara-se com o valor tabelado:
Se o t calc < t tab� não existe diferença significativa entre as médias 21
µ - xS
√ Nt =
Outra aplicação para o Limite de confiança da média
Comparação de uma média com um valor de referênciaquando não se tem o desvio do valor de referência e nãose pode calcular Sp
µ = x ± t S
√ N
22
IC para o resultado “R”
Valor referênciaEx de situação em que o resultado
obtidoconcorda com o
valor de referência
ν t tabelado = N-1
� Principalmente quando as precisões são comparáveis,pode-se também comparar as médias: Teste t, deStudent
� Avaliar métodos diferentes
(n1-1) S12 + (n2 -1) S2
2
n1 + n2 - 2Sp=
SE tcalculado < tcrítico para o nível de confiança desejado: não existe diferença significativa entre as médias e as
diferenças observadas se devem a erros aleatórios
n é o número das medidaspara cada média
Sp corresponde a S “agrupado”
x1 - x2
Sp
t =n1 + n2n1 . n2
23
ν t tabelado = n1+n2-2
Graus de liberdade 95% 99%
1 12,71 63,662 4,30 9,933 3,18 5,844 2,78 4,605 2,57 4,036 2,45 3,717 2,37 3,508 2,31 3,369 2,26 3,2510 2,23 3,17. . .. . .
∞ 1,96 2,58
Valores críticos para t nos níveis de 95 e 99%(P= 0,025 e P= 0,005)
� Testes estatísticos são válidos quando os erros envolvidos são aleatórios
� Mais confiáveis serão os testes quanto maior o ν (graus de liberdade)24
Outras formas de utilizar o teste-t
Comparação de dados em pares (teste-t pareado)
dSd√ N
t =
25
Amostras diferentes (do mesmo tipo ou de lotes diferentes) analisadas por métodos diferentes ou analistas diferentes
Procedimento:
1) Organizar os dados em pares2) Calcular o “desvio padrão” entre as diferenças das médias (dos pares)3) Calcular o valor de t:
ν t tabelado = N-1
ν= número de graus de liberdade
EXERCÍCIO
Exerc 4-
No seu trabalho de pós-graduação você fará comparação de resultados? Em caso afirmativo, qual teste será usado? Por quê?
26
27
Testes estatísticos para comparação de resultados
-Precisão-Exatidão
Testes de hipóteses
-Hipótese nula (H0)H0: µ = µ0
(µ0 é o valor verdadeiro ou de referência)
-Hipótese alternativa (Ha)Ha: µ ≠ µ0
Propagação de erros para um resultado R: alguns exemplos(Erros em cada etapa do processo)
R = A + B – C (soma e sub.)
SR = √ SA2 + SB
2 + SC2
R = AB
C
SR
R= ±
SA
A
2SB
B
2SC
C
2
Erros indeterminados
+ +
(multiplicação e divisão)
28
±
Propagação de ErrosPara “casa”
Exerc. 5:Considerando que o S de uma balança seja de 0,0001 g,calcule a estimativa do desvio-padrão de uma pesagemfeita nesta balança.
(SR= 0,0001g)
29
CASO DE MÉTODOS INSTRUMENTAIS DE ANÁLISE
O TRATAMENTO ESTATÍSTICO INCLUE TAMBÉM:
� Regressão linear
� Curva de calibração (ou analítica)Tipos: - univariada (“convencional”)
- multivariada (métodos quimiométricos)
� Estimativa dos Limites de detecção e quantificação
� Cálculos baseados na Estimativa do desvio padrão do branco para prever a detectabilidade do método
30
REGRESSÃO LINEAR
É a reta que melhor representa a relação entre a propriedade medida (Abs, p. ex) e a concentração dos
padrões
Concentração (mg L-1)0 1
Ab
sorb
ân
cia
Padrões
Branco
Concentração (mg L-1)0 1
Ab
sorb
ân
cia
Padrões
Branco
Abs= 48,3x + 0,24r= 0,9987
- O coeficiente de correlação (r) varia entre -1 e +1- Quanto mais próximo da “unidade”, melhor é a correlação
31
REGRESSÃO LINEAR
� Uma Curva analítica linear nem sempre é possível e uma Regressão não-linear pode ser usada desde que apresente “boa correlação”
� As Regressões lineares são as mais usuais e podem ser obtidas por meio de softwares, que usam o Método dos mínimos quadrados:
n= no de pontos (x1;y1) da calibração
Para y= ax + b, com coef. correlação “r”:
a = ______________n Σxiyi – ΣxiΣyi
n Σxi2 – (Σxi)2
b = y - x
r = _______________________________n Σxiyi – ΣxiΣyi
{ [nΣxi2 – (Σxi
2)] [nΣyi2 – (Σyi )2] } 1/2 32
REGRESSÃO LINEAR
“Para casa”:
Vide ex. 4.9 e 4.10 do “Vogel – Análise Química Quantitativa”, 6ª Ed:
Para determinar quitina por fluorescência molecular utilizou-sepadrões de quitina nas seguintes concentrações: 0,10; 0,20; 0,30 e0,40 µg mL-1 e que resultaram nos seguintes valores de emissão,respectivamente: 5,20; 9,90; 15,30 e 19,10, Cps sendo que o brancogerou leitura de 0,00 Cps. Considerando-se que um coeficiente decorrelação linear superior a 0,99 é satisfatório, calcule a concentraçãode quitina de uma amostra cujo sinal analítico foi de 16,10 Cps.
(r= 0,9987 e C quitina = 0,32 µg mL-1)
33
REGRESSÃO LINEAR E EFEITO MATRIZ
�Sendo a Regressão linear uma reta “média” pode-se calcular a incerteza dos seus coeficientes angulares e lineares
� As incertezas desses coeficientes podem ser usadas para avaliar a própria regressão bem como outros parâmetros
� Avaliação do efeito matriz no desenvolvimento de um método analítico (comparação dos coef. angulares, a):
0 2 4 6 8 10-0.002
0.000
0.002
0.004
0.006
0.008
0.010
0.012
0.014
0.016
0.018
0.020
AI
Concentração de Pb (ug/L)
Curva de adição de padrãoCurva analítica em meio ácido a
meio alcalino
a
meio ácido
1,60 10-3 ± 0,05 10 -3 1,78 10-3 ± 0,03 10-3
Comparação para um nível de 95% de confiança para saber se a calibração
poderia ser feita em meio ácido !
( y= ax + b )
34
REGRESSÃO LINEAR E EFEITO MATRIZ
� Cálculo das incertezas de a e b :
S y/x = [ Σ(yi – y )2 / (n-2) ] 1/2^
Obtido usando a própria equação de regressão
S a = ______________S y/x
[ Σ(xi – x )2 ]1/2S b = S y/x [ Σxi
2 / nΣ(xi- x )2 ]1/2
Uma observação cuidadosa dos valores de yi - y mostram que o erro da regressão é menor nas vizinhanças do centro da curva de calibração !
^
35
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
� Estimativa dos LIMITE DE DETECÇÃO (LOD) eLIMITE DE QUANTIFICAÇÃO (LOQ)
� Representam a DETECTABILIDADE DO MÉTODO
LEMBRAR: LOD instrumental é diferente do LOD método
Exemplo:Para quantificar 0,02 mg.kg-1 Pb em uma amostra de peixe por GF AASo LOQ deve ser consideravelmente menor que 0,02 mg.kg-1 Pb
(Análise elementar = Amostra é digerida)� Na solução final a amostra fica diluída (10x p. ex)
�C Pb sol. amostra= 0,02 mg kg-1 / 10 = 0,002 mg kg-1
� LOQ instrumental ≤ 0,002 mg.kg-1 Pb e não 0,02 mg kg-1
36
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
� Estimativa dos LIMITE DE DETECÇÃO (LOD) eLIMITE DE QUANTIFICAÇÃO (LOQ)
Definições
Limite de detecção:
É a menor concentração ou massa de analito que pode ser detectado com uma certa confiança
Depende da magnitude do sinal analítico em relação à flutuação do branco:
3 SbrancoLOD=
m m= inclinação curva analítica
37
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
� CÁLCULO do LIMITE DE DETECÇÃO (LOD)
CONSIDERAÇÃO:
LOD � concentração correspondente ao Menor sinal detectável
Menor sinal detectável = Sinal branco + 3 S branco
Para que se tenha 99% de confiança
SE Curva analítica: (1) Y= m X + b � b= Sinal branco
Na concentração limite Y = Menor sinal detectável (2)X = LOD
� Substituindo (2) em (1): Sinalbranco + 3 Sbranco = m LOD+ Sinalbranco
3 Sbranco = LODm
38
REGRESSÃO LINEAR E OS PARÂMETROS DE MÉRITO
� O LIMITE DE QUANTIFICAÇÃO (LOQ)
� No nível do LOD a medida é significativamente afetada pelo ruído instrumental (baixa precisão)
� As medidas quantitativas devem ser feitas num nível superior ao LOD, geralmente:
� PODE ser determinado experimentalmente (em função da precisão) ou considerado igual ao primeiro ponto da curva analítica
10 SbrancoLOQ=
m
39
Outros Usos da Estatística no Laboratório
Métodos quimiométricos para planejamento eotimização de experimentos, análise multivariada de dados ecalibração multivariada
“A quimiometria pode ser definida como sendo a aplicação demétodos matemáticos e estatísticos no planejamento ou naotimização de procedimentos e na obtenção de informaçõesquímicas através da análise de resultados relevantes”
40
41
Recomendação
� Literatura básica para estudos iniciais
Bruns, RE; Faigle, FG. “Quimiometria”, Quím. Nova, 8 (1985) 84
Gemperline, PJ. Practical Guide to Chemometrics (2nd Ed),CRC Press Taylor and Francis, New York (2006)
1- Planejamento fatorial e otimização multivariada
- Conhecer como os diferentes parâmetros experimentais afetamo resultado do experimento (ou análise).
42Tpyr Tat tpyr Mod
Seleção das condições instrumentais do GF AAS
1- Planejamento fatorial e otimização multivariada
- Estabelecer condições experimentais (instrumentais) otimizadas
43
Seleção das condições instrumentais do ICP OES
Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N. “Study of Instrumental Parameters for the Analysis of Milk by
ICP OES Employing Factorial Design”, Brazilian Meeting on Chemistry of Food and Beverages, 2004.
Sousa, RA; Silva, JCJ; Teófilo, RF; Cadore, S.; Baccan, N. “Study of Instrumental Parameters for the Analysis of Milk by
ICP OES Employing Factorial Design”, Brazilian Meeting on Chemistry of Food and Beverages, 2004.
-1,2
-0,72
-0,24
0,24
0,72
1,2
1,2
0,96
0,72
0,480,24
0
-0,24-0,48
-0,72-0,96
-1,2
0
2
4
6
8
10
12
14
16
Mg
II / M
g I
N
P
y= 6.74 + 1.89 P –4.34 N – 0.59 A – 0.69 PN – 0.34 PA + 0.34 NA
2- Análise multivariada de resultados
Um exemplo na área de Química analítica:
ACP ACN
Ca (mg L-1) 178 - 232 107 – 237
Mg 87 - 129 50 – 88
Mn 1,8 – 2,8 1,0 – 4,8
Fe 0,08 – 0,18 0,04 – 0,18
Zn 0,20 – 0,36 não detectado
Cu 0,09 – 0,19 não detectado
Dados experimentais obtidos para as diferentes amostras:
44
2- Análise multivariada de resultados
� Considerando as variações para cada parâmetro (analito), busca-se as possíveis similaridades entre as amostras
UTILIZAR: Recursos para Análise exploratória, como PCA
Gráfico de scores:
Amostras num espaço multidimensional
PCA: Análise de Componentes Principais45
� Na PCA realizada compara-se o Gráfico de scores com o de loadings para se entender as “separações” encontradas
Verificação de correlações entre dados
46
3- Calibração multivariada para análise de solos, alimentos, medicamentos e fluidos biológicos
- Utiliza-se um único método analítico para detectar equantificar vários parâmetros em uma mesma análise
47
3- Calibração multivariada para análise de solos, alimentos e medicamentos
48
TABLE I:
Correlation Coefficient Values for Both Calibration and Validation Models Obtained via PLSR 1 for All Inorganic Elements
Element
Correlation Coefficient
Element
Correlation Coefficient
Calibration Validation Calibration Validation
Ca 0.99992 0.84705 K 0.99751 0.99558
P 0.98802 0.96488 Mg 0.96973 0.90379
Na 0.99367 0.98957 Cl 0.99982 0.99275
3- Calibração multivariada para análise de solos, alimentos e medicamentos
49
TABLE II: Correlation Coefficient Values for Calibration a nd ValidationModels Obtained via PLSR 1 for the Organic Compounds
Compounds
Correlation Coefficient
Calibration Validation
Glucose 0.99165 0.94337
Urea 0.99925 0.95103
Creatinine 0.99093 0.96018
BIBLIOGRAFIA
1) D. A. Skoog, D. M. West, F. J. Holler, Stanley R. Crouch Fundamentos de Química Analítica, 8a Ed., CENGAGE Learning, 2009
2) J. Mendham, R. C. Denney, J. D. Barnes, M. Thomas Vogel - Análise Química Quantitativa, 6a ed., LTC, 2002
3) D. C. Harris, Análise Química Quantitativa, 7a ed., LTC, 2008
4) B. B. Neto, I. E. Scarminio, R. E. Bruns,Como Fazer Experimentos,Editora da Unicamp, 2001
5) J. N. Miller, J. C. Miller,Statistics and Chemometrics for Analytical Chemistry,5th Ed, Pearson Education Limited, 2005
50