Nos últimos posts mostramos alguma ferramentas/métodos para fazermos a seleção de quais fatores levarmos adiante (pareto, lenth’s e normal plot). Este levar adiante pode ser basicamente duas coisas:
1 – próximos experimentos
2 – análise do modelo reduzido
O primeiro ponto consiste basicamente de seguir o raciocínio crítico e os ciclos de PDSA no seu projeto até que entenda ter atingido um nível de conhecimento suficiente para resolução do seu problema.
O segundo caminho, modelo reduzido, é quando já estamos entregando dentro dos limites desejados e ou já atingimos o grau de conhecimento sobre o tema que gostaríamos de ter atingido.
Vamos supor que fizemos a seleção de fatores com base no Normal Plot (post passado), para o nosso experimento em questão teríamos unicamente o fator T, correto?
Com esta informação elaboramos a equação que explica os dados da seguinte forma:
Y = (efeitoT/2)*T + média global
Assim teríamos:
Y = (-39/2)*T + 58
Y = -19,5*T + 58
Este seria o modelo reduzido do experimento.
Mas e ai, o modelo é bom? O modelo é ruim? Quanto eu erro ou acerto utilizando este modelo? Em qual espaço eu posso aplicá-lo?
Para responder estas perguntas precisamos fazer a análise do modelo reduzido. Vamos falar de R², R² ajustado e resíduo.
R² -> responde a pergunta o quanto o meu Y está sendo explicado com os meus dados.
R² ajustado -> responde a mesma coisa de cima, porém ponderando a resposta em função de quantos graus de liberdade tive que utilizar para explicar meu Y
Resíduo -> é a diferença entre o valor real medido e o valor que o meu modelo diz ser para o mesmo X.
Para a análise de R² e R² ajustado é importante introduzirmos o conceito de análise de variância (ANOVA), que faremos no próximo post.
Para o resíduos vamos mostrar a análise agora:
A primeira ação é usar o modelo reduzido para gerar Y para os mesmos X’s.
Neste exemplo, podemos gerar 2 valores T em -1 e T em +1
Para T em -1: Y=-19,5*(-1) + 58 => 77,5
Para T em +1: =-19,5*(1) + 58 => 38,5
Para os dados do experimento isto representaria:
O Resíduo é a diferença entre o Y e o Ypred.
O que a gente espera do resíduo?
Que ele seja normalmente distribuído, ou seja, não tenha maiores valores em uma região do que em outra
Deve ter média centrada em 0
A variância deve ser constante
Para fazer as análises de resíduos, buscando os pontos acima geralmente fazemos os seguintes gráficos:
Resíduo vs Run Order
Buscamos ver se existe alguma região de maior valor de resíduo ou concentração – neste caso pode-se percerber que tendemos a ter resíduos positivos e maiores no extremo do experimento do que no centro, onde inclusive teremos resíduos negativos.
Y e Ypred
Buscamos ver quão descolado estamos entre o real e o previsto assim como também buscamos regiões e maior erro, tal como o gráfico anterior vemos que tendemos a errar mais nos valores extremos do modelo.
Com base nesses dois gráficos, já podemos ter boas ideias do que fazer ou não com o nosso modelo.
Nos vemos no próximo post.