4
Técnicas de Data-Mining e reconhecimento de padrões aplicada na predição do nível de satisfação dos colaboradores de um hospital na cidade de Guarapuava/PR Fabio Horst Aluno do Mestrado em métodos numéricos e engenharia UFPR Centro Politécnico - Jardim das Américas - C. P. 19011 E-mail [email protected] Celso Martins Junior Aluno do Mestrado em métodos numéricos e engenharia UFPR Centro Politécnico - Jardim das Américas - C. P. 19011 E-mail [email protected] Drª Luzia Vidal de Souza Professora do Programa de Métodos Numéricos e Engenharia UFPR Centro Politécnico - Jardim das Américas - C. P. 19011 E-mail: [email protected] Palavras-chave: Reconhecimento de padrões, Redes Neurais Artificiais, T² de Hotelling. Resumo: A pesquisa que ora se propõem busca, através da aplicação de um questionário, detectar padrões de comportamento dos funcionários de um hospital da cidade de Guarapuava/Pr, capazes de classificá-los como satisfeito ou insatisfeitos. Utilizar esses padrões na predição para um novo funcionário como satisfeito ou insatisfeito, tentando desta maneira diminuir a rotatividade (turnover) do pessoal. A partir dos dados coletados trabalhamos com o algoritmo k-means, o teste T² de Hotelling e Redes Neurais Artificiais. 1 Considerações Iniciais Ao pensarmos o capital humano das organizações é importante considerarmos o ambiente de trabalho que envolve, basicamente, empregadores e empregados. Estudar essa relação implica, ainda, pensarmos na satisfação e na motivação dos envolvidos. Desconsiderar esses fatores pode comprometer, de certo modo, a eficiência, o desempenho e a produtividade. O Padrão de comportamento, no que concerne aos Recursos Humanos, podem gerar informações relevantes que auxiliem o entendimento de um dos grandes problemas do setor de saúde, que é a alta rotatividade (turnover) de funcionários. Em estudos realizados a acerca do tema, Zucchi; Bittar (2002), afirmam que “a rotatividade é um dos fatores que interferem diretamente na produtividade de um hospital, ou seja, o desenfreado processo de contratar e demitir não contribui para o aumento da produtividade do hospital”. Refletindo, assim, de maneira negativa, na recuperação dos pacientes e na satisfação funcional. Uma vez que, apesar da significativa evolução tecnológica que a área da saúde dispõem, como inovações na administração de medicamentos, monitoramentos das funções vitais dos indivíduos, e procedimentos cirúrgicos realizados somente por máquinas, sua oferta se mantem fundamentalmente mediada por pessoas. Nesse sentido, buscamos a partir de um questionário composto por 50 perguntas, destas 25 relacionadas à satisfação e 25 à características pessoais dos envolvidos, identificar padrões comportamentais de funcionários satisfeito ou insatisfeitos, com intuito de utilizar esses padrões na predição para um novo candidato, tentando desta maneira diminuir a rotatividade do pessoal. O questionário foi aplicado aos funcionários do Hospital Santa Tereza de Guarapuava/PR, no período de abril e maio de 2012 . A unidade de saúde conta hoje com cerca de 400 colaboradores. Deste total, 245 indivíduos responderam aos questionários, os quais compõem o corpus do presente trabalho, e serão analisadas a partir dos softwares IBM SPSS Statistics 20 e BioEstat 5.0. 173 ISSN 2317-3297

Técnicas de Data-Mining e reconhecimento de padrões ... · Perceptron de Múltiplas camadas, com 80% dos dados para treinamento e 20% para testes, uma camada oculta, 6 neurônios

  • Upload
    lamanh

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Técnicas de Data-Mining e reconhecimento de padrões ... · Perceptron de Múltiplas camadas, com 80% dos dados para treinamento e 20% para testes, uma camada oculta, 6 neurônios

Técnicas de Data-Mining e reconhecimento de padrões aplicada na predição do nível de satisfação dos colaboradores de um hospital na cidade

de Guarapuava/PR

Fabio HorstAluno do Mestrado em métodos numéricos e engenharia

UFPRCentro Politécnico - Jardim das Américas - C. P. 19011

E-mail [email protected]

Celso Martins JuniorAluno do Mestrado em métodos numéricos e engenharia

UFPRCentro Politécnico - Jardim das Américas - C. P. 19011

E-mail [email protected]

Drª Luzia Vidal de SouzaProfessora do Programa de Métodos Numéricos e Engenharia

UFPRCentro Politécnico - Jardim das Américas - C. P. 19011

E-mail: [email protected]

Palavras-chave: Reconhecimento de padrões, Redes Neurais Artificiais, T² de Hotelling.

Resumo: A pesquisa que ora se propõem busca, através da aplicação de um questionário, detectar padrões de comportamento dos funcionários de um hospital da cidade de Guarapuava/Pr, capazes de classificá-los como satisfeito ou insatisfeitos. Utilizar esses padrões na predição para um novo funcionário como satisfeito ou insatisfeito, tentando desta maneira diminuir a rotatividade (turnover) do pessoal. A partir dos dados coletados trabalhamos com o algoritmo k-means, o teste T² de Hotelling e Redes Neurais Artificiais.

1 Considerações Iniciais

Ao pensarmos o capital humano das organizações é importante considerarmos o ambiente de trabalho que envolve, basicamente, empregadores e empregados. Estudar essa relação implica, ainda, pensarmos na satisfação e na motivação dos envolvidos. Desconsiderar esses fatores pode comprometer, de certo modo, a eficiência, o desempenho e a produtividade. O Padrão de comportamento, no que concerne aos Recursos Humanos, podem gerar informações relevantes que auxiliem o entendimento de um dos grandes problemas do setor de saúde, que é a alta rotatividade (turnover) de funcionários. Em estudos realizados a acerca do tema, Zucchi; Bittar (2002), afirmam que “a rotatividade é um dos fatores que interferem diretamente na produtividade de um hospital, ou seja, o desenfreado processo de contratar e demitir não contribui para o aumento da produtividade do hospital”. Refletindo, assim, de maneira negativa, na recuperação dos pacientes e na satisfação funcional. Uma vez que, apesar da significativa evolução tecnológica que a área da saúde dispõem, como inovações na administração de medicamentos, monitoramentos das funções vitais dos indivíduos, e procedimentos cirúrgicos realizados somente por máquinas, sua oferta se mantem fundamentalmente mediada por pessoas.

Nesse sentido, buscamos a partir de um questionário composto por 50 perguntas, destas 25 relacionadas à satisfação e 25 à características pessoais dos envolvidos, identificar padrões comportamentais de funcionários satisfeito ou insatisfeitos, com intuito de utilizar esses padrões na predição para um novo candidato, tentando desta maneira diminuir a rotatividade do pessoal. O questionário foi aplicado aos funcionários do Hospital Santa Tereza de Guarapuava/PR, no período de abril e maio de 2012 . A unidade de saúde conta hoje com cerca de 400 colaboradores. Deste total, 245 indivíduos responderam aos questionários, os quais compõem o corpus do presente trabalho, e serão analisadas a partir dos softwares IBM SPSS Statistics 20 e BioEstat 5.0.

173

ISSN 2317-3297

Page 2: Técnicas de Data-Mining e reconhecimento de padrões ... · Perceptron de Múltiplas camadas, com 80% dos dados para treinamento e 20% para testes, uma camada oculta, 6 neurônios

2 Métodos e procedimentos

A identificação dos grupos é o inicio da nossa pesquisa, com aplicação do questionário sobre satisfação, temos dados para realizar a separação dos indivíduos em dois clusters. Para Martins (2011) “A tarefa de clusterização ou agrupamento tem como princípio básico a reunião de registros que possuam similaridades em uma base dados, particionando-os em subconjuntos, denominados de clusters”.

Com as respostas relacionadas a satisfação dos 245 indivíduos, o primeiro passo foi utilizar o SPSS, especificamente o toolbox k-means, para que com esse algorítimo pudéssemos separar os indivíduos satisfeitos e os insatisfeitos. Entendemos que o k-means é adequado para esse problema, pois a lógica do seu algorítimo, minimiza a soma dos quadrados das distancias entre os dados e o centróide correspondente do conjunto, resultando assim em um agrupamento considerado aceitável, conforme afirma Pimentel.

Também com o intuito de agrupar corretamente os indivíduos, buscamos outro método para testar a classificação encontrada com o algorítimo k-means, o Teste T² de Hotelling, este teste é uma técnica estatística multivariada que testa as diferenças entre dois clusters pré-definidos que foi aplicada tento respostas aceitáveis.

A partir dos resultados obtidos iniciamos o processo que vai determinar os atributos capazes de generalizar as informações extraídas dos questionários de caráter pessoal, a técnica de Redes Neurais Artificiais é indicada quando necessitamos reconhece padrões a partir de banco de dados ou de exemplos e quando sua exibição é complexa, conforme afirma Almeida:

Uma rede neural artificial (RNA) é um modelo de processamento de dados que emula uma rede de neurônios biológicos, capaz de recuperar rapidamente uma grande quantidade de dados e reconhecer padrões baseados na experiência. São sistemas que se adaptam utilizando uma abordagem de processamento distribuído, no qual os neurônios se comunicam por meio de uma rede de elos interconectados (ALMEIDA, 2009, p. 435)

E, com isso, predizer se um novo indivíduo será classificado como satisfeito ou insatisfeito, Fizemos uso do software IBM SPSS statistics 20, para treinamento e teste da rede, optamos pela RNA Perceptron de Múltiplas camadas, com 80% dos dados para treinamento e 20% para testes, uma camada oculta, 6 neurônios na camada oculta, função de ativação Sigmoide, tipo de treinamento on-line.

3 Resultados

Após a aplicação do algorítimo k-means obtivemos o seguinte resultado: 146 indivíduos foram classificados como satisfeito e 99 como insatisfeitos (quaro 1).

Number of Cases in each

Cluster

Cluster 1 146,000

2 99,000

Valid 245,000

Missing ,000

Quadro 1 – Resultados classificação no SPSS

Para aplicar o teste de T² de Hotelling fizemos uso do software Bioestat 5.0, onde, para que

174

ISSN 2317-3297

Page 3: Técnicas de Data-Mining e reconhecimento de padrões ... · Perceptron de Múltiplas camadas, com 80% dos dados para treinamento e 20% para testes, uma camada oculta, 6 neurônios

rejeitemos a hipótese dos grupos pertencerem ao mesmo centro de médias a restrição T² > F (F de snedecor), é precisa ser satisfeita. Encontramos T² = 758,58 e F= 27,35, confirmando assim a separação dos grupos.

Na fase de treinamento a RNA classificou corretamente 81% dos indivíduos, e com uma porcentagem considerável na fase de teste, com cerca de 93% corretamente.

Quadro 2 – Predição dos valores na fase de treinamento (SPSS)

4 Considerações Finais

Observamos a partir das análises realizadas que os resultados foram consistentes, na primeira fase, de mineração dos dados, utilizando o k-means para separação dos grupos, verificamos que a técnica empregada resultou em um agrupamento satisfatório, comprovado pelo teste T² de Hotelling.

Com os resultados da RNA no reconhecimento de padrões percebemos que existem diferenças entre indivíduos satisfeitos e insatisfeitos, que por meio da análise multivariada são possíveis de serem identificadas e utilizadas na predição de novos indivíduos, contribuindo assim, na gestão de RH do hospital pesquisado. Considerando a margem de erro, mostramos com esta pesquisa que as técnicas empregadas são capazes de contribuir significativamente na redução da rotatividade de pessoal do hospital.

Os resultados já se mostram satisfatório, embora a pesquisa ainda se encontre em andamento. Esperamos obter um mecanismo para a predição de novos colaboradores e fornecer subsídio eficaz de informações aos gestores do hospital, no que diz respeito à seleção e ao recrutamento de funcionários.

Matriz de Confusão Treinamento0 1

0 107 9 81%1 28 46 19%

Matriz de Confusão Teste0 1

0 29 1 93%1 3 22 7%

175

ISSN 2317-3297

Page 4: Técnicas de Data-Mining e reconhecimento de padrões ... · Perceptron de Múltiplas camadas, com 80% dos dados para treinamento e 20% para testes, uma camada oculta, 6 neurônios

5 Referências

[1] F. C. Almeida. “Análise multivariada: para os cursos de administração, ciências contábeis e economia”. FIPECAFI, São Paulo: Atlas, 2009. p 435-444.

[2] D. P. Martins “Aplicação do Algoritmo K-means em Dados da Prevalência de Asma e Rinite em Escolares” Revista da Sociedade Brasileira de Informação em Saúde, vol. 3, nº 4, São Paulo, 2011.

[3] P. E. Pimentel “Seleção de Avaliações Adaptativas em Sistemas Gerenciadores de Aprendizagem Utilizando Mineração de Dados” TE&ET Revista Iberoamericana de Tecnología en Educación y Educación en Tecnología, Universidade IMES, São Caetano do Sul.

[4] P. Zucchi, O. J. N.V. Bittar. “Funcionários por leito: estudo em alguns hospitais públicos e privados”. RAS. Vol. 4, Nº 14 – Jan-Mar, 2002.

176

ISSN 2317-3297