O uso de machine learning para identificação preventiva de lesões em jogadores de vôlei
Resumo
O voleibol é bastante praticado e seus atletas podem sofrer com lesões devido a natureza do esporte, seja em saltos e aterrisagens, contato com a bola ou até mesmo com outros jogadores. O presente estudo então buscou realizar uma análise exploratória das contusões sofridas por jogadores e aplicar um algoritmo de machine learning não supervisionado para clusterização dos registros a fim de identificar padrões e servir de insight para estratégias de prevenção. Os dados foram obtidos por meio do Sistema Nacional de Vigilância Eletrônica de Lesões (NEISS), um sistema de observação de lesões exercido pela Comissão de Segurança de Produtos de Consumo dos EUA (CPSC). Foram selecionados dados de 2004 a 2023, contemplando 28.201 casos, que reduziram a 17.332 após filtragens de idade e relevância das categorias de cada coluna. Foram selecionadas as colunas de idade, gênero, parte do corpo afetada, diagnóstico e narrativa (que descreve em poucas palavras a lesão). A variável idade foi filtrada para as idades entre 10 e 35 anos e padronizada utilizando o método StandardScaler do pacote scikit-learn. Já as variáveis categóricas foram convertidas para um formato numérico, aplicando a técnica de one-hot enconding. Por fim na coluna de narrativa foi aplicada a Term Frequency–Inverse Document Frequency (TF-IDF), uma técnica de processamento de linguagem natural (NLP), bem como a extração dos verbos mais presentes, que após análise de relevância para o contexto da pesquisa, foram transformados em colunas. A partir disso, com base nos métodos do cotovelo e de silhouette o número de clusters foi definido em k=5 e após foi aplicado o algoritmo KMeans. Uma função de similiaridade do cosseno foi aplicada entre os registros de um mesmo cluster na coluna narrativa para avaliar a consistência dos casos intraclusters. Os clusters foram analisados a partir de sua distribuição de variáveis, identificando padrões que podem servir para que estratégias de treino e fortalecimento de partes do corpo possam ser traçadas. Foi possível reconhecer padrões como por exemplo entorses nos dedos de meninas adolescentes em ações de torção por compressão e impacto/colisão, o que pode indicar que foram em ações do bloqueio ou ataque, comuns à prática do voleibol. A base de dados, por ser mais generalista carece de informações mais específica que poderiam trazer ainda mais informações aos clusters como por exemplo peso, altura, posição em que o atleta atua e se o fato ocorreu em jogo ou treino.
Palavras-chave
Texto completo:
PDFDOI: https://doi.org/10.5102/pic.n0.0.10756
Apontamentos
- Não há apontamentos.
