PROPOSTA DE UM INSTRUMENTO WEB DE DIAGNÓSTICO E CATEGORIZAÇÃO DE BULLYING NO AMBIENTE ESCOLAR

por Davi Marcos Geralda de Souza publicado 08/04/2024 13h16, última modificação 08/04/2024 13h16

Prof.ª Dr.ª Aline Pires Vieira de Vasconcelos (Orientadora)

Embora não seja um fenômeno recente, o bullying se tornou uma temática de relevância atualmente. Esse termo diz respeito a práticas de violência e intimidação sistemáticas, que acontecem principalmente no âmbito educacional, podendo tomar a forma de violência física ou psicológica; atos de intimidação, humilhação, discriminação, entre outros. No Brasil, sobre o tema, temos a lei n. 13.185 de 2015, que instituiu um programa para combater o bullying, tendo como objetivos estimular a prevenção e o combate desta ação através de ações de discussão, orientação, solução e prevenção. A referida lei traz como obrigação, em níveis estaduais e municipais, a produção de relatórios bimestrais de ocorrências de bullying, entretanto, de acordo com observação em duas escolas do município de Campos dos Goytacazes, notou-se que estes relatórios não estão acessíveis. Este trabalho objetivou a proposição de um modelo de categorização de casos de bullying através da mineração de texto, de forma a destacar as categorias de maior ocorrência, gerando conhecimento que possa respaldar a gestão escolar a prevenir e combater os casos de bullying. A mineração de texto é uma ferramenta para extração de conhecimento a partir de dados não estruturados, como bancos de dados, textos ou outras mídias. Utilizou-se ferramentas como inteligência artificial e machine learning para extração de uma base de dados para o teste piloto, que foi composta por tweets relacionados a ocorrência de bullying, pois, de acordo com a literatura, a quantidade de informações e opiniões disponíveis na internet fornece um campo fértil para pesquisas com machine learning. A classificação em categorias de bullying se baseou no referencial da análise de sentimentos, que permite a identificação de temas principais de um documento e classificação de acordo com um conjunto predefinido de tópicos. Para esse processo, foi realizada anotação manual dos tweets em categorias de bullying praticadas, gerando uma base de teste para o algoritmo de classificação utilizado, o Naive Bayes. Os resultados demonstraram que o modelo Naive Bayes de melhor acurácia para a classificação foi o Gaussian Naive Bayes, com 21,7% de acurácia. Os esforços da pesquisa representam um avanço significativo no campo da detecção de bullying por meio da mineração de texto. A análise crítica dos resultados e as considerações sobre os fatores que influenciaram a performance dos modelos oferece insights valiosos para pesquisadores e profissionais interessados em abordar esse problema complexo de maneira mais eficaz e abrangente, apontando para a possibilidade de exploração de técnicas de balanceamento de classes, com inclusão de mais dados representativos de cada classe, bem como utilização de bases de dados mais abrangentes, fornecidas por escolas. A pesquisa lança luz sobre a importância de uma abordagem multidisciplinar e baseada em evidências na prevenção e combate ao bullying, destacando a necessidade contínua de pesquisa e desenvolvimento de técnicas e ferramentas mais avançadas para lidar com essa questão tão relevante em nossas comunidades escolares e sociedades.

Palavras-chave: Bullying; Extração de Conhecimento; Mineração de Texto; Análise de Sentimentos Machine Learning.

Although not a recent phenomenon, bullying has become a topic of current relevance. This term refers to systematic practices of violence and intimidation, mainly occurring in educational settings, which can take the form of physical or psychological violence, intimidation, humiliation, discrimination, among others. In Brazil, regarding this issue, we have Law No. 13,185 of 2015, which established a program to combat bullying, aiming to stimulate the prevention and combating of this action through discussion, guidance, solution, and prevention actions. This law requires the production of bi-monthly reports on bullying incidents at state and municipal levels. However, according to observations in two schools in the municipality of Campos dos Goytacazes, it was noticed that these reports are not accessible. This study aimed to propose a model for categorizing bullying cases through text mining, in order to highlight the most frequent categories, generating knowledge to support school management in preventing and combating bullying cases. Text mining is a tool for extracting knowledge from unstructured data, such as databases, texts, or other media. Tools such as artificial intelligence and machine learning were used to extract a database for the pilot test, composed of tweets related to bullying incidents, as the literature suggests that the internet provides a fertile field for machine learning research due to the abundance of information and opinions available. The classification into bullying categories was based on the sentiment analysis framework, which allows identifying the main themes of a document and classifying them according to a predefined set of topics. For this process, manual annotation of tweets in practiced bullying categories was carried out, generating a test base for the classification algorithm used, Naive Bayes. The results showed that the Gaussian Naive Bayes model had the best accuracy for classification, with 21.7% accuracy. The research efforts represent a significant advancement in the field of bullying detection through text mining. The critical analysis of the results and considerations about the factors that influenced the models' performance provide valuable insights for researchers and professionals interested in addressing this complex problem more effectively and comprehensively, pointing to the possibility of exploring class balancing techniques, including more representative data from each class, as well as using more comprehensive databases provided by schools. The research sheds light on the importance of a multidisciplinary and evidence-based approach to preventing and combating bullying, highlighting the ongoing need for research and development of more advanced techniques and tools to address this relevant issue in our school communities and societies.

Keywords: Bullying; Knowledge Extraction; Text Mining; Sentiment Analisis; Machine Learning.

PDF document Davi Marcos Geralda de Souza.pdf — Documento PDF, 5.22 MB
Conteúdo

Atualmente não existem itens nessa pasta.