MESTRADO EM SISTEMAS APLICADOS A ENGENHARIA E A GESTÃO

USO DE GRAFO DE CONHECIMENTO SEMÂNTICO PARA INTEGRAR DADOS EM UMA EMPRESA DO RAMO ALIMENTÍCIO

por Renato Gomes de Souza Vale Júnior publicado 14/03/2022 13h33, última modificação 12/09/2023 12h49

Mark Douglas de Azevedo Jacyntho (Orientador)

O mercado empresarial está cada vez mais competitivo, impulsionando as organizações a investirem em Tecnologia da Informação (TI), implementando sistemas robustos, com a capacidade de manipular informações de forma mais ágil e precisa. Com isso, aumenta consideravelmente a quantidade de informações disponibilizadas por diversas fontes de dados, como banco de dados relacionais, arquivos de texto, planilhas eletrônicas, arquivos CSV, dentre outros. A Web Semântica, proposta por Tim Berners-Lee, em 2001, fornece padrões e preconiza o uso de (meta)dados estruturados, permitindo executar tarefas baseadas no processamento semântico desses dados, tornando-os inteligíveis por máquinas, apoiando busca precisa, integração, compartilhamento e reúso de dados. Para tal, fontes de dados distintas devem compartilhar vocabulários formais comuns (ontologias), aplicado à área de conhecimento em questão, classificando e descrevendo os recursos de dados presentes. A partir de um estudo empírico real, no setor de atacado de uma empresa do ramo alimentício da região Norte Fluminense, o objetivo desse trabalho consiste em desenvolver uma base de conhecimento, de modo a integrar fontes de dados heterogêneas, transformando-as em um grafo de conhecimento semântico, a ser utilizado, posteriormente, como entrada para funções de análise de Data Science. Para o grafo de conhecimento ser efetivamente semântico, uma ontologia fora criada, reusando/estendendo ontologias Linked Data consagradas. Espera-se que a ontologia e o grafo de conhecimento propostos permitam obter discernimento mais apurado nos processos de tomada de decisão, no referido setor da empresa.
Palavras-chave: Integração de dados, Grafo de conhecimento, Ontologia, Web Semântica, RDF, Data Science.

The business market is increasingly competitive, driving organizations to invest in Information Technology (IT), implementing robust systems, with the ability to manipulate information more quickly and accurately. Thus, the amount of information made available by various data sources, such as relational databases, text files, electronic spreadsheets, CSV files, among others, considerably increases. The Semantic Web, proposed by Tim Berners-Lee, in 2001, offers standards and advocates the use of structured data, allowing the execution of tasks based on the semantic processing of these data, making them machine intelligible, supporting precise search, integration, sharing and reusing data. To this end, different data sources must share common formal vocabularies (ontologies), applied to the knowledge area in question, classifying and describing the data resources present. Based on a real case study, in the wholesale sector of a company in the food industry in the North Fluminense region, the objective of this work is to develop a knowledge base in order to integrate heterogeneous data sources, transforming them into a semantic knowledge graph, to be used later as input to Data Science analysis functions. For the knowledge graph to be effectively semantic, an ontology was created, reusing / extending established Linked Data ontologies. It is expected that the proposed ontology and knowledge graph will allow for more accurate insight into decisionmaking processes in the aforementioned sector of the company.
Keywords: Data Integration, Knowledge Graph, Ontology, Semantic Web, RDF, Data Science.

PDF document Renato Gomes de Souza Vale Junior.pdf — Documento PDF, 4.44 MB
Conteúdo

Atualmente não existem itens nessa pasta.