Bolsa de TT-IV em Arquitetura de Dados para a Geração de Grafos de Conhecimento

Level 4-Technical Training Fellowship in Data Architecture for the Generation of Knowledge Graphs

Nº: 7073

Área de conhecimento: Ciência da Computação

Field of knowledge: Computer science

Nº do processo FAPESP: 2022/15816-5

FAPESP process: 2022/15816-5

Título do projeto: KGevol: Grafos de Conhecimento Dinâmicos extraidos a partir de Informação Textual Não Estruturada

Project title: KGevol: dynamic knowledge graphs extracted from unstructured textual information

Área de atuação: Arquitetura de Dados para a Geração de Grafos de Conhecimento

Working area: Data Architecture for the Generation of Knowledge Graphs

Quantidade de vagas: 1

Number of places: 1

Início: 01/07/2024

Start: 2024-07-01

Pesquisador responsável: Julio Cesar dos Reis

Principal investigator: Julio Cesar dos Reis

Unidade/Instituição: Instituto de Computação, Universidade Estadual de Campinas (IC-Unicamp)

Unit/Instituition: Instituto de Computação, Universidade Estadual de Campinas (IC-Unicamp)

Data limite para inscrições: 15/06/2024

Deadline for submissions: 2024-06-15

Publicado em: 20/05/2024

Publishing date: 2024-05-20

Localização: Avenida Albert Einstein, 1251, Campinas

Locale: Avenida Albert Einstein, 1251, Campinas

E-mail para inscrições: jreis@ic.unicamp.br

E-mail for proposal submission: jreis@ic.unicamp.br

  • Resumo

    O projeto em questão visa criar grafos de conhecimento (KGs) a partir de textos escritos em linguagem natural. Um dos produtos deste projeto é a criação de uma ferramenta computacional que implemente a técnica criada pelos pesquisadores do projeto. Mais informações sobre o projeto podem ser sanadas através de anderson.rossanez@gmail.com e andregregino@gmail.com.

    Objetivos da vaga:

    - Desenvolver e integrar todos os módulos de software gerados no projeto, incluindo (mas não se limitando a) módulos de reconhecimento de entidades, construção de grafos de conhecimento temporal e adição de triplas;

    - Documentar os passos relevantes para extrair dados de texto não estruturado;

    - Desenvolver funcionalidades de software responsáveis por criar, modificar e remover triplas RDF nos KGs;

    - Desenvolver e documentar os testes do sistema usados para avaliar os KGs gerados;

    Requisitos da vaga:

    - Python, Java e APIs RESTful;

    - Conhecimento e experiência em arquitetura de software, TDD e bibliotecas de PLN.

    Mais informações sobre perfil e condições da Bolsa FAPESP de Treinamento Técnico nível quatro (TT-IV) estão disponíveis em https://fapesp.br/3098 e https://fapesp.br/3162.