Bolsa de TT-IV-A em Engenharia de Dados
Level 4A-Technical Training Fellowship in Data Engineering
Nº: 4383
Área de conhecimento: Ciência da Computação
Field of knowledge: Computer science
Nº do processo FAPESP: 2020/05895-0
FAPESP process: 2020/05895-0
Título do projeto: Sistema de Perguntas e Respostas para o Domínio Econômico Financeiro
Project title: A question answering system for financial economic domain
Área de atuação: Engenharia de Dados
Working area: Data Engineering
Quantidade de vagas: 1
Number of places: 1
Pesquisador responsável: Valdirene Fontanette
Principal investigator: Valdirene Fontanette
Unidade/Instituição: Itera Inteligência Artificial
Unit/Instituition: Itera Inteligência Artificial
Data limite para inscrições: 01/08/2021
Deadline for submissions: 2021-08-01
Publicado em: 16/07/2021
Publishing date: 2021-07-16
Localização: Rua José Bonifácio, 565 – sala 11, São Carlos
Locale: Rua José Bonifácio, 565 – sala 11, São Carlos
E-mail para inscrições: valfontanette@itera.com.br
E-mail for proposal submission: valfontanette@itera.com.br
-
Resumo
O plano de trabalho tem como foco a construção de uma base de dados semântica com notícias de jornais e revistas on-line. Para tal, o bolsista irá realizar estudos de viabilidade do uso de páginas web para montar uma base de notícias confiáveis, seguido da construção de crawlers para as páginas web selecionadas, capturando informações para a construção da base de dados semântica. Em seguida, o bolsista vai estudar, definir e implementar um método para extrair respostas da base com técnicas de Deep Learning, usando a abordagem extrativa.
Perfil
- Experiência de quatro anos após a graduação na área de TI;
- Experiência Python (2 anos);
- Experiência banco de dados (relacional e não relacional) Elastic Search, Mongo, Postgresql;
- Experiência na construção de APIs;
- Experiência na construção de crawlers.Principais atividades
- Desenvolver métodos sistematizados para a captura de notícias em jornais e revistas digitais e contratos sociais;
- Construir base de dados semântica;
- Pesquisar, explorar e avaliar métodos de extração de conhecimento em documentos para formular e inferir respostas automaticamente;
- Desenvolver, manter e estruturar códigos Python;
- Code review de colegas de time.Infos adicionais
- Home Office.
Mais detalhes sobre perfil e condições da Bolsa FAPESP TT-IV-A em https://fapesp.br/3098 e https://fapesp/3162.
-
Enviar
Oportunidade - Oportunidades Abertas Open Opportunities
-
Fellowships Opportunities