Bolsa de PD em Avaliação de Modelos de Linguagem de Grande Escala

Post-Doctoral Fellowship in Evaluation of Large Language Models

Nº: 8890

Área de conhecimento: Ciência da Computação

Field of knowledge: Computer science

Nº do processo FAPESP: 2022/09319-9

FAPESP process: 2022/09319-9

Título do projeto: Centro de Ciência para o Desenvolvimento em Agricultura Digital – CCD-AD/SemeAr

Project title: Science Center for Development in Digital Agriculture – SCD-AD/SemeAr

Área de atuação: Avaliação de Modelos de Linguagem de Grande Escala

Working area: Evaluation of Large Language Models

Quantidade de vagas: 1

Positions: 1

Início: 01/03/2026

Start: 2026-03-01

Pesquisador responsável: Silvia Maria Fonseca Silveira Massruhá

Principal investigator: Silvia Maria Fonseca Silveira Massruhá

Unidade/Instituição: Embrapa Agricultura Digital

Unit/Instituition: Embrapa Agricultura Digital

Data limite para inscrições: 15/03/2026

Deadline for submissions: 2026-03-15

Publicado em: 05/02/2026

Publishing date: 2026-02-05

Localização: Av. Dr. André Tosello, 209 (Cidade Universitária – Unicamp), Campinas

Locale: Av. Dr. André Tosello, 209 (Cidade Universitária – Unicamp), Campinas

E-mail para inscrições: thiago.santos@embrapa.br

E-mail for proposal submission: thiago.santos@embrapa.br

  • Resumo Summary

    O escopo do trabalho é focado no desenvolvimento de uma metodologia de avaliação para múltiplos Modelos de Linguagem de Grande Escala (LLMs) que foram ajustados para subdomínios específicos dentro do campo da extensão agrícola.

    O candidato selecionado ingressará no Centro de Ciência para o Desenvolvimento em Agricultura Digital – CCD-AD/SemeAr, um CCD apoiado pela FAPESP na Embrapa Agricultura Digital e coordenado pela Professora Silvia Maria Fonseca Silveira Massruhá. O bolsista será supervisionado pelo pesquisador principal do CCD-AD/SemeAr, Professor Thiago Santos.

    O desempenho esperado para o bolsista inclui: o desenvolvimento de benchmarks específicos para uso nas avaliações, em estreita colaboração com especialistas de domínio; a seleção criteriosa de métricas de avaliação, cobrindo aspectos tanto objetivos quanto subjetivos, em conformidade com os domínios em foco; a implementação das métricas selecionadas, em linguagem de programação Python, dentro do pipeline de desenvolvimento de LLM; planejamento experimental, conduzido em conjunto com os estatísticos alocados ao projeto; a análise e recomendação formal dos modelos mais adequados para cada subdomínio; a preparação de artigos científicos sobre o trabalho realizado.

    Candidatos interessados devem enviar seu Currículo Lattes e/ou ORCID para maria-fernanda.moura@embrapa.br e sonia.ternes@embrapa.br, com cópia para thiago.santos@embrapa.br, com “POSTDOC” indicado no início do assunto. Recomenda-se incluir uma carta de apresentação detalhando as qualificações e experiência relevante do candidato.

    A vaga está aberta a brasileiros e estrangeiros. O selecionado receberá Bolsa de Pós-Doutorado da FAPESP no valor de R$ 12.570,00 mensais e Reserva Técnica equivalente a 10% do valor anual da bolsa para atender a despesas imprevistas e diretamente relacionadas à atividade de pesquisa.

    The scope of work is to focus on the development of an evaluation methodology for multiple Large Language Models (LLMs) that have been fine-tuned for specific subdomains within the field of agricultural extension.

    The selected candidate will join the Science Center for Development in Digital Agriculture – SCD-AD/SemeAr, one of the SCDs in São Paulo state (Brazil) supported by FAPESP, the São Paulo Research Foundation. CCD-AD/SemeAr is based in Campinas at EMBRAPA Digital Agriculture, one of the decentralized units of the Brazilian Agricultural Research Corporation (EMBRAPA), and is coordinated by Professor Silvia Maria Fonseca Silveira Massruhá. The postdoc will be supervised by Professor Thiago Santos, co-PI at SCD-AD/SemeAr.

    The expected deliverables encompass: the development of specific benchmarks for use in the evaluations, in close collaboration with domain specialists; the judicious selection of evaluation metrics, covering both objective and subjective aspects, in conformity with the domains in focus; the implementation of the selected metrics, in Python programming language, within the LLM development pipeline; experimental planning, conducted in conjunction with the statisticians allocated to the project; the analysis and formal recommendation of the most suitable models for each subdomain; the preparation of scientific papers about the work carried out.

    Interested candidates should send their Lattes Curriculum and/or ORCID to maria-fernanda.moura@embrapa.br and sonia.ternes@embrapa.br, copy to thiago.santos@embrapa.br, with “POSTDOC” indicated at the beginning of the subject line. It is recommended to include a cover letter detailing the candidate's qualifications and relevant experience.

    This opportunity is open to candidates of any nationality. The selected candidate will receive a FAPESP Post-Doctoral fellowship in the amount of R$ 12,570.00 monthly and a research contingency fund, equivalent to 10% of the annual value of the fellowship which should be spent on items directly related to the research activity.