Geração sintética de diálogos profissionais usando modelos de linguagem e com a incorporação de histórico curricular e indicadores de performance.

Deus, Beatriz Helena de Mello Orlandi de

Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/9032

Título:	Geração sintética de diálogos profissionais usando modelos de linguagem e com a incorporação de histórico curricular e indicadores de performance.
Autor(es):	Deus, Beatriz Helena de Mello Orlandi de
Orientador(es):	Fortes, Reinaldo Silva Santana, Alexandre Fortes
Membros da banca:	Santos, Valéria de Carvalho Ferreira, Daniel José Chaves Fortes, Reinaldo Silva Santana, Alexandre Fortes
Palavras-chave:	Dados sintéticos Diálogos corporativos Inferência inversa
Data do documento:	2026
Referência:	DEUS, Beatriz Helena de Mello Orlandi de. Geração sintética de diálogos profissionais usando modelos de linguagem e com a incorporação de histórico curricular e indicadores de performance. 2026. 86 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2026.
Resumo:	Avaliar atributos profissionais, como desempenho, produtividade e habilidade, a partir de interações textuais é um desafio central para organizações que operam em ambientes digitais. Contudo, a escassez de dados reais de comunicação corporativa, aliada a restrições de privacidade, limita o avanço de pesquisas nessa direção. Este trabalho propõe uma abordagem experimental para a construção e avaliação de um corpus sintético de conversas empresariais, gerado por modelos de linguagem de grande escala e condicionado a variáveis latentes ocupacionais extraídas de históricos de carreira reais. O método desenvolvido integra simulação estatística, formação de times por similaridade de trajetória profissional e engenharia estruturada de prompt, produzindo diálogos que refletem comportamentos associados a diferentes perfis, sem revelar explicitamente os atributos no texto. A avaliação combina validação estrutural, rubricas de qualidade e um protocolo de inferência inversa, no qual os modelos avaliadores tentam recuperar os atributos latentes apenas a partir da leitura das conversas. Os resultados demonstram que o cenário estruturado supera consistentemente a linha de base aleatória, confirmando que modelos de linguagem conseguem codificar e recuperar parcialmente sinais comportamentais em diálogos sintéticos. A análise revela, ainda, um viés sistemático em direção a avaliações positivas por parte dos inferidores e uma tensão entre a naturalidade do texto e a controlabilidade dos atributos, abrindo caminho para o aprimoramento de métodos de geração e avaliação de dados sintéticos corporativos.
Resumo em outra língua:	Assessing professional attributes such as performance, productivity, and ability from textual interactions is a central challenge for organizations operating in digital environments. However, the scarcity of real corporate communication data, combined with privacy constraints, limits research progress in this direction. This work proposes an experimental approach for building and evaluating a synthetic corpus of corporate conversations, generated by large language models and conditioned on occupational latent variables derived from real career histories. The developed method integrates statistical simulation, team formation based on professional trajectory similarity, and structured prompt engineering, producing dialogues that reflect behaviors associated with different profiles without explicitly revealing the attributes in the text. The evaluation combines structural validation, quality rubrics, and an inverse inference protocol in which evaluator models attempt to recover the latent attributes solely from reading the conversations. Results show that the structured scenario consistently outperforms the random baseline, confirming that language models can partially encode and recover behavioral signals in synthetic dialogues. The analysis further reveals a systematic positivity bias among inferrers and a tension between text naturalness and attribute controllability, opening avenues for improving synthetic corporate data generation and evaluation methods.
URI:	http://www.monografias.ufop.br/handle/35400000/9032
Licença:	Este trabalho está sob uma licença Creative Commons BY-NC-ND 4.0 (https://creativecommons.org/licenses/by-nc-nd/4.0/?ref=chooser-v1).
Aparece nas coleções:	Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
MONOGRAFIA_GeraçãoSintéticaDiálogos.pdf		4,3 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas