O lexicon dos romances da tradição oral moderna portuguesa

Uma das muitas questionações que nortearam os investigadores do Romanceiro ao longo do século XX prende-se com a necessidade de se estudar e determinar qual o contributo das especificidades linguísticas das diferentes versões de um romance para a construção da Linguagem Poética e do Estilo Tradicional. Partimos de um corpus de romances para verificar em que medida as particularidades da língua contribuiriam para a construção da Linguagem Poética e do Estilo Tradicional.

O espólio romancístico ao dispor dos investigadores era, e é, demasiado extenso. Por isso, foi necessário restringir o corpus. Considerando que uma subtradição pode ser profundamente representativa do género literário romance, definimos como corpus as versões de romances da tradição oral moderna portuguesa editadas entre 1828 e 1960, num total de 1721 textos.

Objetivos da investigação

O principal objetivo da investigação foi a identificação da extensão total do vocabulário e a definição das opções lexicais presentes nos textos, ou seja, a constituição de um Lexicon (dicionário/vocabulário) de formas flexionadas e lematizadas com a identificação:

  • do romance e da versão em que ocorre cada forma;
  • do número de ocorrências de cada forma em cada romance;
  • do número de ocorrências de cada forma em cada uma das versões de um romance e em fim de verso;
  • do número de verso em que ocorre cada forma;
  • de formas gramaticais que ocorrem em fim de verso.

Com vista ao cumprimento do objetivo principal do trabalho de investigação, foi utilizada uma aplicação informática para proceder ao full tagging (uma etiquetagem pormenorizada) de todas as palavras e à anotação/codificação dos 1721 textos. As etiquetas utilizadas para a anotação do corpus surgem de forma abreviada no Lexicon e em anexo (Anexo I e Anexo II).

Lexicon

O Lexicon (dicionário/vocabulário) aqui divulgado é apenas uma das muitas opções de apresentação da extensão total do vocabulário presente nas versões de romances da tradição oral moderna portuguesa editadas entre 1828 e 1960. Este trabalho corresponde ao 2º volume da Dissertação para a obtenção do grau de Doutor apresentada à Faculdade de Filologia da Universidade da Corunha, em 2007, com o título O léxico dos romances da tradição oral moderna portuguesa editados entre 1828 e 1960.
Por uma questão de posicionamento teórico, optámos por constituir o Lexicon com as categorias gramaticais Nome, Adjetivo, Verbo, Advérbio e Quantificador, excluindo todas as demais categorias gramaticais. Por questões metodológicas, optámos por elencar as formas lexicais (tanto flexionadas, como lematizadas) por categoria gramatical, organizando-as:

  • por ordem alfabética de ocorrência nos textos;
  • por ordem alfabética de ocorrência em fim de verso;
  • por ordem decrescente de ocorrência nos textos;
  • por ordem decrescente de ocorrência em fim de verso.

 

Leitura do Lexicon

Exemplo de formas flexionadas:

  • entre parêntises retos surge o lema da forma lexical presente no corpus;
  • classificação categorial da forma lexical (N, A, V, Adv, Q);
  • identificação do tempo, pessoa e número das formas verbais/identificação do género, número e grau das formas nominais e das adjetivais;
  • entre parêntesis curvos, surge o número total de ocorrências no corpus estudado;
  • a numeração romana corresponde à classificação numérica atribuída a cada romance em FERRÉ, Pere e CARINHAS, Cristina (2000): Bibliografia do Romanceiro Português da Tradição Oral Moderna (1828-2000), Madrid, Instituto Universitario Seminario Menéndez Pidal. Importa ter em atenção que o algoritmo utilizado na aplicação informática só permite ordenar a numeração romana por ordem alfabética pelo que, por exemplo, C surge sempre antes de L;
  • a numeração árabe refere cada uma das versões dos textos editada em FERRÉ, Pere: Romanceiro Português da Tradição Oral Moderna – versões publicadas entre 1828 e 1960, 4 vols., Lisboa, Fundação Calouste Gulbenkian (2000; 2001; 2003 e 2004);
  • segue-se, entre parêntesis curvos, o número de ocorrências de cada forma nesse texto em particular e o número do(s) verso(s) em que ocorre(m).

Exemplo de formas lematizadas:

  • entre parêntesis curvos, surge o número total de ocorrências no corpus estudado;
  • a numeração romana corresponde à classificação numérica atribuída a cada romance em FERRÉ, Pere e CARINHAS, Cristina (2000): Bibliografia do Romanceiro Português da Tradição Oral Moderna (1828-2000), Madrid, Instituto Universitario Seminario Menéndez Pidal. Importa ter em atenção que o algoritmo utilizado na aplicação informática só permite ordenar a numeração romana por ordem alfabética pelo que, por exemplo, C surge sempre antes de L;
  • a numeração árabe refere cada uma das versões dos textos editada em FERRÉ, Pere: Romanceiro Português da Tradição Oral Moderna – versões publicadas entre 1828 e 1960, 4 vols., Lisboa, Fundação Calouste Gulbenkian (2000; 2001; 2003 e 2004);
  • segue-se, entre parêntesis curvos, o número de ocorrências de cada forma nesse texto em particular e o número do(s) verso(s) em que ocorre(m).

Para agilizar a leitura dos dados, em anexo, apresentamos uma listagem das correspondências número romano/nome do romance e uma listagem das etiquetas gramaticais utilizadas.

 

 

Natália Albino Pires
Escola Superior de Educação (IPC)
Cátedra UNESCO em Património Imaterial e Saber-Fazer Tradicional: Interligar Patrimónios (UÉvora)vIELT-EISI (Universidade Nova)
CIAC (Universidade do Algarve)

Centro de Investigação em Artes e Comunicação Fundação para a Ciência e a Tecnologia Universidade do Algarve

Apoios

Fundação Calouste Gulbenkian Fundação Manuel Viegas Guerreiro European Association for Digital Humanities

ROMANCEIRO.PT

Universidade do Algarve

8005-139 Faro

Email: contacto@romanceiro.pt

Telefone: +351289 800 900 – ext. 7541