Nome do Projeto
Construção de Corpus paralelo Libras/Língua Portuguesa baseado em narrativas em Libras
Ênfase
Pesquisa
Data inicial - Data final
10/09/2023 - 01/09/2027
Unidade de Origem
Coordenador Atual
Área CNPq
Linguística, Letras e Artes
Resumo
Corpora linguísticos de línguas de sinais atualmente se configuram como fonte de dados imprescindível tanto para análises linguísticas e gramaticais quanto para o desenvolvimento de ferramentas para acessibilidade linguística e disseminação da língua, como dicionários e tradutores automáticos. O emprego de corpora possibilita delineamentos atrelados aos padrões de uso, ao invés de basear-se somente em sinais isolados e na intuição de sinalizantes nativos. No entanto, a construção de corpus de libras ainda é incipiente. O objetivo deste projeto é construir um corpus paralelo Libras/Língua Portuguesa inicialmente baseado em narrativas em Libras, e pode ser expandido para outros gêneros textuais com a mesma metodologia. Para que o corpus seja legível e processável por computador, já que as línguas de sinais carecem de um sistema de escrita amplamente aceito, o corpus será anotado por meio de glosa de identificação e tradução escrita, no nível lexical e frasal. O software de anotação multimídia ELAN - EUDICO Linguistic Annotator será utilizado para que as anotações sejam alinhadas diretamente no tempo com a Libras registrada em vídeo. A construção de Corpus de Libras/Língua Portuguesa contribui para Educação Bilíngue de Surdos por meio da disseminação da Libras, acessibilidade linguística para Surdos, análises linguísticas e ferramentas para os processos de ensino/aprendizagem tanto da Libras para pessoas Surdas e ouvintes quanto da Língua Portuguesa para pessoas Surdas. Além disso, os desdobramentos proporcionados pelo corpus, como emprego de lematização, devem impactar na descrição quantitativa e qualitativa do núcleo lexical da Libras.
Objetivo Geral
Construir um corpus paralelo bilíngue Libras/Língua Portuguesa baseado em narrativas em Libras.
Justificativa
Corpora paralelos de línguas de sinais são imprescindíveis tanto para pesquisas linguísticas, quanto para construção de gramáticas, dicionários e tradutores automáticos. No entanto, a construção de corpus de Libras ainda é incipiente.
O corpus paralelo Libras/Língua Portuguesa proposto tem caráter multifuncional e serve aos estudos linguísticos da Libras e a Educação Bilíngue de Surdos. O corpus pode ser empregado em sequências didáticas no ensino de Libras tanto como L1 quanto como L2; no ensino de português para surdos; como material didático nas escolas e classes bilíngues de surdos; pode ainda ser utilizado como matéria prima para a construção de gramáticas, dicionários e tradutores automáticos. A construção de corpus paralelos Libras/Língua Portuguesa contribui diretamente com as pesquisas linguísticas da Libras por disponibilizar o registro do léxico em contexto, e a partir dele, viabilizar estudos descritivos e ferramentas para disseminação da Libras.
O corpus paralelo Libras/Língua Portuguesa proposto tem caráter multifuncional e serve aos estudos linguísticos da Libras e a Educação Bilíngue de Surdos. O corpus pode ser empregado em sequências didáticas no ensino de Libras tanto como L1 quanto como L2; no ensino de português para surdos; como material didático nas escolas e classes bilíngues de surdos; pode ainda ser utilizado como matéria prima para a construção de gramáticas, dicionários e tradutores automáticos. A construção de corpus paralelos Libras/Língua Portuguesa contribui diretamente com as pesquisas linguísticas da Libras por disponibilizar o registro do léxico em contexto, e a partir dele, viabilizar estudos descritivos e ferramentas para disseminação da Libras.
Metodologia
Seleção de participantes: Serão convidados para participar do projeto professores e alunos do curso de Letras Libras/Literatura Surda da UFPel e professores das escolas bilíngues de surdos da região. Para participar como modelo sinalizador do corpus, o critério é que o participante seja surdo sinalizante nativo. Todos os participantes receberão o Termo de Consentimento Livre e Esclarecido-TCLE em Português e em Libras.
Oficinas sobre gênero narrativo em Libras: Serão criadas oficinas colaborativas com os professores e alunos do curso de Letras-Libras/Literatura Surda e das escola escolas bilingues da região para discussão sobre o gênero narrativo em Libras. As oficinas tem o objetivo de estimular produções de conteúdo em Libras no gênero proposto. A estratégia consistirá em análise de vídeos e materiais do gênero textual, seguida pela produção de narrativas próprias feitas pelos participantes. Os grupos de discussão, além de se configurarem como uma preparação para coleta de dados também se caracterizam como projeto de extensão.
Construção e registro das narrativas em Libras: Depois das oficinas e do TCLE devidamente assinado, os participantes serão convidados a produzir conteúdo em Libras no gênero narrativo. O conteúdo pode ser a narrativa de acontecimentos cotidianos, piadas, contos, fábulas e outros gêneros literários e não literários. Em seguida, os participantes serão convidados a articular a narrativa, que será filmada pela pesquisadora nas dependências da UFPel.
Análise e anotação dos dados: Para que o corpus seja paralelo e processável por computador, é necessário que seja anotado em pelo menos dois níveis com auxílio do Software ELAN: 1) glosas de identificação e 2) tradução em língua portuguesa alinhada aos vídeos em Libras. Para o trabalho de anotação, alunos do curso de Letras/Libras Literatura Surda deverão receber treinamento.
Para proceder a tradução do corpus, alunos bolsistas bilíngues serão convidados para participar da pesquisa. Esta etapa também pode ser desenvolvida em parceria com outros professores do curso de Letras-Libras/Literatura Surda e servir como estratégia didática para as disciplinas de Português como L2 para surdos.
Construção da plataforma online: Para armazenamento de dados e construção de uma plataforma online a pesquisa deve contar com parceiros dos cursos de áreas tecnológicas da UFPel. Reuniões de articulações serão organizadas com os parceiros que aceitarem fazer parte do projeto. Dessa forma, o projeto almeja sensibilizar professores, profissionais e alunos dos cursos das áreas de tecnologia da UFPel para educação bilíngue de surdos e disseminação da Libras.
O sistema idealmente deve contar com dois filtros de busca, se configurando como um corpus bilíngue e bidirecional. A ferramenta tecnológica para o corpus deve ser um software de código aberto que permita multiusuário, fluxo de trabalho on-line, edição de campos de dados em registros, diversas formas de busca de sinais e relatórios sobre atividade do usuário. Em todo o conteúdo do corpus, sempre que possível, serão inseridos hyperlinks que levam a entrada respectiva do léxico utilizado.
Oficinas sobre gênero narrativo em Libras: Serão criadas oficinas colaborativas com os professores e alunos do curso de Letras-Libras/Literatura Surda e das escola escolas bilingues da região para discussão sobre o gênero narrativo em Libras. As oficinas tem o objetivo de estimular produções de conteúdo em Libras no gênero proposto. A estratégia consistirá em análise de vídeos e materiais do gênero textual, seguida pela produção de narrativas próprias feitas pelos participantes. Os grupos de discussão, além de se configurarem como uma preparação para coleta de dados também se caracterizam como projeto de extensão.
Construção e registro das narrativas em Libras: Depois das oficinas e do TCLE devidamente assinado, os participantes serão convidados a produzir conteúdo em Libras no gênero narrativo. O conteúdo pode ser a narrativa de acontecimentos cotidianos, piadas, contos, fábulas e outros gêneros literários e não literários. Em seguida, os participantes serão convidados a articular a narrativa, que será filmada pela pesquisadora nas dependências da UFPel.
Análise e anotação dos dados: Para que o corpus seja paralelo e processável por computador, é necessário que seja anotado em pelo menos dois níveis com auxílio do Software ELAN: 1) glosas de identificação e 2) tradução em língua portuguesa alinhada aos vídeos em Libras. Para o trabalho de anotação, alunos do curso de Letras/Libras Literatura Surda deverão receber treinamento.
Para proceder a tradução do corpus, alunos bolsistas bilíngues serão convidados para participar da pesquisa. Esta etapa também pode ser desenvolvida em parceria com outros professores do curso de Letras-Libras/Literatura Surda e servir como estratégia didática para as disciplinas de Português como L2 para surdos.
Construção da plataforma online: Para armazenamento de dados e construção de uma plataforma online a pesquisa deve contar com parceiros dos cursos de áreas tecnológicas da UFPel. Reuniões de articulações serão organizadas com os parceiros que aceitarem fazer parte do projeto. Dessa forma, o projeto almeja sensibilizar professores, profissionais e alunos dos cursos das áreas de tecnologia da UFPel para educação bilíngue de surdos e disseminação da Libras.
O sistema idealmente deve contar com dois filtros de busca, se configurando como um corpus bilíngue e bidirecional. A ferramenta tecnológica para o corpus deve ser um software de código aberto que permita multiusuário, fluxo de trabalho on-line, edição de campos de dados em registros, diversas formas de busca de sinais e relatórios sobre atividade do usuário. Em todo o conteúdo do corpus, sempre que possível, serão inseridos hyperlinks que levam a entrada respectiva do léxico utilizado.
Indicadores, Metas e Resultados
A revelação dos resultados nesta linha de pesquisa implicará nos seguintes aspectos ou elementos:
•Revisão dos parâmetros de organização lexical dos dicionários e glossários de Libras,
•Fornecimento de dados enriquecedores para o campo da Linguística geral, Linguística de corpus e Lexicografia que poderão circular nos meios educacionais e científicos nos níveis regionais, nacionais e internacionais, como também nos respectivos veículos de informação científica;
•Fomento de ambiente teórico-reflexivo e produção de informações científicas no âmbito da lexicografia da Língua de Sinais do Brasil;
•Corpus paralelo para tradutores automáticos Língua Portuguesa-Libras-Língua Portuguesa;
•Organização de grupos de estudo, workshops e palestras na área para estudantes e profissionais da área;
• Oferta de cursos e disciplinas indicados pela instituição nos níveis de graduação, pós- graduação e extensão, conforme necessidade.
•Revisão dos parâmetros de organização lexical dos dicionários e glossários de Libras,
•Fornecimento de dados enriquecedores para o campo da Linguística geral, Linguística de corpus e Lexicografia que poderão circular nos meios educacionais e científicos nos níveis regionais, nacionais e internacionais, como também nos respectivos veículos de informação científica;
•Fomento de ambiente teórico-reflexivo e produção de informações científicas no âmbito da lexicografia da Língua de Sinais do Brasil;
•Corpus paralelo para tradutores automáticos Língua Portuguesa-Libras-Língua Portuguesa;
•Organização de grupos de estudo, workshops e palestras na área para estudantes e profissionais da área;
• Oferta de cursos e disciplinas indicados pela instituição nos níveis de graduação, pós- graduação e extensão, conforme necessidade.
Equipe do Projeto
Nome | CH Semanal | Data inicial | Data final |
---|---|---|---|
ALINE DE CASTRO E KASTER | 6 | ||
ANTONIELLE CANTARELLI MARTINS | 14 | ||
Ana Lucia Nunes Gonçalves | |||
BRUNA DA SILVA BRANCO | 2 | ||
CARLA BEATRIZ MEDEIROS KLEIN | |||
DAIANA SAN MARTINS GOULART | 2 | ||
FABIANO SOUTO ROSA | 6 | ||
FRANCIELLE CANTARELLI MARTINS | 13 | ||
JANIE CRISTINE DO AMARAL GONCALVES | 3 | ||
Jessica Barbosa Bederode |