CORAA NURC-São Paulo Minimal Corpus

View resource name in all available languages

CORAA NURC-São Paulo Corpus Mínimo

CORAA NURC-SP MCCORAA NURC-SP CM

CORAA NURC-SP Minimal Corpus is a manually annotated corpus of Brazilian Portuguese spontaneous speech (São Paulo variety). The corpus is a subset of NURC (‘Cultured Linguistic Urban Norm’) project collection, one of the most influential in Brazilian Linguistics. The corpus was brought to digital life by TaRSiLa, a project aiming to build large multi-purpose datasets for speech processing (ASR, TTS, and Sentiment Analysis). It comprises 21 audio files and audio-aligned multilevel transcripts according to linguistically motivated intonation units.

View resource description in all available languages

CORAA NURC-SP Corpus Mínimo é um corpus anotado manualmente de fala espontânea do português brasileiro (variedade de São Paulo). O corpus é um subconjunto da coleção do projeto NURC (‘Norma Urbana Linguística Culta’), um dos mais influentes da linguística brasileira, que foi trazido à vida digital pelo TaRSiLA, um projeto que visa a construir grandes datasets multifuncionais para o processamento de fala (ASR, TTS e Análise de Sentimentos). É composto por 21 arquivos de áudio e transcrições multiníveis alinhadas ao áudio de acordo com unidades entoacionais motivadas linguisticamente.

Download
People who looked at this resource also viewed the following:
People who downloaded this resource also downloaded the following: