CORAA NURC-São Paulo Minimal Corpus
View resource name in all available languages
CORAA NURC-São Paulo Corpus Mínimo
CORAA NURC-SP MCCORAA NURC-SP CM
Handle: | https://hdl.handle.net/21.11129/0000-000F-73CA-C (persistent URL to this page) |
---|---|
URL: | https://nurc.fflch.usp.br/ |
URL: | https://sites.google.com/view/tarsila-c4ai/coraa-versions |
CORAA NURC-SP Minimal Corpus is a manually annotated corpus of Brazilian Portuguese spontaneous speech (São Paulo variety). The corpus is a subset of NURC (‘Cultured Linguistic Urban Norm’) project collection, one of the most influential in Brazilian Linguistics. The corpus was brought to digital life by TaRSiLa, a project aiming to build large multi-purpose datasets for speech processing (ASR, TTS, and Sentiment Analysis). It comprises 21 audio files and audio-aligned multilevel transcripts according to linguistically motivated intonation units.
View resource description in all available languages
CORAA NURC-SP Corpus Mínimo é um corpus anotado manualmente de fala espontânea do português brasileiro (variedade de São Paulo). O corpus é um subconjunto da coleção do projeto NURC (‘Norma Urbana Linguística Culta’), um dos mais influentes da linguística brasileira, que foi trazido à vida digital pelo TaRSiLA, um projeto que visa a construir grandes datasets multifuncionais para o processamento de fala (ASR, TTS e Análise de Sentimentos). É composto por 21 arquivos de áudio e transcrições multiníveis alinhadas ao áudio de acordo com unidades entoacionais motivadas linguisticamente.
People who looked at this resource also viewed the following:
People who downloaded this resource also downloaded the following: