VIDiom-PT

VIDiom-PT is a European Portuguese corpus annotated for verbal idioms, designed to support NLP applications in idiom processing. The resulting corpus comprises 5,178 annotated instances covering 747 distinct verbal idioms. The annotation process was validated through an inter-annotator agreement assessment, yielding a Krippendorff’s alpha of 0.869 based on independent annotations of 5% of the data by three specialists.

View resource description in all available languages

VIDiom-PT é um corpus em português europeu anotado quanto às expressões idiomáticas verbais, desenvolvido para apoiar aplicações de PLN no processamento de expressões idiomáticas. O corpus resultante compreende 5.178 ocorrências anotadas, abrangendo 747 expressões distintas. O processo de anotação foi validado pelo cálculo do acordo entre anotadores, resultando num alfa de Krippendorff de 0,869 com base em anotações independentes de 5% dos dados por três especialistas.

Download


People who looked at this resource also viewed the following: