دورية أكاديمية

Explorando la efectividad de los modelos de lenguaje neuronales en la identificación y clasificación de colocaciones léxicas

التفاصيل البيبلوغرافية
العنوان: Explorando la efectividad de los modelos de lenguaje neuronales en la identificación y clasificación de colocaciones léxicas
المؤلفون: Radovan Milovic
المصدر: Linguamática, Vol 16, Iss 1 (2024)
بيانات النشر: Universidade do Minho & Universidade de Vigo, 2024.
سنة النشر: 2024
المجموعة: LCC:Language and Literature
LCC:Philology. Linguistics
مصطلحات موضوعية: colocaciónes léxicas, funciones léxicas, modelos de lenguaje neuronales, ajuste fino, Language and Literature, Philology. Linguistics, P1-1091
الوصف: La mayoría de las investigaciones sobre el procesamiento automatizado de colocaciones se ha centrado en el uso de medidas de asociación. Sin embargo, el enfoque se ha ido cambiando lentamente hacia la exploración de la efectividad de los modelos de lenguaje neuronales o neural language models (NLMs). En este artículo, investigamos el último método mediante el ajuste fino de modelos de la familia BERT en inglés, español y portugués utilizando recursos léxicos anotados con Funciones Léxicas (FL). Examinamos así las capacidades de los modelos de lenguaje para la identificación y clasificación de colocaciones léxicas tanto en escenarios monolingües como multilingües. Los resultados de los desempeños generales variaron, con valores F que oscilan entre 0.30 y 0.51. Concluimos que el modelo multilingüe sobresale en el aprendizaje cruzado al emplear un conjunto de entrenamiento combinado de los tres idiomas. Además, a pesar de la posible variabilidad, los resultados demuestran una mejor identificación de las Funciones Léxicas con un mayor número de instancias en el conjunto de entrenamiento. Por último, realizamos un análisis cualitativo para investigar posibles patrones de identificación errónea exhibidos por el modelo.
نوع الوثيقة: article
وصف الملف: electronic resource
اللغة: Catalan; Valencian
English
Spanish; Castilian
Basque
Galician
Portuguese
تدمد: 1647-0818
Relation: https://linguamatica.com/index.php/linguamatica/article/view/428; https://doaj.org/toc/1647-0818
DOI: 10.21814/lm.16.1.428
URL الوصول: https://doaj.org/article/3ee890c563a347a1b3296b5643c2f9aa
رقم الأكسشن: edsdoj.3ee890c563a347a1b3296b5643c2f9aa
قاعدة البيانات: Directory of Open Access Journals
الوصف
تدمد:16470818
DOI:10.21814/lm.16.1.428