Entregables

  • E1.1: Corpus monolingües de gran tamaño para euskera y castellano para los cinco dominios especificados: documento
  • E1.2: Corpus multilingües (comparables y paralelos) de gran tamaño para euskera, castellano e inglés: documento
  • E2.1: Nuevas representaciones vectoriales estáticas parael euskara utilizando los modelos del estado del arte (word2vec, Fasttext): documento
  • E2.2: Nuevos modelos de lenguaje monolingües para el castellano y euskara basadas en las últimas arquitecturas neuronales: documento
  • E2.3: Nuevos modelos de lenguaje multilingües para el euskara, castellano e inglés utilizando corpus monolingües y paralelos: documento
  • E2.4: Nuevas meta-representaciones vectoriales estáticas multilingües: documento
  • E3.1+E3.2+E3.3: Resultados de adaptación a dominio y a idioma de los modelos de lenguaje: documento
  • E4.1: Marco de evaluación unificado BasqueGLUE: documento
  • E4.2: Marco de evaluación unificado SpanishGLUE: documento
  • E4.3: Informe de evaluación de modelos sobre BasqueGLUE y SpanishGLUE: documento

Corpus

Embeddings estáticos monolingües

Embeddings estáticos multilingües

Modelos de lenguaje monolingües

(*) modelos realizados en colabotación con META.

Modelos de lenguaje multilingües

Marco de evaluación