EUSKORPORA: Centro de datos lingüísticos para las tecnologías digitales del euskera, nueva Asociación con sede en Donostia/San Sebastián, requiere para su puesta en marcha y consolidación de su área de Tecnología incorporar a personas jóvenes, en etapa inicial de su carrera profesional para apoyar en tareas clave relacionadas con la creación de recursos lingüísticos para el euskera y con las tecnologías del lenguaje aplicadas al euskera.

Las personas seleccionadas formarán parte de un equipo interdisciplinar y participarán en proyectos de recopilación, anotación y análisis de datos lingüísticos, así como en el desarrollo de modelos de lenguaje base de código abierto (ASR, TTS, MT, PLN) orientados al euskera, dentro de un contexto de investigación y desarrollo altamente relacionado con la industria.

Funciones principales:

· Apoyar en la recopilación, limpieza y anotación de corpus lingüísticos (para texto y audio).

· Colaborar en el entrenamiento y evaluación de modelos de lenguaje para texto y voz.

· Participar en la descripción, documentación, catalogación y mantenimiento de recursos lingüísticos.

· Contribuir a la integración de herramientas y bibliotecas de PLN de código abierto.

· Asistir en la elaboración de informes, publicaciones técnicas y difusión de resultados.

· Trabajar en coordinación con perfiles técnicos, lingüísticos y de gestión.

Se requiere:

· Grado o máster en Lingüística Computacional, Ingeniería Informática, Ciencia de Datos, Traducción con especialización en tecnologías del lenguaje, o áreas relacionadas.

· Conocimientos básicos de PLN/NLP, modelos de lenguaje, o tecnologías de voz.

· Valorable haber participado en proyectos de investigación o desarrollo relacionados.

· Conocimientos técnicos:

  • Programación en Python (nivel básico/intermedio).
  • Familiaridad con herramientas de anotación lingüística o procesamiento de texto.
  • Valorable experiencia en recopilación de corpus y construcción de recursos.
  • Valorable experiencia con bibliotecas como spaCy, Hugging Face, o similares.
  • Uso básico de herramientas de control de versiones (Git).

· Euskera: nivel alto (B2 o superior)

· Castellano: fluido

· Inglés: nivel alto (B2 o superior)

Se ofrece:

· Incorporación a un Centro de nueva creación, dinámico, innovador en el ámbito de las tecnologías de la lengua, especializado en el euskera, con sede en San Sebastián.

· Atractivos proyectos de desarrollo nacionales e internacionales para posicionar el euskera en el mundo digital.

· Formación continua en tecnologías lingüísticas de vanguardia.

· Flexibilidad laboral y entorno colaborativo.

· Posibilidades reales de crecimiento dentro del equipo.

· Experiencia en un entorno interdisciplinar con impacto social y cultural.

· Remuneración competitiva acorde con formación y experiencia.