EUSKORPORA: Centro de datos lingüísticos para las tecnologías digitales del euskera, nueva Asociación con sede en Donostia/San Sebastián, requiere para su puesta en marcha y consolidación de su área de Tecnología incorporar a personas jóvenes, en etapa inicial de su carrera profesional para apoyar en tareas clave relacionadas con la creación de recursos lingüísticos para el euskera y con las tecnologías del lenguaje aplicadas al euskera.
Las personas seleccionadas formarán parte de un equipo interdisciplinar y participarán en proyectos de recopilación, anotación y análisis de datos lingüísticos, así como en el desarrollo de modelos de lenguaje base de código abierto (ASR, TTS, MT, PLN) orientados al euskera, dentro de un contexto de investigación y desarrollo altamente relacionado con la industria.
Funciones principales:
· Apoyar en la recopilación, limpieza y anotación de corpus lingüísticos (para texto y audio).
· Colaborar en el entrenamiento y evaluación de modelos de lenguaje para texto y voz.
· Participar en la descripción, documentación, catalogación y mantenimiento de recursos lingüísticos.
· Contribuir a la integración de herramientas y bibliotecas de PLN de código abierto.
· Asistir en la elaboración de informes, publicaciones técnicas y difusión de resultados.
· Trabajar en coordinación con perfiles técnicos, lingüísticos y de gestión.
Se requiere:
· Grado o máster en Lingüística Computacional, Ingeniería Informática, Ciencia de Datos, Traducción con especialización en tecnologías del lenguaje, o áreas relacionadas.
· Conocimientos básicos de PLN/NLP, modelos de lenguaje, o tecnologías de voz.
· Valorable haber participado en proyectos de investigación o desarrollo relacionados.
· Conocimientos técnicos:
- Programación en Python (nivel básico/intermedio).
- Familiaridad con herramientas de anotación lingüística o procesamiento de texto.
- Valorable experiencia en recopilación de corpus y construcción de recursos.
- Valorable experiencia con bibliotecas como spaCy, Hugging Face, o similares.
- Uso básico de herramientas de control de versiones (Git).
· Euskera: nivel alto (B2 o superior)
· Castellano: fluido
· Inglés: nivel alto (B2 o superior)
Se ofrece:
· Incorporación a un Centro de nueva creación, dinámico, innovador en el ámbito de las tecnologías de la lengua, especializado en el euskera, con sede en San Sebastián.
· Atractivos proyectos de desarrollo nacionales e internacionales para posicionar el euskera en el mundo digital.
· Formación continua en tecnologías lingüísticas de vanguardia.
· Flexibilidad laboral y entorno colaborativo.
· Posibilidades reales de crecimiento dentro del equipo.
· Experiencia en un entorno interdisciplinar con impacto social y cultural.
· Remuneración competitiva acorde con formación y experiencia.
