EUSKORPORA, Euskararen teknologia digitaletarako datu linguistikoen zentroa, egoitza Donostian duen elkarte berria,  hizkuntza naturalaren prozesamenduan aplikatutako AA teknologietako goi-mailako aditu baten bila dabil, esperientzia duena, euskarari aplikatutako hizkuntza-teknologiekin lotutako funtsezko zereginak zuzentzeko.

Hautatutako pertsona diziplinarteko talde bateko kide izango da, eta hizkuntza-datuak bildu, aztertu eta idazteko proiektuetan parte hartuko du, bai eta kode irekiko sortze-ereduen garapenean ere (ASR, TTS, MT, NLP), euskarara bideratuta, industriari estuki lotutako ikerketa- eta garapen-testuinguruan.

Eginkizun nagusiak:

  • Hizkuntza-corpusak biltzeko, jasotzeko eta kudeatzeko prozesuak gainbegiratzea eta optimizatzea.
  • Euskarari aplikatutako hizkuntza-eredu fundazionalen diseinua eta garapena gidatzea (ahotsaren ezagutza eta sintesia, itzulpena, testu-prozesamendua, etab.).
  • Zentroko arkitektura teknologikoa diseinatzen eta etorkizunean garatzen laguntzea.
  • Garapenen kalitate teknikoa eta metodologikoa bermatzea. Barneko zein kanpoko taldeak koordinatzea eta teknikari juniorren mentore izatea.
  • Berrikuntza teknologikorako aukerak eta lan-ildo berriak identifikatzea. Proposamenetan, txosten teknikoetan, dokumentazioan eta emaitzen hedapenean laguntzea.
  • Ekosistemako funtsezko eragileekin (akademia, industria, zentro teknologikoak) harreman estrategikoak eraikitzea

Baldintzak:

  • Goi-mailako unibertsitate-titulua (gradua + masterra edo doktoregoa): Hizkuntzalaritza Konputazionala, PLN, Adimen Artifiziala, Ingeniaritza Informatikoa, Datu-zientzia edo antzeko arloak.
  • Gutxienez 5 urteko esperientzia hizkuntzaren teknologietan edo hizkuntzari aplikatutako AAko proiektuetan.
  • Parte-hartze frogagarria ASR, TTS, MT edo NLP ereduen garapenean.
  • Ikerketa aplikatuko edo garapen teknologiko aurreratuko inguruneetan esperientzia izatea.

Ezagutza teknikoak:

  • Programazio aurreratua Pythonen.
  • Liburutegien eta frameworken erabilera profesionala, hala nola Hugging Face, PyTorch, TensorFlow, spaCy, Kaldi, ESPnet, Fairseq, etab.
  • Esperientzia hizkuntza prozesatzeko eta corpusak kudeatzeko pipelinekin.
  • MLOps ezagutzak, bertsioen kontrola (Git) eta praktika onak erreproduzitzeko datuen zientzian.
  • Datu irekien eta lizentzien biltegieak (Creative Commons, etab.) ezagutzea.

Hizkuntzak:

  • Euskara: hobe, tarteko maila (B2 edo gehiago).
  • Gaztelania: maila altua.
  • Ingelesa: maila altua (bereziki, teknikoa).

Esperientzia gehigarri baloragarria:

  • Esperientzia proiektu teknikoak gidatzen eta taldeak koordinatzen.
  • Kode irekiko PLN ekosistemaren ezagutza eguneratuak.
  • Argitalpen zientifikoetan edo kongresuetan parte hartzea.
  • Komunikaziorako, sintesirako eta pentsamendu estrategikorako trebetasunak.
  • Hizkuntzaren teknologiak ikertzeko Europako edo nazioarteko sareekin konexioa.

Eskaintzen dugu:

  • Sortu berria den zentro dinamiko eta berritzaile batean integratzea, helburu argi batekin: euskara eremu digital globalean kokatzea.
  • Eragin zientifikoa, teknologikoa eta kulturala duten proiektu estrategikoetan parte hartzea.
  • Diziplinarteko, lankidetzako eta goi-mailako lan-ingurunea.
  • Lan-malgutasuna, etengabeko prestakuntza eta garapen profesionala.
  • Soldata lehiakorra, esperientziaren eta erantzukizunen araberakoa.

Kontaktua: info@euskorpora.eus