EUSKORPORA, Euskararen teknologia digitaletarako datu linguistikoen zentroa, egoitza Donostian duen elkarte berria, hizkuntza naturalaren prozesamenduan aplikatutako AA teknologietako goi-mailako aditu baten bila dabil, esperientzia duena, euskarari aplikatutako hizkuntza-teknologiekin lotutako funtsezko zereginak zuzentzeko.
Hautatutako pertsona diziplinarteko talde bateko kide izango da, eta hizkuntza-datuak bildu, aztertu eta idazteko proiektuetan parte hartuko du, bai eta kode irekiko sortze-ereduen garapenean ere (ASR, TTS, MT, NLP), euskarara bideratuta, industriari estuki lotutako ikerketa- eta garapen-testuinguruan.
Eginkizun nagusiak:
- Hizkuntza-corpusak biltzeko, jasotzeko eta kudeatzeko prozesuak gainbegiratzea eta optimizatzea.
- Euskarari aplikatutako hizkuntza-eredu fundazionalen diseinua eta garapena gidatzea (ahotsaren ezagutza eta sintesia, itzulpena, testu-prozesamendua, etab.).
- Zentroko arkitektura teknologikoa diseinatzen eta etorkizunean garatzen laguntzea.
- Garapenen kalitate teknikoa eta metodologikoa bermatzea. Barneko zein kanpoko taldeak koordinatzea eta teknikari juniorren mentore izatea.
- Berrikuntza teknologikorako aukerak eta lan-ildo berriak identifikatzea. Proposamenetan, txosten teknikoetan, dokumentazioan eta emaitzen hedapenean laguntzea.
- Ekosistemako funtsezko eragileekin (akademia, industria, zentro teknologikoak) harreman estrategikoak eraikitzea
Baldintzak:
- Goi-mailako unibertsitate-titulua (gradua + masterra edo doktoregoa): Hizkuntzalaritza Konputazionala, PLN, Adimen Artifiziala, Ingeniaritza Informatikoa, Datu-zientzia edo antzeko arloak.
- Gutxienez 5 urteko esperientzia hizkuntzaren teknologietan edo hizkuntzari aplikatutako AAko proiektuetan.
- Parte-hartze frogagarria ASR, TTS, MT edo NLP ereduen garapenean.
- Ikerketa aplikatuko edo garapen teknologiko aurreratuko inguruneetan esperientzia izatea.
Ezagutza teknikoak:
- Programazio aurreratua Pythonen.
- Liburutegien eta frameworken erabilera profesionala, hala nola Hugging Face, PyTorch, TensorFlow, spaCy, Kaldi, ESPnet, Fairseq, etab.
- Esperientzia hizkuntza prozesatzeko eta corpusak kudeatzeko pipelinekin.
- MLOps ezagutzak, bertsioen kontrola (Git) eta praktika onak erreproduzitzeko datuen zientzian.
- Datu irekien eta lizentzien biltegieak (Creative Commons, etab.) ezagutzea.
Hizkuntzak:
- Euskara: hobe, tarteko maila (B2 edo gehiago).
- Gaztelania: maila altua.
- Ingelesa: maila altua (bereziki, teknikoa).
Esperientzia gehigarri baloragarria:
- Esperientzia proiektu teknikoak gidatzen eta taldeak koordinatzen.
- Kode irekiko PLN ekosistemaren ezagutza eguneratuak.
- Argitalpen zientifikoetan edo kongresuetan parte hartzea.
- Komunikaziorako, sintesirako eta pentsamendu estrategikorako trebetasunak.
- Hizkuntzaren teknologiak ikertzeko Europako edo nazioarteko sareekin konexioa.
Eskaintzen dugu:
- Sortu berria den zentro dinamiko eta berritzaile batean integratzea, helburu argi batekin: euskara eremu digital globalean kokatzea.
- Eragin zientifikoa, teknologikoa eta kulturala duten proiektu estrategikoetan parte hartzea.
- Diziplinarteko, lankidetzako eta goi-mailako lan-ingurunea.
- Lan-malgutasuna, etengabeko prestakuntza eta garapen profesionala.
- Soldata lehiakorra, esperientziaren eta erantzukizunen araberakoa.
Kontaktua: info@euskorpora.eus
