Software/Data Engineer

Haemme kokenutta Software/Data Engineeriä mielenkiintoiseen ja haastavaan rooliin!Haemme kokenutta Software/Data Engineeriä mielenkiintoiseen ja haastavaan rooliin!
Scale-up-vaiheessa oleva asiakkaamme tarjoaa palveluna dataan perustuvaa tietoa asiakkailleen edistyneen data-työkalun muodossa. Dataa kerätään useista eri lähteistä, jalostetaan ja hyödynnännetään monipuolisesti eri sovelluskohteissa. Data sijaitsee PostgreSQL-tietokannassa, ja tavoitteena on jatkuvasti parantaa sen laatua sekä optimoida prosesseja.Asiakas etsii tiimiinsä vahvistusta kokeneesta Software/Data Engineeristä, jolla on vankka ohjelmistokehityksen ja data-arkkitehtuurin tuntemus sekä kyky esittää uusia ratkaisuja datan laadun parantamiseksi. Erityisesti roolissa korostuu suurten kielimallien (LLM, Large Language Models) hyödyntäminen tekstipohjaisen datan prosessoinnissa ja rikastamisessa.
Tässä roolissa pääset suunnittelemaan ja toteuttamaan uusia LLM-pohjaisia tiedonlouhinta- ja datankäsittelyprosesseja sekä kehittämään nykyisiä ratkaisuja entistä tehokkaammiksi.

Onnistuminen tehtävässä edellyttää luovuutta, kykyä toteuttaa ja testata erilaisia ratkaisumalleja, analysoida niiden toimivuutta sekä erinomaisia päättely- ja intuitiotaitoja siitä, miten LLM-teknologiaa kannattaa soveltaa eri ongelmiin.

Keskeiset haasteet ja tavoitteet:
  • Datan laadun parantaminen: haasteina mm. duplikaatit, puuttuvat tunnisteet ja epätäydelliset yhdistelmät (esim. yritystietojen yhdistäminen pelkän nimen perusteella).
  • Tekstipohjaisen datan tehokas käsittely ja rikastaminen, erityisesti PDF-tiedostoista ja verkkosivuilta kerätyn datan osalta.
  • LLM-mallien hyödyntäminen datan validoinnissa, normalisoinnissa ja automaattisessa järjestelyssä.
  • ETL-prosessien kehittäminen ja optimointi, jotta tuotettu data olisi entistä laadukkaampaa ja hyödynnettävissä tehokkaasti liiketoimintatarpeisiin.

Tehtävässä menestyminen edellyttää:
  • Vahvaa TypeScript-osaamista – tämä on kriittinen teknologia roolissa.
  • Kokemusta LLM-mallien (Large Language Models) hyödyntämisestä, erityisesti tekstipohjaisen datan analysoinnissa, rikastamisessa ja yhdistämisessä.
  • Taitoa käsitellä tekstipohjaista dataa eri lähteistä, kuten PDF-tiedostoista ja verkkosivuilta, sekä kykyä ratkaista tunnisteisiin liittyviä ongelmia.
  • Vankkaa relaatiotietokantojen osaamista, erityisesti PostgreSQL:n parissa.
  • Ohjelmointiosaamista useista teknologioista, kuten TypeScript/JavaScript, Python ja Docker.
  • Kokemusta ohjelmistokehityksestä datan laatuongelmien ratkaisussa, sekä kykyä luoda skaalautuvia ja tehokkaita ohjelmistoratkaisuja.

Tehtävässä työskentelet tiiviisti asiakkaan VP of Engineeringin ja kehitystiimin kanssa, jolla on vahva data- ja ohjelmistokehityksen osaaminen. Tämä on erinomainen tilaisuus olla mukana innovoimassa ja kehittämässä tulevaisuuden dataratkaisuja!
  • Locations: Remote
  • Technologies: JavaScript, Docker, ETL, Python, SQL, PostgreSQL, TypeScript, Nest.js