Latviešu valoda arvien aktīvāk ienāk mākslīgā intelekta pasaulē. Pagājušajā mēnesī AIdatacenterengineers.com komanda veica interesantu eksperimentu — salīdzināja divu salīdzinoši nelielu lielo valodas modeļu (LLM) spēju komunicēt, domāt un atbildēt latviešu valodā.
TildeOpen30B – Vietējs izstrādājums, kas balstīts uz apjomīgu latviešu valodas datu kopu;
EuroLLM9B – Eiropas līmeņa modelis ar īpaši plašu daudzvalodu zināšanu bāzi.
Eksperimentā tika pielietoti šādi resursi:
Python un Gradio lietotāja saskarne, kas nodrošina ērtu mijiedarbību ar abiem modeļiem;
Vairāki identiski vaicājumi latviešu valodā ar mērķi novērtēt:
Atbilžu kvalitāti un precizitāti,
Valodas plūdumu un dabiskumu,
Spēju ievērot norādījumus.
Analīzes rezultāti atklāja būtiskas atšķirības abu modeļu veiktspējā latviešu valodā:
EuroLLM9B izcēlās ar ļoti augstu latviešu valodas izpratnes un lietojuma līmeni. Tas spēj precīzi atbildēt gan uz informatīviem, gan sarunvalodas jautājumiem, nezaudējot gramatisko kvalitāti.
TildeOpen30B, savukārt, demonstrēja izcilas zināšanas latviešu literatūrā un valodas niansēs. Tomēr tika konstatēts, ka modelim trūkst attīstītas instrukciju izpildes spējas — līdz ar to, veicot uzdevumus vai sniedzot strukturētas atbildes, modelis dažkārt vairāk koncentrējas uz literāru, nevis praktisku formulējumu.
Šie rezultāti liecina, ka Eiropas mēroga lielo valodas modeļu (LLM) risinājumi jau ir gatavi augstas kvalitātes lietojumam latviešu valodā. Savukārt Tilde modelis ir īpaši vērtīgs akadēmiskajā un kultūras kontekstā, taču tam vēl nepieciešama papildu pielāgošana, lai tas pilnvērtīgi darbotos kā praktisks mākslīgā intelekta asistents un tērzēšanas robots.
Python – datu un modeļu integrācijai
Gradio – interaktīvajai testēšanas saskarnei
AIdatacenterengineers.com infrastructure – nodrošināja modeļu testēšanu drošā un jaudīgā vidē
Šajā testā tiek salīdzināti divi salīdzinoši nelieli lielie valodas modeļi (LLM), tiem nesniedzot detalizētas instrukcijas. Savukārt, līdz ar jaunā Nvidia DGX Spark pieejamību, ir iespējams darbināt ievērojami lielākus (70B+) modeļus lokālā mākslīgā intelekta vidē — un novērtēt, cik labi tie spēj izprast mazās valodas.
Sazinieties ar mums, lai izveidotu un ieviestu savu privāto mākslīgā intelekta aģentu sistēmu.
Datakom piedāvā dažādus IT pakalpojumus, kas pielāgoti jebkuras iestādes vai uzņēmuma vajadzībām, ņemot vērā nozari un darbinieku skaitu.
+371 67442800
© DATAKOM SIA. All Rights Reserved.