DATAcenter AI

[weglot_switcher]

Latviešu valoda lielo valodas modeļu laikmetā: EuroLLM-9B un TildeOpen-30B testēšanas rezultāti

Latviešu valoda arvien aktīvāk ienāk mākslīgā intelekta pasaulē. Pagājušajā mēnesī AIdatacenterengineers.com komanda veica interesantu eksperimentu — salīdzināja divu salīdzinoši nelielu lielo valodas modeļu (LLM) spēju komunicēt, domāt un atbildēt latviešu valodā.

Testā tika salīdzināti divi modeļi:

TildeOpen30B – Vietējs izstrādājums, kas balstīts uz apjomīgu latviešu valodas datu kopu;
EuroLLM9B – Eiropas līmeņa modelis ar īpaši plašu daudzvalodu zināšanu bāzi.

Kā tika veikts tests

Eksperimentā tika pielietoti šādi resursi:

Python un Gradio lietotāja saskarne, kas nodrošina ērtu mijiedarbību ar abiem modeļiem;
Vairāki identiski vaicājumi latviešu valodā ar mērķi novērtēt:
- Atbilžu kvalitāti un precizitāti,
- Valodas plūdumu un dabiskumu,
- Spēju ievērot norādījumus.

Rezultāti

Analīzes rezultāti atklāja būtiskas atšķirības abu modeļu veiktspējā latviešu valodā:

EuroLLM9B izcēlās ar ļoti augstu latviešu valodas izpratnes un lietojuma līmeni. Tas spēj precīzi atbildēt gan uz informatīviem, gan sarunvalodas jautājumiem, nezaudējot gramatisko kvalitāti.
TildeOpen30B, savukārt, demonstrēja izcilas zināšanas latviešu literatūrā un valodas niansēs. Tomēr tika konstatēts, ka modelim trūkst attīstītas instrukciju izpildes spējas — līdz ar to, veicot uzdevumus vai sniedzot strukturētas atbildes, modelis dažkārt vairāk koncentrējas uz literāru, nevis praktisku formulējumu.

Ko tas nozīmē praksē?

Šie rezultāti liecina, ka Eiropas mēroga lielo valodas modeļu (LLM) risinājumi jau ir gatavi augstas kvalitātes lietojumam latviešu valodā. Savukārt Tilde modelis ir īpaši vērtīgs akadēmiskajā un kultūras kontekstā, taču tam vēl nepieciešama papildu pielāgošana, lai tas pilnvērtīgi darbotos kā praktisks mākslīgā intelekta asistents un tērzēšanas robots.

Pielietotās tehnoloģijas

Python – datu un modeļu integrācijai
Gradio – interaktīvajai testēšanas saskarnei
AIdatacenterengineers.com infrastructure – nodrošināja modeļu testēšanu drošā un jaudīgā vidē

Kas tiks testēts?

Šajā testā tiek salīdzināti divi salīdzinoši nelieli lielie valodas modeļi (LLM), tiem nesniedzot detalizētas instrukcijas. Savukārt, līdz ar jaunā Nvidia DGX Spark pieejamību, ir iespējams darbināt ievērojami lielākus (70B+) modeļus lokālā mākslīgā intelekta vidē — un novērtēt, cik labi tie spēj izprast mazās valodas.

Sazinieties ar mums, lai izveidotu un ieviestu savu privāto mākslīgā intelekta aģentu sistēmu.

Pieteikt konsultāciju

Gatavi apspriest jūsu MI infrastruktūras vajadzības vai dizaina pakalpojumu? Aizpildiet zemāk esošo formu vai vienkārši zvaniet mums.

Datakom piedāvā dažādus IT pakalpojumus, kas pielāgoti jebkuras iestādes vai uzņēmuma vajadzībām, ņemot vērā nozari un darbinieku skaitu.

www.aidatacenterengineers.com

+371 67442800

[email protected]

+371 67628888

Malduguņu iela 2, Mārupes novads

Mārupe, LV-2167

LV40103142605

AS Luminor Bank Latvian branch

SWIFT/BIC: RIKOLV2X

Account: LV69RIKO0000080227272