LV EN

LĪMENIS

PROGRAMMA

FAKULTĀTE

GADS

VALODA

ATSLĒGVĀRDI

Nepārraudzīta mašīnmācīšanās pieeja dabiskās valodas tekstu kolekciju hierarhiskai, uz grafiem bazētai, attēlošanai.

Lielo datu efektīva pārvaldība ir svarīga dažādās jomās, īpaši gadījumos, kad dati sastāv no cilvēka rakstītiem dokumentiem. Nesenie sasniegumi dabiskās valodas apstrādē (NLP), jo īpaši LLM, ļāva atrisināt daudzus uzdevumus šajā jomā, neskatoties uz lielo pieprasījumu pēc marķētiem datiem, skaitļošanas resursiem un specializētām prasmēm.Lai novērstu šos ierobežojumus, pašreizējais pētījums ierosināja NLP cauruļvadu, lai noteiktu tēmu hierarhijas zinātnisko publikāciju kolekcijās. Darbā galvenā uzmanība tika pievērsta pieejamo neuzraudzīto mašīnmācīšanās metožu un kvalitātes metrikas novērtēšanai NLP, kā arī vizualizācijas metožu izstrādei, lai izveidotu cauruļvada prototipu.Piedāvātais risinājums ir balstīts uz hARTM pieeju, kas optimizēta tēmas interpretējamībai. Tas parādīja spēju no zinātnisko tekstu kolekcijām secināt cilvēka interpretējamu tēmu hierarhijas un izveidot jēgpilnu dokumentu attēlojumus. Vizualizācijas pieejas balstās uz MDS, lai parādītu starpdokumentu līdzību, un Sankey diagrammas, lai parādītu dokumentu kopu saistību tēmu hierarhijā.Lietderība tika demonstrēta divās datu kopās, koncentrējoties uz tēmu hierarhijas un saistīto tēmu definīciju interpretējamību un nozīmi. Iespējamās pielietošanas jomas ietver personīgo izglītību un zinātnisko rakstīšanu.

Autors: Jevgenijs Bodrenko

Vadītājs: Irina Jackiva

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


LLM BALSTĪTAS SQL ĢENERĒŠANAS PIEEJU SALĪDZINOŠĀ ANALĪZE

Lielo valodu modeļu straujā attīstība ir pavērusi iespējas pārstrukturēt programmatūras izstrādes procesus kopumā, kā arī tādos gadījumos kā dabiskās valodas konvertēšana SQL vaicājumos. Šī pētījuma mērķis ir eksperimentāli novērtēt četru uz LLM balstītu metožu ietekmi uz SQL ģenerēšanas efektivitāti un kvalitāti. Novērtēšana tiek veikta, pamatojoties uz šādiem rādītājiem: pareizība, pilnīgums un konsekvence. Izpētītās uz LLM balstītās SQL ģenerēšanas metodes ietver īpašus LLM, kas pielāgoti SQL koda ģenerēšanai, piemēram, SQL kodētāju ietvarus SQL koda ģenerēšanai (Vanna.ai, 2023; Llamaindex, 2023) un vairāku aģentu sadarbības tīklus valodas pārveidošanai SQL.Pētījumā tiek izmantota literatūras apskata gadījumu izpēte un simulācijas. Tas piedāvā visaptverošu pārskatu par LLM vadītās SQL paaudzes sasniegumiem, kas ietver koncepcijas, tehnoloģijas, metodoloģijas, stiprās puses, ierobežojumus un ētiskus apsvērumus.Šis pētījums veiksmīgi novērš plaisu starp teorētiskajiem pamatiem un AI papildināto pieeju praktisko pielietojumu, vienlaikus veicinot uz LLM balstītas SQL ģenerēšanas integrāciju automatizētos programmatūras izstrādes procesos.

Autors: Maksim Ilin

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...

Table View
Text View