LV EN

LĪMENIS

PROGRAMMA

FAKULTĀTE

GADS

VALODA

ATSLĒGVĀRDI

Nepārraudzīta mašīnmācīšanās pieeja dabiskās valodas tekstu kolekciju hierarhiskai, uz grafiem bazētai, attēlošanai.

Lielo datu efektīva pārvaldība ir svarīga dažādās jomās, īpaši gadījumos, kad dati sastāv no cilvēka rakstītiem dokumentiem. Nesenie sasniegumi dabiskās valodas apstrādē (NLP), jo īpaši LLM, ļāva atrisināt daudzus uzdevumus šajā jomā, neskatoties uz lielo pieprasījumu pēc marķētiem datiem, skaitļošanas resursiem un specializētām prasmēm.Lai novērstu šos ierobežojumus, pašreizējais pētījums ierosināja NLP cauruļvadu, lai noteiktu tēmu hierarhijas zinātnisko publikāciju kolekcijās. Darbā galvenā uzmanība tika pievērsta pieejamo neuzraudzīto mašīnmācīšanās metožu un kvalitātes metrikas novērtēšanai NLP, kā arī vizualizācijas metožu izstrādei, lai izveidotu cauruļvada prototipu.Piedāvātais risinājums ir balstīts uz hARTM pieeju, kas optimizēta tēmas interpretējamībai. Tas parādīja spēju no zinātnisko tekstu kolekcijām secināt cilvēka interpretējamu tēmu hierarhijas un izveidot jēgpilnu dokumentu attēlojumus. Vizualizācijas pieejas balstās uz MDS, lai parādītu starpdokumentu līdzību, un Sankey diagrammas, lai parādītu dokumentu kopu saistību tēmu hierarhijā.Lietderība tika demonstrēta divās datu kopās, koncentrējoties uz tēmu hierarhijas un saistīto tēmu definīciju interpretējamību un nozīmi. Iespējamās pielietošanas jomas ietver personīgo izglītību un zinātnisko rakstīšanu.

Autors: Jevgenijs Bodrenko

Vadītājs: Irina Jackiva

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


LLM BALSTĪTAS SQL ĢENERĒŠANAS PIEEJU SALĪDZINOŠĀ ANALĪZE

Lielo valodu modeļu straujā attīstība ir pavērusi iespējas pārstrukturēt programmatūras izstrādes procesus kopumā, kā arī tādos gadījumos kā dabiskās valodas konvertēšana SQL vaicājumos. Šī pētījuma mērķis ir eksperimentāli novērtēt četru uz LLM balstītu metožu ietekmi uz SQL ģenerēšanas efektivitāti un kvalitāti. Novērtēšana tiek veikta, pamatojoties uz šādiem rādītājiem: pareizība, pilnīgums un konsekvence. Izpētītās uz LLM balstītās SQL ģenerēšanas metodes ietver īpašus LLM, kas pielāgoti SQL koda ģenerēšanai, piemēram, SQL kodētāju ietvarus SQL koda ģenerēšanai (Vanna.ai, 2023; Llamaindex, 2023) un vairāku aģentu sadarbības tīklus valodas pārveidošanai SQL.Pētījumā tiek izmantota literatūras apskata gadījumu izpēte un simulācijas. Tas piedāvā visaptverošu pārskatu par LLM vadītās SQL paaudzes sasniegumiem, kas ietver koncepcijas, tehnoloģijas, metodoloģijas, stiprās puses, ierobežojumus un ētiskus apsvērumus.Šis pētījums veiksmīgi novērš plaisu starp teorētiskajiem pamatiem un AI papildināto pieeju praktisko pielietojumu, vienlaikus veicinot uz LLM balstītas SQL ģenerēšanas integrāciju automatizētos programmatūras izstrādes procesos.

Autors: Maksim Ilin

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Dabiskās Valodas Apstrādes modeļa dzīvotspējas novērtēšana kravas ekspeditoru Elektroniskā Kontrolsarakstu Sistēmā: Informācijas ieguve no kravas aprakstiem.

Šajā pētījumā tiek izskatīta Dabiskās valodas apstrādes (NLP) pielietojums elektronisko pārbaudes sarakstu sistēmās, lai uzlabotu kravas aprakstīšanu un nostiprināšanas praksi kravu pārvadātājiem. Loģistikas nozare saskaras ar nozīmīgām problēmām sakarā ar sarežģītiem un daudzveidīgiem likumiem un vajadzību pēc autonomām validācijas rīkiem kravu nostiprināšanai. Šī pētījuma mērķis ir izstrādāt noteikumu pamatā balstītu nosauktu entitāšu atpazīšanas (NER) modeli, lai standartizētu un automatizētu entitāšu izvilkšanu no kravas aprakstiem.Šī pētījuma galvenie komponenti ietver entitāšu izvilkšanas mehānisma izstrādi, izmantojot regulārās izteiksmes un standartizēto kodu sistēmas. Pētījums demonstrē NLP risinājumu potenciālu, lai no detalizētiem kravas aprakstiem ģenerētu precīzus, dinamiskus pārbaudes sarakstus, nodrošinot, ka tiek apsvērtas visas būtiskās uzdevumu sadaļas. Izstrādātā NER modelis tiek novērtēts, veicot virkni eksperimentu, demonstrējot augstu precizitāti, atpazīšanas un F1 rezultātus, tādējādi uzsvērojot tā praktisko pielietojamību reālās loģistikas operācijās. Atradumi uzsver kravas saistītās informācijas standartizēšanas nozīmi, lai veicinātu automatizēto NLP risinājumu plašāku pieņemšanu loģistikas nozarē.

Autors: Nikita Mickevičs

Vadītājs: Dmitry Pavlyuk

Līmenis: Profesionālais bakalauriāts

Gads: 2024

Darba valoda: Angļu

Table View
Text View