LV EN

LĪMENIS

PROGRAMMA

FAKULTĀTE

GADS

VALODA

Mašīniskās slīpēšanas algoritmu veiktspējas uzlabošana, samazinot datu kopas dimensiju, izmantojot šūnu automātus

Nozīmīgs izaicinājums mašīnmācīšanā ir darbs ar lieldimensiju datiem. Sarežģītība, kas pazīstama kā "dimensijas lāsts", izraisa mašīnmācīšanās algoritmu veiktspējas pasliktināšanos, palielinoties dimensijai un datu kopas lielumam. Šūnu automāti ir dinamiska diskrēta skaitļošanas sistēma ar matemātiskām funkcijām, kas pazīstamas kā noteikumi, kuri rada sarežģītu globālu uzvedību. Mēs izmantojām viendimensiju elementāros šūnu automātus kā rīku datu kopas lieluma noteikšanai. Modeļa mainīgie tika atlasīti sākotnējā stāvokļa vektora ģenerēšanai un tā tālākai pārveidošanai formātā, kas ir piemērots šūnu automāta noteikumu piemērošanai, ko šūnu automātu teorijā pazīst kā konfigurāciju. Pēc tam modelis tika iterēts, izmantojot visus iespējamos šūnu automāta noteikumus, un tika piemērotas dažādas epohālās variācijas. Samazinātās datu kopas modeļa veiktspēja tika salīdzināta ar sākotnējās datu kopas etalonrezultātiem pēc standarta dimensiju samazināšanas tehnikas izmantošanas. Tika secināts, ka piemērotos šūnu automātu noteikumus var izmantot kā alternatīvas metodes datu kopas izmēru samazināšanai, nepasliktinot modeļa veiktspēju.

Autors: Alexey Kuchvalskiy

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


LLM BALSTĪTAS SQL ĢENERĒŠANAS PIEEJU SALĪDZINOŠĀ ANALĪZE

Lielo valodu modeļu straujā attīstība ir pavērusi iespējas pārstrukturēt programmatūras izstrādes procesus kopumā, kā arī tādos gadījumos kā dabiskās valodas konvertēšana SQL vaicājumos. Šī pētījuma mērķis ir eksperimentāli novērtēt četru uz LLM balstītu metožu ietekmi uz SQL ģenerēšanas efektivitāti un kvalitāti. Novērtēšana tiek veikta, pamatojoties uz šādiem rādītājiem: pareizība, pilnīgums un konsekvence. Izpētītās uz LLM balstītās SQL ģenerēšanas metodes ietver īpašus LLM, kas pielāgoti SQL koda ģenerēšanai, piemēram, SQL kodētāju ietvarus SQL koda ģenerēšanai (Vanna.ai, 2023; Llamaindex, 2023) un vairāku aģentu sadarbības tīklus valodas pārveidošanai SQL.Pētījumā tiek izmantota literatūras apskata gadījumu izpēte un simulācijas. Tas piedāvā visaptverošu pārskatu par LLM vadītās SQL paaudzes sasniegumiem, kas ietver koncepcijas, tehnoloģijas, metodoloģijas, stiprās puses, ierobežojumus un ētiskus apsvērumus.Šis pētījums veiksmīgi novērš plaisu starp teorētiskajiem pamatiem un AI papildināto pieeju praktisko pielietojumu, vienlaikus veicinot uz LLM balstītas SQL ģenerēšanas integrāciju automatizētos programmatūras izstrādes procesos.

Autors: Maksim Ilin

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Izgūšanas-papildināšanas ģenerēšanas sistēmu uzlabošanas stratēģijas

Šis darbs sistemātiski pēta izgūšanas-papildināšanas ģenerēšanas sistēmu (RAG) sistēmu uzlabošanu lielo valodu modeļos, uzsverot izguves parametru optimizāciju un ģenerēšanas precizitāti. Tiek pētīta RAG sistēmu optimālās konfigurācijas, tostarp informācijas daļu lielumu un pārklāšanās procentus, top-k atlasi, vaicājumu transformācijas, dažādas izguves metodes, dažādus lielos valodu modeļus, proti, GPT-3.5-Turbo un GPT-4, atklājot, ka informācijas lielums visbiežāk ir 500 marķieri. piedāvā vislabāko veiktspēju. Vektoru meklēšana, izmantojot kosinusu līdzību, kļūst par visefektīvāko izguves metodi, ievērojami uzlabojot gan konteksta precizitāti, gan dažādu uzdevumu un zināšanu bāzu atsaukšanu. Eksperimentēšana CRUD-RAG ietvaros parāda tās pielietojamību dažādos uzdevumos, sākot no satura izveides līdz zināšanu pilnveidošanai. Atklājumi liecina, ka izguves iestatījumu uzlabojumi var ievērojami uzlabot RAG sistēmu veiktspēju, padarot tās efektīvākas un pielāgojamākas sarežģītiem informācijas sintēzes un izguves uzdevumiem. Šie rezultāti apstiprina sistemātisku uzlabojumu potenciālu, lai uzlabotu mākslīgā intelekta vadītus valodas modeļus praktiskos lietojumos, sniedzot nozīmīgu ieskatu un praktiskas pieejas RAG sistēmu izpētes ainavai.

Autors: Sigita Lapiņa

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Konteineru nelīdzsvarotība prognozēšana pielietojot laika rindu algoritmus uz konteineru pārvietošanas datiem.

Pētījuma mērķis ir novērtēt laika rindas modeļu pielietojumu konteineru nelīdzsvarotības prognozēšanai, izmantojot konteineru notikumu datus. Salīdzināt modeļu rezultātus un izdarīt secinājumus par reālās pasaules pielietojuma iespējām un ierobežojumiem. Pētījuma objekts ir laika rindas modeļi konteineru nelīdzsvarotības prognozēšanai, un pētījuma subjekts ir modeļu veiktspēja konteineru nelīdzsvarotības prognozēšanai, balstoties uz notikumu datiem.Pētījumam ir trīs nodaļas. Pirmā nodaļa ir literatūras apraksts par tukšo konteineru pārpozicionēšanas (ECR) prognozēšanas metodēm un pieejām. Otrā nodaļa ir konteineru nelīdzsvarotības prognozēšanas iespēju izpēte, izmantojot notikumu datus. Trešā nodaļa ir laika rindas metožu pielietojums konteineru nelīdzsvarotības prognozēšanai, eksperimenti ar reāliem datiem un mēģinājumi izstrādāt jaunu datu vadītu sistēmu notikumu datos apmācītu laika rindas modeļu novērtēšanai. Trešā nodaļa ietver eksperimentu rezultātu analīzi un interpretāciju.Tika testēti un novērtēti 8 dažādi ARIMA, VAR, VECM algoritmu modeļi, ņemot vērā dažādu konteineru izmēru un tipu kombinācijas, kā arī 6 dažādu ostu atrašanās vietas. Beidzot, pētījuma secinājumiem seko atsauces un pielikumi.

Autors: Vjačeslavs Matvejevs

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...

Table View
Text View