LV EN

LĪMENIS

PROGRAMMA

FAKULTĀTE

GADS

VALODA

ATSLĒGVĀRDI

Mašīniskās slīpēšanas algoritmu veiktspējas uzlabošana, samazinot datu kopas dimensiju, izmantojot šūnu automātus

Nozīmīgs izaicinājums mašīnmācīšanā ir darbs ar lieldimensiju datiem. Sarežģītība, kas pazīstama kā "dimensijas lāsts", izraisa mašīnmācīšanās algoritmu veiktspējas pasliktināšanos, palielinoties dimensijai un datu kopas lielumam. Šūnu automāti ir dinamiska diskrēta skaitļošanas sistēma ar matemātiskām funkcijām, kas pazīstamas kā noteikumi, kuri rada sarežģītu globālu uzvedību. Mēs izmantojām viendimensiju elementāros šūnu automātus kā rīku datu kopas lieluma noteikšanai. Modeļa mainīgie tika atlasīti sākotnējā stāvokļa vektora ģenerēšanai un tā tālākai pārveidošanai formātā, kas ir piemērots šūnu automāta noteikumu piemērošanai, ko šūnu automātu teorijā pazīst kā konfigurāciju. Pēc tam modelis tika iterēts, izmantojot visus iespējamos šūnu automāta noteikumus, un tika piemērotas dažādas epohālās variācijas. Samazinātās datu kopas modeļa veiktspēja tika salīdzināta ar sākotnējās datu kopas etalonrezultātiem pēc standarta dimensiju samazināšanas tehnikas izmantošanas. Tika secināts, ka piemērotos šūnu automātu noteikumus var izmantot kā alternatīvas metodes datu kopas izmēru samazināšanai, nepasliktinot modeļa veiktspēju.

Autors: Alexey Kuchvalskiy

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Mašīnmācīšanās izmantošana lēmumu atbalsta sistēmā

Šī darba mērķis ir uzlabot gaidīšanas laiku prognozēšanas precizitāti esošajā rindas vadības sistēmā, izmantojot mašīnmācīšanos. Tika analizēti klienta sniegtie dati un modeļi tika apmācīti, izmantojot dažādus mašīnmācīšanās algoritmus. Tika apkopoti modeļu veiktspējas rādītāji un izvēlēts labākais. Papildus tika izstrādāta programmatūra un datubāze, kas ļauj kontrolēt apmācības procesu un novērtēt modeļu kvalitāti. Programmatūras kvalitāte tika novērtēta, izmantojot nozares standartmetodoloģijas, un tika pārbaudīta.

Autors: Jevgēnijs Nikolajevs

Vadītājs: Jeļena Kijonoka

Līmenis: Bakalaurs

Gads: 2024

Darba valoda: Latviešu

Studiju programma: Datorzinātnes

Vairāk...


Boosting algoritmi kredītkaršu krāpšanas atklāšanai dažādās datu kopās

Manuāla pārskatīšana un noteikumu bāzētas sistēmas, kā arī datu ieguves tehnikas, piemēram, klasterēšanas un klasifikācijas algoritmi, ir būtiski kredītkaršu krāpšanas atklāšanai, jo tie palīdz identificēt krāpnieciskas transakcijas. Neskatoties uz apmācības datu vākšanas grūtībām, nesen ir pieejami vairāk dati, tomēr pilnīga pašreizējo mašīnmācīšanās pieeju salīdzināšana vēl nav veikta. Algoritmi, piemēram, XGBoost, AdaBoost un Gradient Boosting Machine, bieži pārspēj vecākas metodes. Šajā pētījumā tiek salīdzināti palielināšanas algoritmi ar tradicionālām pieejām, izmantojot trīs dažādas kredītkaršu transakciju datu kopas: sintētiskas, līdzsvarotas ar 50% krāpnieciskām transakcijām un ļoti nesabalansētas ar tikai 0,17% krāpnieciskām transakcijām. Īstajās transakciju datu kopās bija 28 anonimizēti parametri, piemēram, laiks un vieta. Katrs algoritms tika novērtēts pēc F1 score, accuracy, precision, un recall. Šis pētījums sniedz ieteikumus par algoritmu izmantošanu reālās situācijās, sniedzot vērtīgas atziņas nākotnes pētījumiem un praktiskai izmantošanai kredītkaršu krāpšanas atklāšanā.

Autors: Justs Vīdušs

Vadītājs: Nadežda Spiridovska

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Izgūšanas-papildināšanas ģenerēšanas sistēmu uzlabošanas stratēģijas

Šis darbs sistemātiski pēta izgūšanas-papildināšanas ģenerēšanas sistēmu (RAG) sistēmu uzlabošanu lielo valodu modeļos, uzsverot izguves parametru optimizāciju un ģenerēšanas precizitāti. Tiek pētīta RAG sistēmu optimālās konfigurācijas, tostarp informācijas daļu lielumu un pārklāšanās procentus, top-k atlasi, vaicājumu transformācijas, dažādas izguves metodes, dažādus lielos valodu modeļus, proti, GPT-3.5-Turbo un GPT-4, atklājot, ka informācijas lielums visbiežāk ir 500 marķieri. piedāvā vislabāko veiktspēju. Vektoru meklēšana, izmantojot kosinusu līdzību, kļūst par visefektīvāko izguves metodi, ievērojami uzlabojot gan konteksta precizitāti, gan dažādu uzdevumu un zināšanu bāzu atsaukšanu. Eksperimentēšana CRUD-RAG ietvaros parāda tās pielietojamību dažādos uzdevumos, sākot no satura izveides līdz zināšanu pilnveidošanai. Atklājumi liecina, ka izguves iestatījumu uzlabojumi var ievērojami uzlabot RAG sistēmu veiktspēju, padarot tās efektīvākas un pielāgojamākas sarežģītiem informācijas sintēzes un izguves uzdevumiem. Šie rezultāti apstiprina sistemātisku uzlabojumu potenciālu, lai uzlabotu mākslīgā intelekta vadītus valodas modeļus praktiskos lietojumos, sniedzot nozīmīgu ieskatu un praktiskas pieejas RAG sistēmu izpētes ainavai.

Autors: Sigita Lapiņa

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Uz mašīnmācīšanos balstīta neobjektivitātes novēršana nākotnes atlasē, kas balstīta uz mākslīgo intelektu

Mūsdienu cilvēkresursu vidē mākslīgā intelekta integrācija rada gan iespējas, gan izaicinājumus, jo īpaši personāla atlases jomā, kas aptver visus procesa posmus, sākot no kandidātu meklēšanas līdz gala atlasei. Tomēr šī integrācija nav bez problēmām. Neobjektīvi dati, kas izriet no vēsturiskiem datiem vai sabiedrības aizspriedumiem, var būt nozīmīgs šķērslis, kas var izraisīt diskriminējošu praksi. Pētījumā "Uz mašīnmācīšanos balstīta neobjektivitātes novēršana nākotnes atlasē, kas balstīta uz mākslīgo intelektu" mērķis ir analizēt esošas novirzes gan no cilvēka, gan no mākslīgā intelekta perspektīvas personāla atlases procesā. Tā ietvaros tiek meklētas atbildes uz šādiem pētījuma jautājumiem: kādas ir esošās neobjektivitātes personāla atlases procesā, gan tiešas, gan netiešas, un kā var efektīvi mazināt vai novērst novirzes personāla atlases procesā, izmantojot modelēšanas metodes nākotnes atlases sistēmās, kas balstītas uz mākslīgo intelektu. Izmantojot uz datiem balstītu pieeju un mašīnmācīšanās modeļu pielāgošanu, tiks atklāts, kāda veida novirzes pastāv atlases procesā un kā tās mazināt.

Autors: Ērika Todjēre

Vadītājs: Jeļena Kijonoka

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...

Table View
Text View