LV EN

LĪMENIS

PROGRAMMA

FAKULTĀTE

GADS

VALODA

ATSLĒGVĀRDI

Mašīniskās slīpēšanas algoritmu veiktspējas uzlabošana, samazinot datu kopas dimensiju, izmantojot šūnu automātus

Nozīmīgs izaicinājums mašīnmācīšanā ir darbs ar lieldimensiju datiem. Sarežģītība, kas pazīstama kā "dimensijas lāsts", izraisa mašīnmācīšanās algoritmu veiktspējas pasliktināšanos, palielinoties dimensijai un datu kopas lielumam. Šūnu automāti ir dinamiska diskrēta skaitļošanas sistēma ar matemātiskām funkcijām, kas pazīstamas kā noteikumi, kuri rada sarežģītu globālu uzvedību. Mēs izmantojām viendimensiju elementāros šūnu automātus kā rīku datu kopas lieluma noteikšanai. Modeļa mainīgie tika atlasīti sākotnējā stāvokļa vektora ģenerēšanai un tā tālākai pārveidošanai formātā, kas ir piemērots šūnu automāta noteikumu piemērošanai, ko šūnu automātu teorijā pazīst kā konfigurāciju. Pēc tam modelis tika iterēts, izmantojot visus iespējamos šūnu automāta noteikumus, un tika piemērotas dažādas epohālās variācijas. Samazinātās datu kopas modeļa veiktspēja tika salīdzināta ar sākotnējās datu kopas etalonrezultātiem pēc standarta dimensiju samazināšanas tehnikas izmantošanas. Tika secināts, ka piemērotos šūnu automātu noteikumus var izmantot kā alternatīvas metodes datu kopas izmēru samazināšanai, nepasliktinot modeļa veiktspēju.

Autors: Alexey Kuchvalskiy

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Boosting algoritmi kredītkaršu krāpšanas atklāšanai dažādās datu kopās

Manuāla pārskatīšana un noteikumu bāzētas sistēmas, kā arī datu ieguves tehnikas, piemēram, klasterēšanas un klasifikācijas algoritmi, ir būtiski kredītkaršu krāpšanas atklāšanai, jo tie palīdz identificēt krāpnieciskas transakcijas. Neskatoties uz apmācības datu vākšanas grūtībām, nesen ir pieejami vairāk dati, tomēr pilnīga pašreizējo mašīnmācīšanās pieeju salīdzināšana vēl nav veikta. Algoritmi, piemēram, XGBoost, AdaBoost un Gradient Boosting Machine, bieži pārspēj vecākas metodes. Šajā pētījumā tiek salīdzināti palielināšanas algoritmi ar tradicionālām pieejām, izmantojot trīs dažādas kredītkaršu transakciju datu kopas: sintētiskas, līdzsvarotas ar 50% krāpnieciskām transakcijām un ļoti nesabalansētas ar tikai 0,17% krāpnieciskām transakcijām. Īstajās transakciju datu kopās bija 28 anonimizēti parametri, piemēram, laiks un vieta. Katrs algoritms tika novērtēts pēc F1 score, accuracy, precision, un recall. Šis pētījums sniedz ieteikumus par algoritmu izmantošanu reālās situācijās, sniedzot vērtīgas atziņas nākotnes pētījumiem un praktiskai izmantošanai kredītkaršu krāpšanas atklāšanā.

Autors: Justs Vīdušs

Vadītājs: Nadežda Spiridovska

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Akmens gravējumu rakstzīmju optiskās atpazīšanas precizitātes uzlabošana ar attēlu priekšapstrādes metodēm

Šis pētījums ir vērsts uz priekšapstrādes metožu izstrādi, lai uzlabotu optiskās rakstzīmju atpazīšanas (OCR) precizitāti akmens gravējumiem. Galvenais mērķis ir uzlabot plaši izmantotu OCR rīku precizitāti, sevišķi tekstiem, kas iegravēti uz akmens virsmām, kuras rada unikālas problēmas, kas atšķiras no tradicionālajiem OCR pielietojumiem. Uzsvars tiek likts uz attēlu priekšapstrādes metožu izstrādi kā programmatūras produktu. Darbā tika izmantoti pielāgoti attēlu manipulāciju skripti, lai uzlabotu atpazīšanas precizitāti un risinātu tādas problēmas kā kontrasts, izlīdzināšana, troksnis un izšķirtspēja. Priekšapstrādes posms tika integrēts darba plūsmā, kas paredzēta attēlu pārveidošanai pirms OCR apstrādes, savukārt pēc apstrādes tika veikts atpazīšanas uzlabojumu novērtējums, balstoties uz teksta līdzības metriku analīzi. Iteratīva attēlu tekstu atpazīšana un atkārtota atpazīšana pēc pielietotas priekšapstrādes parādīja ievērojamus OCR precizitātes uzlabojumus. Šis darbs nodrošina stabilu pamatu turpmākai OCR darba plūsmas uzlabošanai, lietojot pielāgojamas priekšapstrādes tehnikas, kas paredzētas tieši specifiskajām problēmjomām, sasniedzot augstāku precizitāti tekstu atpazīšanā.

Autors: Romans Urbans-Orbans

Vadītājs: Aleksandrs Grakovskis

Līmenis: Bakalaurs

Gads: 2024

Darba valoda: Latviešu

Studiju programma: Datorzinātnes

Vairāk...

Table View
Text View