LV EN

LĪMENIS

PROGRAMMA

FAKULTĀTE

GADS

VALODA

AI vadīta balss atpazīšana: Modeļa izstrāde un pielietojums

Šī bakalaura darba mērķis bija izstrādāt runas atpazīšanas modeli ar aplikāciju, kurai ir sistēmas palīga iespējas. Autora darba rezultāts ir modelis, kas spēj atpazīt runu no ierobežota vārdu kopuma, un lietojumprogramma, kas ir koncepcijas prototips. Programmatūra ir izstrādāta, izmantojot Visual Studio Code/Jupyter un Python programmēšanas valodu ar tādiem lieliem ietvariem kā Keras. Bakalaura darba izpildes procesā izveidotais programprodukts pilnībā atbilst visām tam izvirzītajām prasībām un ir gatavs darbam.

Autors: Aleksejs Ņikiforovs

Vadītājs: Dmitry Pavlyuk

Līmenis: Bakalaurs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Mašīniskās slīpēšanas algoritmu veiktspējas uzlabošana, samazinot datu kopas dimensiju, izmantojot šūnu automātus

Nozīmīgs izaicinājums mašīnmācīšanā ir darbs ar lieldimensiju datiem. Sarežģītība, kas pazīstama kā "dimensijas lāsts", izraisa mašīnmācīšanās algoritmu veiktspējas pasliktināšanos, palielinoties dimensijai un datu kopas lielumam. Šūnu automāti ir dinamiska diskrēta skaitļošanas sistēma ar matemātiskām funkcijām, kas pazīstamas kā noteikumi, kuri rada sarežģītu globālu uzvedību. Mēs izmantojām viendimensiju elementāros šūnu automātus kā rīku datu kopas lieluma noteikšanai. Modeļa mainīgie tika atlasīti sākotnējā stāvokļa vektora ģenerēšanai un tā tālākai pārveidošanai formātā, kas ir piemērots šūnu automāta noteikumu piemērošanai, ko šūnu automātu teorijā pazīst kā konfigurāciju. Pēc tam modelis tika iterēts, izmantojot visus iespējamos šūnu automāta noteikumus, un tika piemērotas dažādas epohālās variācijas. Samazinātās datu kopas modeļa veiktspēja tika salīdzināta ar sākotnējās datu kopas etalonrezultātiem pēc standarta dimensiju samazināšanas tehnikas izmantošanas. Tika secināts, ka piemērotos šūnu automātu noteikumus var izmantot kā alternatīvas metodes datu kopas izmēru samazināšanai, nepasliktinot modeļa veiktspēju.

Autors: Alexey Kuchvalskiy

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


LLM BALSTĪTAS SQL ĢENERĒŠANAS PIEEJU SALĪDZINOŠĀ ANALĪZE

Lielo valodu modeļu straujā attīstība ir pavērusi iespējas pārstrukturēt programmatūras izstrādes procesus kopumā, kā arī tādos gadījumos kā dabiskās valodas konvertēšana SQL vaicājumos. Šī pētījuma mērķis ir eksperimentāli novērtēt četru uz LLM balstītu metožu ietekmi uz SQL ģenerēšanas efektivitāti un kvalitāti. Novērtēšana tiek veikta, pamatojoties uz šādiem rādītājiem: pareizība, pilnīgums un konsekvence. Izpētītās uz LLM balstītās SQL ģenerēšanas metodes ietver īpašus LLM, kas pielāgoti SQL koda ģenerēšanai, piemēram, SQL kodētāju ietvarus SQL koda ģenerēšanai (Vanna.ai, 2023; Llamaindex, 2023) un vairāku aģentu sadarbības tīklus valodas pārveidošanai SQL.Pētījumā tiek izmantota literatūras apskata gadījumu izpēte un simulācijas. Tas piedāvā visaptverošu pārskatu par LLM vadītās SQL paaudzes sasniegumiem, kas ietver koncepcijas, tehnoloģijas, metodoloģijas, stiprās puses, ierobežojumus un ētiskus apsvērumus.Šis pētījums veiksmīgi novērš plaisu starp teorētiskajiem pamatiem un AI papildināto pieeju praktisko pielietojumu, vienlaikus veicinot uz LLM balstītas SQL ģenerēšanas integrāciju automatizētos programmatūras izstrādes procesos.

Autors: Maksim Ilin

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...


Dabiskās Valodas Apstrādes modeļa dzīvotspējas novērtēšana kravas ekspeditoru Elektroniskā Kontrolsarakstu Sistēmā: Informācijas ieguve no kravas aprakstiem.

Šajā pētījumā tiek izskatīta Dabiskās valodas apstrādes (NLP) pielietojums elektronisko pārbaudes sarakstu sistēmās, lai uzlabotu kravas aprakstīšanu un nostiprināšanas praksi kravu pārvadātājiem. Loģistikas nozare saskaras ar nozīmīgām problēmām sakarā ar sarežģītiem un daudzveidīgiem likumiem un vajadzību pēc autonomām validācijas rīkiem kravu nostiprināšanai. Šī pētījuma mērķis ir izstrādāt noteikumu pamatā balstītu nosauktu entitāšu atpazīšanas (NER) modeli, lai standartizētu un automatizētu entitāšu izvilkšanu no kravas aprakstiem.Šī pētījuma galvenie komponenti ietver entitāšu izvilkšanas mehānisma izstrādi, izmantojot regulārās izteiksmes un standartizēto kodu sistēmas. Pētījums demonstrē NLP risinājumu potenciālu, lai no detalizētiem kravas aprakstiem ģenerētu precīzus, dinamiskus pārbaudes sarakstus, nodrošinot, ka tiek apsvērtas visas būtiskās uzdevumu sadaļas. Izstrādātā NER modelis tiek novērtēts, veicot virkni eksperimentu, demonstrējot augstu precizitāti, atpazīšanas un F1 rezultātus, tādējādi uzsvērojot tā praktisko pielietojamību reālās loģistikas operācijās. Atradumi uzsver kravas saistītās informācijas standartizēšanas nozīmi, lai veicinātu automatizēto NLP risinājumu plašāku pieņemšanu loģistikas nozarē.

Autors: Nikita Mickevičs

Vadītājs: Dmitry Pavlyuk

Līmenis: Profesionālais bakalauriāts

Gads: 2024

Darba valoda: Angļu


Izgūšanas-papildināšanas ģenerēšanas sistēmu uzlabošanas stratēģijas

Šis darbs sistemātiski pēta izgūšanas-papildināšanas ģenerēšanas sistēmu (RAG) sistēmu uzlabošanu lielo valodu modeļos, uzsverot izguves parametru optimizāciju un ģenerēšanas precizitāti. Tiek pētīta RAG sistēmu optimālās konfigurācijas, tostarp informācijas daļu lielumu un pārklāšanās procentus, top-k atlasi, vaicājumu transformācijas, dažādas izguves metodes, dažādus lielos valodu modeļus, proti, GPT-3.5-Turbo un GPT-4, atklājot, ka informācijas lielums visbiežāk ir 500 marķieri. piedāvā vislabāko veiktspēju. Vektoru meklēšana, izmantojot kosinusu līdzību, kļūst par visefektīvāko izguves metodi, ievērojami uzlabojot gan konteksta precizitāti, gan dažādu uzdevumu un zināšanu bāzu atsaukšanu. Eksperimentēšana CRUD-RAG ietvaros parāda tās pielietojamību dažādos uzdevumos, sākot no satura izveides līdz zināšanu pilnveidošanai. Atklājumi liecina, ka izguves iestatījumu uzlabojumi var ievērojami uzlabot RAG sistēmu veiktspēju, padarot tās efektīvākas un pielāgojamākas sarežģītiem informācijas sintēzes un izguves uzdevumiem. Šie rezultāti apstiprina sistemātisku uzlabojumu potenciālu, lai uzlabotu mākslīgā intelekta vadītus valodas modeļus praktiskos lietojumos, sniedzot nozīmīgu ieskatu un praktiskas pieejas RAG sistēmu izpētes ainavai.

Autors: Sigita Lapiņa

Vadītājs: Dmitry Pavlyuk

Līmenis: Maģistrs

Gads: 2024

Darba valoda: Angļu

Studiju programma: Datorzinātnes

Vairāk...

Table View
Text View