Details

ANOTĀCIJAS

Šis darbs sistemātiski pēta izgūšanas-papildināšanas ģenerēšanas sistēmu (RAG) sistēmu uzlabošanu lielo valodu modeļos, uzsverot izguves parametru optimizāciju un ģenerēšanas precizitāti. Tiek pētīta RAG sistēmu optimālās konfigurācijas, tostarp informācijas daļu lielumu un pārklāšanās procentus, top-k atlasi, vaicājumu transformācijas, dažādas izguves metodes, dažādus lielos valodu modeļus, proti, GPT-3.5-Turbo un GPT-4, atklājot, ka informācijas lielums visbiežāk ir 500 marķieri. piedāvā vislabāko veiktspēju. Vektoru meklēšana, izmantojot kosinusu līdzību, kļūst par visefektīvāko izguves metodi, ievērojami uzlabojot gan konteksta precizitāti, gan dažādu uzdevumu un zināšanu bāzu atsaukšanu. Eksperimentēšana CRUD-RAG ietvaros parāda tās pielietojamību dažādos uzdevumos, sākot no satura izveides līdz zināšanu pilnveidošanai. Atklājumi liecina, ka izguves iestatījumu uzlabojumi var ievērojami uzlabot RAG sistēmu veiktspēju, padarot tās efektīvākas un pielāgojamākas sarežģītiem informācijas sintēzes un izguves uzdevumiem. Šie rezultāti apstiprina sistemātisku uzlabojumu potenciālu, lai uzlabotu mākslīgā intelekta vadītus valodas modeļus praktiskos lietojumos, sniedzot nozīmīgu ieskatu un praktiskas pieejas RAG sistēmu izpētes ainavai.

Autors: Sigita Lapiņa
Līmenis: Maģistrs
Gads: 2024
Darba valoda: Angļu
Vadītājs: Dr. sc. ing., Dmitry Pavlyuk
Fakultāte: Inženierzinātņu fakultāte
Studiju programma: Datorzinātnes

Izgūšanas-papildināšanas ģenerēšanas sistēmu uzlabošanas stratēģijas

ANOTĀCIJAS

ATSLĒGVĀRDI