უკუპროპაგაციული მოდელი/ნეირონული ქსელის ზოგადი პრინციპი

ვიკიწიგნებიდან
უმარტივესი უკუპროპაგაციული მოდელი
უმარტივესი უკუპროპაგაციული მოდელი

ხელოვნური ნეირონული ქსელები, და მათ შორის უკუპროპოგაციული მოდელი, არის დამყარებული ჩვენს წარმოდგენაზე ტვინის უჯრედების შესახებ, როგორც ნეირონებზე, რომლებიც დაკავშირებულები არიან სინაპსეებით. ნეირონები აგენერირებენ ელექტრულ ან ქიმიურ სიგნალებს რომლებიც გადაეცემა სინაპსის მეშვეობით ახლომდებარე სხვა ნეირონებს. ამ მექანიზმის წყალობით ჩვენი ტვინი ასრულებს უზარმაზარ სამუშაოს, რომლის შესრულების დეტალები სურათი ჯერჯერობით უცნობია.

მსგავსად ბუნებრივი ქსელისა, უკუპროპაგაციულ მოდელში ვიყენებთ "ნეირონების ქსელს", რომლის კვანძებს წარმოადგენენ ნეირონები, ხოლო სინაპსეს როლს თამაშობს წახნაგები, რომლებიც აკავშირებს ამ ნეირონებს. ყოველ ნეირონს ამ მოდელში გააჩნია შემოსასვლელი და გასასვლელი. შემოსასვლელზე და გასასვლელზე ნეირონს შეიძლება დაუკავშიროთ ნებისმიერი რაოდენობა წახნაგებისა. თავის მხრივ წახნაგი ხასიათდება წონით, რომელსაც შემდგომ განხილვაში სიმბოლოთი ავღნიშნავთ. წახნაგის წონა შეესაბამება ბუნებრივ სინაპსეში დაჭიმულობას, რომელიც ცვლის სიგნალის გავრცელების მახასიათებლებს.

არქიტექტურა[რედაქტირება]

უკუპროპაგაციული მოდელი განათავსებს ნეირონებს შრეებად (იხ. სურათი). მწვანე ნეირონები წარმოადგენს შემომავალ შრეს. ყოველი მწვანე ნეირონი დაკავშირებულია შიდა შრის ყოველ ცისფერ ნეირონთან. თავის მხრივ შიდა შრის ყოველი ცისფერი ნეირონი დაკავშირებულია ყველა გარე შრის ყვითელ ნეირონთან. აგრეთვე შესაძლებელია რამოდენიმე შიდა შრის გამოყენება. თუმცა ორზე მეტი შიდა შრე ძალიან იშვიათად გამოიყენება.

როდესაც ჩვენ მოვდებთ სიგნალს შემოსავალზე ის გადაეცემა ჯერ შიდა შრის ნეირონებს და შემდეგ გამომავალ ნეირონებს.

სიგნალის გადაცემა[რედაქტირება]

სიგნალის გადაცემის მექანიზმის გასაგებად განვიხილოთ ნეირონი რომელშიც შემოდის წახნაგის გავლით სიგნალები . ჯამური შეწონილი სიგნალი ტოლია:

.

გამომავალი სიგნალი ნეირონზე იანგარიშება როგორც:

,

სადაც ფუნქციას ეწოდება შემომსაზღვრელი ან აქტივაციის ფუნქცია.

სწავლის რეჟიმი[რედაქტირება]

ვიდრე დავიწყებდეთ მის პრაქტიკაში გამოყენებას, უკუპროპაგაციული მოდელი მოითხოვს სწავლის ჩატარებას. სწავლის პროცედურას ატარებს ადამიანი, რომელიც მიაწვდის ქსელს რამოდენიმე შემომავალ სტრუქტურას და შესაბამის გამომავალ მონაცემებს.

მაგალითად, თუ ჩვენ გვინდა გამოვიყენოთ ნეირონული ქსელი ხელნაწერი ასოების ამოსაბეჭდათ, ჩვენ შეგვიძლია ვასწავლოთ ქსელს რაც შეიძლება მეტი ლათინური ასო "A"-ს ხელნაწერი ვარიანტი.

სწავლის პროცესი მდომარეობს ქსელის წახნაგების წონების ისე შერჩევაზე, რომ ყოველი მოწოდებული შემომავალი სტრუქტურა იძლეოდეს სასურველ შედეგს გამოსავალზე. ამ დროს ჩვენ ვკარგავთ კონტროლს იმაზე თუ რა ხდება ქსელის შიგნით. ქსელი წარმოადგენს წახნაგების წონების ქაოტურ ნაკრებს, რომლის კონკრეტული მნიშვნელობა ცნობილია, თუმცა ზოგადი ერთიანობა რთული მოსაძებნია.

გამოყენება[რედაქტირება]

სწავლის პროცესი ნეირონულ ქსელში შესაძლოა რამოდენიმე თვეც კი გაგრძელდეს. თუმცა ნეირონულ ქსელს აქვს ერთი დიდი უპირატესობა. კერძოდ კი ერთხელ ნასწავლი ქსელის კოპირება და გადატანა სხვა სისტემაში უკვე აღარ წარმოადგენს სირთულეს.