მთავარი,სიახლეები

რა უნდა გავაკეთოთ, რომ კომპიუტერმა ქართულად ლაპარაკი გაიგოს 

22.11.2022 • 1853
რა უნდა გავაკეთოთ, რომ კომპიუტერმა ქართულად ლაპარაკი გაიგოს 

ქართული მეტყველების ამომცნობი სრულყოფილი, გამართული პროგრამა არ არსებობს, რაც შესაბამისად იმას ნიშნავს, რომ სრულყოფილი, ხმოვანი აპლიკაციები, პროგრამები ქართულ ენაზე ჯერ ვერ შეიქმნება, ვერც ქართულ მეტყველებას ცნობს ხელოვნური ინტელექტი, ვერ გარდაქმნის ქართულ ტექსტად.

ქართული მეტყველების ამომცნობი ბაზები და მერე ამ ბაზებზე დაყრდნობით შექმნილი პროგრამები უმნიშვნელოვანესია ბევრი სხვადასხვა პროფესიის ადამიანისთვის. ჟურნალისტების, ფილოლოგების, სხვადასხვა სფეროს მკვლევრებისა და მეცნიერებისთვის. ასეთი ბაზით შეიძლება შეიქმნას ასევე  მრავალი სხვადასხვა დანიშნულების აპლიკაცია, პროგრამა ქართულ ენაზე.

პლატფორმაზე Common Voice  მოხალისეებს შეუძლიათ შეიტანონ წვლილი და ასწავლონ ხელოვნურ ინტელექტს ქართული ენა: მოასმენინონ ქართული წინადადებები, რის შემდეგაც ამ წინადადებების თითოეული სიტყვის ჩანაწერი გაჩნდება ქართულ ენაზე ქართული შრიფტით.

იმისთვის, რომ სამომავლოდ შეიქმნას ქართული მეტყველების ამომცნობი პროგრამები, საჭიროა Common Voice-ზე ქართულად მეტყველების ბაზა, მონაცემები შეგროვდეს. ქართულად საუბრის დაახლოებით 10 000- საათიანი მასალაა საჭირო, ქართული მეტყველების ამომცნობი პროგრამის შესაქმნელად.

თუკი ყოველდღე 1000 ადამიანი 45 წინადადებას „უკარნახებს“ Common Voice-ს, ქართულად საუბრის 10 000-საათიანი მასალა დაახლოებით 6 თვეში შეგროვდება.

ჩვენი წილი ქართული რომ ვასწავლოთ კომპიუტერს, ამისთვის საჭიროა შევიდეთ ვებგვერდზე commonvoice.mozilla.org/ka ,დავაჭიროთ წითელ ღილაკს „ჩაწერა“ და ჩავწეროთ წინადადებები. ერთ ჯერზე არაუმეტეს 10-15-წამიან წინადადებას იწერს პროგრამა. წინადადების დასრულების შემდეგ ხმას ვინახავთ და ვაჭერთ ღილაკს „მოსმენა“. პროგრამა გვეკითხება, არის თუ არა შექმნილი ჩვენი ხმოვანი ჩანაწერის შესაბამისი სიტყვა სწორად დაწერილი. თუ სწორია სიტყვების შესატყვისი სკრიპტი, ვაჭერთ ღილაკს „დიახ“, თუ არასწორია, ღილაკს – „არა“. ასე ვეხმარებით ხელოვნურ ინტელექტს, ისწავლოს ქართული.

Common Voice პლატფორმა Mozilla firefox-ის პროექტია და გარდა ქართული ენისა, ივსება მსოფლიოს სხვადასხვა ენის ბაზები სხვადასხვა ენაზე მოსაუბრე მოხალისეების მიერ. ქართულ ენაზე ამჯერად მხოლოდ 21-საათიანი მეტყველებაა ჩაწერილი, საჭიროა 10 000 საათი.

Common Voice-ზე ქართული მეტყველების ბაზას სხვა მოხალისეებთან ერთად რაზმიკ ბადალიანიც ავსებს. რაზმიკი აქტიური მოხალისეა, მართავს ფეისბუქჯგუფსაც სახელწოდებით Common Voice | ქართული ენა, სადაც მოხალისეებს რჩევებს და რეკომენდაციებს აძლევს რა როგორ მუშაობს პლატფორმაზე:

ეს მონაცემები ყველასთვის უფასოდაა ხელმისაწვდომი, პლატფორმაზე ყველას შეუძლია ჩამოწეროს უკვე ატვირთული ხმები და გამოიყენოს სხვადასხვა პროგრამისთვის, კვლევისთვის, რისთვისაც დასჭირდება.

„ახლა ქართულ ენაზე 21-საათიანი ჩანაწერი არსებობს, უკვე იყენებენ ამ მონაცემს, მაგრამ ცოტაა მასალა, ჩვენი მიზანია შევაგროვოთ 10 000-საათიანი ბაზა. სხვა ენებს ამ პლატფორმაზე გაცილებით დიდი ბაზები აქვთ.

10 000-საათიანი საუბარი საკმარისი იქნება, ენის მანქანური სწავლებით პროგრამამ ქართული მეტყველების ამოცნობა რომ შეძლოს, ანუ რასაც ჩვენ ზეპირად ვიტყვით ქართულად, ქართულ ტექსტად რომ აქციოს.

მე შემთხვევით გადავაწყდი ინტერნეტში  Mozilla-ს ამ პლატფორმას, დამაინტერესა და შევუერთდი ინიციატივას.

ჩემთვის, როგორც ყველა მოქალაქისთვის, ქართული ენა მნიშვნელოვანია და რაც მნიშვნელოვანია, ენა იქნება ეს თუ სხვა რამ, გინდა რომ განვითარდეს. ეს პლატფორმა აღმოჩნდა შესაძლებლობა, რომ ჩემი დამოკიდებულება გამოვხატო ქართული ენის მიმართ და მის პოპულარიზაციას შევუწყო ხელი.

პროექტში ჩართვა ქართული ენისთვის დიდი შესაძლებლობების მიცემას ნიშნავს. იმედი მაქვს, რომ ბევრს ექნება ამის სურვილი და გვეყოლება ბევრი მოხალისე, ვინც დაგვეხმარება, ვასწავლოთ ხელოვნურ ინტელექტს ქართული ენა, ეს ტექნოლოგიური განვითარების ხელშეწყობაცაა“, – ამბობს რაზმიკ ბადალიანი.

რაზმიკ ბადალიანი

რაზმიკი სახელმწიფო ენის დეპარტამენტის პროექტების მოხალისე და ორგანიზაცია Educare Georgia-ს წარმომადგენელია. ეს ორგანიზაცია არაერთი საგანმანათლებლო პროექტის ინიციატორია, მათ შორისაა charte.ge და ხანის აკადემიის ქართულენოვანი ვერსია.

Educare Georgia ამჯერად მუშაობს ინგლისური ენის ადვოკატირების პროექტზე – „რატომ ინგლისური“, რაც საქართველოში ინგლისური ენის სწავლებას შეუწყობს ხელს.

სამივე პროექტის მიზანი საქართველოში განათლებაზე ხელმისაწვდომობის გაზრდაა თანამედროვე ტექნოლოგიების გამოყენებით.

29 ნოემბერს, 12 საათზე, გაიმართება სახელმწიფო ენის დეპარტამენტის მოხალისეთა პროექტის პრეზენტაცია: „გააგონე კომპიუტერს ქართული ხმა“. შეხვედრაზე სახელმწიფო ენის დეპარტამენტის წარმომადგენლები ისაუბრებენ ორგანიზაციის მოხალისეთა პროგრამის შესახებ. პროგრამის პრეზენტაცია ივანე ჯავახიშვილის სახელობის თბილისის სახელმწიფო უნივერსიტეტში გაიმართება, I კორპუსის 212-ე აუდიტორიაში.

გადაბეჭდვის წესი


ასევე: