ტექსტის ანალიზი

ახალი და თანამედროვე ქართული ენის ქვეკორპუსი მოიცავს ლინგვისტურად ანოტირებულ ტექსტებს 1832 წლიდან 2012 წლამდე. ტექსტების ლინგვისტური ანოტირება განხორციელდა თანამედროვე ქართული ენის მორფოლოგიური ანალიზატორის გამოყენებით, რომელიც შეიქმნა შოთა რუსთაველის ეროვნული სამეცნიერო ფონდისა და ილიას უნივერსიტეტის ერთობლივი პროექტის ფარგლებში. ამ ეტაპზე მუშავდება ლინგვისტური და ტექნოლოგიური სტანდარტები ძველი და საშუალი ქართული ენის მოდელირებისთვის. ძველი და საშუალი ქართული ენის ქვეკორპუსები აგებულია, ერთი მხრივ, სხვა ენებთან და კულტურებთან ქართულის ურთიერთობისა (ბერძნული, სირიული, ქრისტიანული არაბული, სომხური) და, მეორე მხრივ, ქართული სამწერლობო-მთარგმნელობითი სკოლების (წინაათონური, ათონური, ანტიოქიური, ქართული ელინოფილური და ა.შ.)