Оқу корпусын жасау және мектеп терминологиясын зерттеуді оңтайландыру

Оқу корпусын жасау және мектеп терминологиясын зерттеуді оңтайландыру
Мәселенің қойылуы. Қазіргі кезеңде лингвистикалық мәселелерді шешудің, мәтіндерді өңдеудің, зерттеудің жаңа дерекқоры – корпустық база әлемде ерекше мәнге ие. Ғалымдардың зерттеулерінде «Мәтіндік деректер массивтерін талдау мен өңдеудің корпустық технологиялары тілдік зерттеулерді, соның ішінде сараптамалық сипаттағы зерттеулерді ұйымдастырудың және жүргізудің жаңа тәсілі болып табылатыны» айтылып жүр [Милруд және т.б., 2012]. Корпустық технология көмегімен оқу материалдарын бағалаудың, талдаудың, жүйелеудің және зерттеудің сенімді әрі өнімді процедурасын жүзеге асыру үшін нақты бір зерттеу мәселесіне жауап бере алатындай мақсат көздеп, Оқулықтар немесе оқу құралдарының корпусын жасау қажеттігі туындайды. Осындай лингвистикалық корпусты ғылым тілінің мазмұнын зерттеу мен терминологияның түйткілді мәселелерін зерттеуде, жүйелеуге тың серпіліс беретін дүние ретінде қарауға болады. Бұл қазақстандық корпус тәжірибесінде әлі қолға алынбаған, алайда аса өзекті мәселе болып отыр.

Оқу/оқулықтар корпусы және оны қалыптастыру процедурасы

Оқу корпусын жасау үшін алдымен оның не екенін, оны құруға қандай факторлар әсер ететінін, нәтижесінде неге қол жеткізуге болады дегендерді болжап, мақсатты түрде қадам-қадаммен жұмыс жүргізу керек.

Тілді қолданудың табиғи жағдайларына, талаптарына жауап беретін, ауқымды, электронды түрде сақталатын мәтіндер жиынтығы ретінде корпус тілдік зерттеулердің қай түрін де нақты дерек негізінде талдауға ыңғайлы. Себебі корпустың тілдік толықтырылуы арнайы жүргізіледі, яғни мәтіндер таңдалып, іріктеліп, өңделіп енгізіледі. Мазмұндық жағынан әрқашан шынайы – тірі – табиғи негізділігімен ерекшеленеді.

Тілдік корпустар типологиялық жақтан түрлі болады. Тілдік корпустардың типологиясының ішінде педагогикалық және академиялық зерттеу корпустарының рөлі зор.

 Оқу корпустарының өзі терминологиялық тұрғыдан түрлі атауларға ие: оқу корпусы, педагогикалық корпус, оқулықтар корпусы, линнгвдидактикалық корпус, академиялық мәтіндер корпусы, т.с.с. Өз атауларына сай мазмұндық ерекшеліктері де болады.

Оқу  корпустары тілдік мәтіндерге негізделеді. Оқу процесіне қолдану үшін жасалады немесе оқу процесінде зерттеу жасауға қолданылады. База құрылымы оқулықтар, оқу құралдары, академиялық, ғылыми жазбалар, сабақ процесінде қолданылатын, жазылатын, айтылатын түрлі академиялық материалдарды жинақтайды.

Соның ішінде, оқу корпусы негізінен мазмұны оны әзірлеушілердің мақсатына байланысты ерекшеленіп, жасақталады: 1) белгілі бір жекелеген пәнді үйрету үшін жасалады, мәселен, тілдік пәндерді шет тілі ретінде үйретуге негізделуі мүмкін. Ондай корпустарға Ресейдегі Жоғары экономика мектебінде жасалып жатқан «Корпус русских учебных текстов» (КРУТ) [2] корпусын жатқызуға болады; 2) академиялық мақсатта жасалып, ғылыми мәтіндерді жинақтайды,  мысалы, Corpora of Academic Texts [3], Виллингтондағы Виктория университетіндегі «The Academic Corpus» [4],  т.б. корпустарды атауға болады; 3) Оқулықтар корпусы белгілі бір оқу процесіне арналған оқулықтарды жинақтап, түрлі зерттеулерге, білім беру ісіне пайдаланылады. Енді осындай корпустардың кейбірі жөнінде мәлімет бере кетсек,  «Корпус русских учебных текстов» (КРУТ) – бұл әртүрлі универсиеттердегі білім алушылар жазған орыс тіліндегі мәтіндер жинағы. Корпус 3 миллионнан аса сөзқолданысты құрайды. Мәтіндер белгіленімдік тұрғыдан метабелгіленім, морфологиялық белгіленім және қателерді белгілеумен қамтамасыз етілген. ООМК (КРУТ) – зерттеушілерге, оқытушылар мен студенттерге, сондай-ақ, орыс грамматикасы мәселелеріне, қазіргі орыс тілінің лексикасы, грамматикасындағы өзекті мәселелерді зерттеуге қызығушылығы бар көпшілікке арналған. Аталған ақпараттық-анықтамалық жүйеде қазақ тілді білім алушылардың билингв жағдайындағы тілін зерттеуге арналған қазақстандық орыс тілі мәтіндері де жинақталған. Бұл контрастивтік лингвистиканың корпустық зерттелуіне мүмкіндік беретін база деп те бағаланады.

Украинадағы Академиялық мәтіндер корпусында академиялық журналдарда жарияланған ғылыми мақалалар, очерктер, эсселер, конференция материалдар, ғылыми кітаптар, білім алушылардың диссертациялары, т.б. жинақталған. 

CLARIN ERIC инфрақұрылымы 24 түрлі академиялық мәтіндерден тұрады. Оның 2-еуі көп тілді, 22-сі бір тілді. 11 тілдегі ғылыми мәтін жинақталған: чех, ағылшын, эстон, фин, француз, неміс, грек, орыс, словен, испан, швед. 15-тен астам ғылыми сала мәтіндеріне қолжетімдік: лингвистика, информатика, экономика, медицина т.б.

Виллингтондағы Виктория университетіндегі «Академиялық корпусы» университеттің 4 факультетіндегі мамандықтар бойынша әртүрлі академиялық пәндердің қайсысында қандай сөз жиілікте қолданылтынын айқындау мақсатында жасалған. Басқа да зерттеулерге қолайлы.

Қазақ тілінің мектеп оқулықтары корпусын жасау не үшін қажет дегенге жауап біреу: қазіргі кезеңдегі қазақша білім беру мазмұнының әлеуетін салыстырмалы зерделеуге және оқушылардың академиялық әлеуетін қалыптастыруға ықпал ететін тілдік мәтіндердің ортақ электронды базасын қолжетімді ете отырып, түрлі зерттеулерге жол ашу.

Бұл не береді?

- Біріншіден, оқу корпусы, дәлірек айтқанда оқулықтар корпусы түрлі жылдардағы әртүрлі баспаның, алуан авторлықтағы оқулықтарының білім сапасының мемлекет тарапынан бекітілген стандартарға сай құрылған мазмұнын салыстырмалы зерттеудің алаңы бола алады; - Екіншіден,  Оқулықтарда берілген білім мазмұнын, мектептегі әр сыныптарға шақталған пәндік нормалар ауқымын, авторлардың тәжірибесін, т.б. сараптауды, зерттеуді оңайлатады; - Үшіншіден, түрлі қырынан сүзгіленген статистикалық мәліметтер алынады; - Төртіншіден, пәндік терминологияның  қалыптасуын, дифинициясының берілуін, ғылым тілін оқушылардың меңгеру динамикасын да талдауға, түрлі нормадан ауытқушылықтарды анықтауға, берілген білім-ғылымның функционалдық тиімділігін айқындау бағытындағы ізденістер жасауға да пайдалы.

Бұдан басқа да нәтижелерге қол жеткізуге болады: әр пән бойынша жиілік сөздіктер шығару, мектепте 11 жыл білім алу шегінде және әр пәннен, сондай-ақ, толықтай барша пәндер жиынтығында оқушы меңгеретін сөзқолданыстардың, терминдердің, тақырыптардың, авторлардың, формулалардың, т.б. электронды сөздігі, анықтағышы, т.б.

Ол үшін ең алдымен, қазіргі қолданыстағы мектеп оқулықтарының электронды базасын мемлекет тапсырысы негізінде жинақтап, материалдарды корпусқа сәйкес аннотациялап, корпус сайтын қажетті параметрлерде интерфейстерін, іздеу функцияларын, т.б. ойластырып, жасақтап, лингвистикалық талдау алгоритмдерін, анализаторларын, т.с.с. әзірлеп жұмыс істеу мүмкіндігі бар. Оған мемлекет қолдау көрсетуі маңызды.

Қорыта айтқанда, оқулық корпустары материалдарын қолдануға лингвистикалық сараптама жүргізудің әлемдік тәжірибесіне сүйенсек, Оқулықтар корпусын қалыптастыру әрі әдіс, әрі база ретінде тиімді. Корпустық әдісті дұрыс қолданған кезде алынатын нәтижелердің объективтілігі артуына, лингвистердің жұмысын да жеңілдетуге септігі бар.

 

Пайдаланылған әдебиеттер мен дереккөздер:

 

1. Мильруд Р.П., Карамнов А.С. Компетентность учителя иностранного языка// Иностранные языки в школе. – 2012. - №1. – С.11-17.

2. Корпус русских учебных текстов (КРУТ)//http://web-corpora.net/CoRST/search/index.php?interface_language=ru

3. Corpora of Academic Text//https://www.clarin.eu/resource-families/corpora-academic-texts

4. The Academic Corpus // https://www.wgtn.ac.nz/lals/resources/academicwordlist/information/corpus