Турсунов Мухаммадсолих Саъдин ўғли

Турсунов Мухаммадсолих Саъдин ўғли

Турсунов Мухаммадсолих Саъдин ўғли

Ҳозирги кунда тилларни ўқитиш, тил устида турли хил статистик таҳлиллар олиш ва тадқиқ қилишда маълумотларни автоматлашитириш, катта ҳажмдаги маълумотлар билан ишлашга доир дастурий таъминотлар яратилмоқда. Шундай вазиятда тил корпусларини яратиш жуда муҳим ҳисобланади. Корпуслар кўплаб соҳаларда, шу жумладан, таржимашунослик, стилистика, грамматика ва луғат  яратиш каби соҳаларда кенг қўлланила бошлади. Тилни ўрганишда, мақсадли контекстларда, тил қандай ишлатилишини ўқувчи мустақил равишда тадқиқ этиши учун корпуслардан фойдаланишни, яъни тилни ўрганишга “маълумотлар бошқаруви” деб аталувчи ёндашувга асосланади. Ўрганувчилар тилни тадқиқ қилишда ўзларига керакли бўлган маълумотларни олиши учун корпус бошқарув менежери ва корпус бўйлаб қидирув тизимидан фойдаланиши зарур бўлади. Бунда, тил хусусиятларини тўлиқ билиши ва улар устида амаллар бажариш имконини беради. Маълумотларни қайта ишлаш ва натижаларни тушунарли тарзда тақдим этишга хизмат қилувчи дастурий воситаларсиз тил корпусининг бирон бир фойдаси йўқ.

Ушбу ишда ўзбек тилини ўрганиш ва тадқиқ қилишга, ўзбек тилидаги сўзлар ва ибораларни таҳлил қилишга ёрдам берувчи uzbekcorpora.uz тизими тавсифланган. Айни вақтда uzbekcorpora.uz тизими сўзлар ва матнларни таҳлил қилишда конкорданс (қидирув тизими), лемматайзер, токенайзер, разметкалаш ва частотали луғатлар тузишни ўз ичига олади. Бундан ташқари uzbekcorpora.uz тизими корпус тўғрисидаги маълумотларни, корпуснинг таркиби ва тузилишини, корпус статистикаси ва корпусдан фойдаланишни тақдим этади. Тизим фойдаланувчига тушунарли ва қулай бўладиган содда интерфейсга эга.