Keynote Speakers

Азизов Улуғбек Ботирович

Ўзбекистон давлат жаҳон тиллари университети ректори, cоциология фанлари бўйича фалсафа доктори, PhD
Уважаемые коллеги, гости, участники Международной научно-практической онлайн-конференции! Тематика конференции органично вытекает из насущных проблем сегодняшней жизни. В результате бурного  развития информационных технологий появляются и развиваются технологии совершенно нового поколения.  Оно основывается на искусственном интеллекте. А интеллект, как мы с вами знаем, непосредственно связан с речью, языком. Задача компьютерной лингвистики заключается в математическом моделировании  лингвистических  явлений  и на их основе составлении компьютерных программ и приложений. К направлениям компьютерной лингвистики можно отнести: 1) обработку естественного языка; 2) оптическое распознавание символов; 3) автоматическое распознавание речи; 4) автоматический синтез речи. Прикладной характер компьютерной лингвистики на сегодняшнем этапе, и особенно у нас в республике, трудно переоценить. Нужно прямо сказать - в этом плане мы отстаём. Да и само понятие «компьютерной лингвистики», его цели и задачи понимаются и трактуются среди наших лингвистов не всегда в свете современных представлений. В этом и заключается основная идея данной конференции: дать возможность встретиться, высказаться, выслушать друг-друга и лингвистам, и математикам, и программистам, и кибернетикам всех стран. Узбекский государственный университет в этом плане проводит большую, системную работу. Примером этого служит открытие в нашем вузе совместной с Адыгейским государственным университетом образовательной программы по компьютерной лингвистике. Эта программа функционирует уже второй год. С Японскими коллегами открыт в нашем университете «Цифровой университет», кстати, тоже по компьютерной лингвистике. Планируем открыть в этом году новую образовательную программу с Республикой Корея по компьютерным играм. Как видим, мы отходим от традиционного представления нашего вуза как чисто гуманитарного, а интегрируем свою деятельность с современными информационными технологиями, другими направлениями. Есть уверенность, что эта работа обязательно даст свои плоды. В заключении своего выступления хотелось бы пожелать, чтобы  эта Международная конференция была периодической, а география её участников расширялась. Желаю конференции плодотворной работы, а всем её участникам здоровья и хорошего настроения.

Алиев Мухамаджон Чориевич

Конференция модератори, Замонавий ахборот технологиялари кафедра мудири, доцент, ЎзДЖТУ
Уважаемые коллеги, друзья!   Позвольте приветствовать всех вас на Международной научно-практической онлайн-конференции “Компьютерная лингвистика: проблемы и решения”. Данная конференция организована кафедрой Современных информационных технологий Узбекского государственного университета мировых языков. Разрешите выразить благодарность соорганизаторам конференции – Военному институту информационно-коммуникационных технологий и связи Министерства обороны Республики Узбекистан, Республиканскому научно-практическому центру развития инновационных методик обучения иностранным языкам при УзГУМЯ, а также Электронному журналу и интернет-порталу УзГУМЯ «Иностранные языки в Узбекистане». Без них эта конференция была бы невозможной. На эту первую конференцию сдали тезисы своих выступлений более 100 ученых и преподавателей из 6 стран мира: из Республики Узбекистан, Российской Федерации, Италии, Германии, Японии, Кореи. Выступления звучат на узбекском, русском, английском, немецком, японском, корейском языках. Уверен, что на следующих конференциях участников будет еще больше. Ведь тема этой конференции, в эпоху интеллектуализации информационных технологий, звучит особенно актуально. Отрадно, что и в Узбекистане в этом направлении ведутся существенные работы - создан и расширяется корпус узбекского языка, ведется работа по совершенствованию национальных корпус-менеджеров, создаются синтезаторы и анализаторы узбекской речи. Вот поэтому опыт и достижения ученых других стран является для узбекистанских ученых очень важным. Этому направлению в Узбекистане уделяется большое государственное значение. Так, согласно Указу Президента Республики Узбекистан от 20.10.2020 г. № УП-6084 «О мерах по дальнейшему развитию узбекского языка и совершенствованию языковой политики в стране» предписано создание направления «Компьютерная лингвистика» и «Прикладная филология» в направлениях образования филологического профиля высших образовательных учреждений. Миссия ежегодной Международной научно-практической онлайн-конференции “Компьютерная лингвистика: проблемы и решения” заключается не только в том, чтобы ученые всего мира делились своими идеями, достижениями, но и в том, чтобы предоставить площадку, чтобы ученые и практики всего мира могли объединять свои усилия в рамках определенных проектов. Для этого в Узбекистане есть все возможности. Все тексты тезисов после редакции будут размещены на платформе www.conference.fledu.uz. Запись конференции размещена по ссылке https://youtu.be/7TX1cBM54dY.

Юсупов Баходир Кароматович

Ахборот-коммуникация технологиялари ва алоқа ҳарбий институти илмий ва ўқув ишлари бўйича бошлиқ ўринбосари ёрдамчиси, АТ кафедраси бошлиғи
Ассалому алайкум ҳурматли утозлар, профессор-ўқитувчилар ва меҳмонлар. Барчангиз билан Компьютер лингвистикаси, Муаммолар ва уларни ечиш йўллари” мавзусидаги ҳалқаро илмий–амалий конференцияда кўришиб турганимдан ҳурсандман. Ўзбекистон давлат жаҳон тиллари университети ҳамда МВ Ахборот коммуникация-технологиялари ва алоқа ҳарбий институти ўртасида 2020 йилда икки томонлама йўл ҳаритаси имзоланган эди. Йўл ҳаритасига асосан ҳозирги кунга қадар Ўзбекистон давлат жаҳон тиллари университети ва МВ Ахборот коммуникация-технологиялари ва алоқа ҳарбий институти ўртасида бир қанча салмоқли ишлар амалга оширилиб келмоқда. Ушбу ҳамкорликда ташкил этилган “Компьютер лингвистикаси, Муаммолар ва уларни ечиш йўллари” мавзусидаги ҳалқаро илмий–амалий конференция ҳам амалга амалга оширилаётган ишларнинг ёрқин наъмунаси деб айтсак муболаға бўлмайди. Ҳозирги замонавий компьютер лингвистикасининг асосий мақсади лингвистик масалаларни ечишнинг компьютер дастурларини ишлаб чиқишга қаратилганлиги ушбу ҳалқаро илмий–амалий конференцияда кўтарилган мавзунинг долзарблигини кўрсатиб беради. Компьютер лингвистикасининг асосий вазифалари эса тилларни ўқитишда билимларни текшириш, матнларни таҳрирлаш ва машина таржимаси дастурларини ишлаб чиқишдан иборатдир. Ушбу Ўзбекистон давлат жаҳон тиллари университетида ташкил этилган ҳалқаро илмий–амалий конференция юртимизда ҳам компьютер лингвистикаси сохасида амалга оширилаётган илмий тадқиқот ишларини янада ривожлантиришга ўз ҳиссасини қўшади деб ўйлайман. МВ Ахборот коммуникация-технологиялари ва алоқа ҳарбий институти ва Ўзбекистон давлат жаҳон тиллари университети ўртасидаги ўзаро ҳамкорлик бундан кийи ҳам ҳар томонлама ривожланиб боришига ишонаман. Барчангизни яна бир бора Компьютер лингвистикаси, Муаммолар ва уларни ечиш йўллари” мавзусидаги ҳалқаро илмий–амалий конференцияга хуш келибсиз. Эътиборингиз учун рахмат!

Simon Kretschmer

DAAD Lecturer, National University of Uzbekistan.
I am honored and happy to be part of this promising scientific conference. As teacher of German as Foreign Language, I am very much interested in discovering related fields. As I understand Computational Linguistics (CL) is not just the combination of the two academic fields of linguistics and computer science. CL consists of aspects of several disciplines besides those two, namely mathematics, philosophy, cognitive psychology and of course philology. This interdisciplinary approach enables CL to find solutions at the interface of the two most vital spheres of modern societies: communication and IT. CL’s core interest is to enable machines to understand natural languages as uttered by humans. Since machines communicate in formal languages, they cannot understand natural languages in their full complexity and ambiguity. The further development regarding this task will bring huge benefit not only for the interaction between humans and machines, but also for the interaction between machines, speaking of artificial intelligence. Huge efforts have already been made regarding for example the sphere of voice recognition and machine translation as we all know. But we also know that there is still much potential to improve the existing technics. This is why the chances for graduates of this field should be very promising. CL can of course also be studied in Germany, where about 30 universities offer study programmes in German or English language, so I would be happy to see some of your students applying for a master in CL in Germany. I wish you and all of us a good proceeding of this conference.

Minhee Lee

Director of Department for International affairs, Joongbu University, PhD, South Korea

Paoli Legler Marko

Italian language teacher, Uzbekistan state world languages university languages university
Im ersten Teil meines Vortrages erkläre ich theoretisch was im Gehirn vorgeht, wenn wir neues Sprachmaterial erwerben, wie man am besten dessen Speicherung ermöglicht und warum digitale Medien sich dazu als geeignete Instrumente erweisen. Dann gebe ich ein paar Hinweise und Strategien über die praktische Einsetzung von Plattformen, Video-Chat-Tools und digitalen Anwendungen. Dabei werden unterschiedliche Stufen der Interaktivität von digitalen Medien gelistet und besonderer Wert auf den konstruktiven Einsatz gelegt, nach dem die Lernenden aktiv werden sollen und selbst Produkte mit den digitalen Mitteln herstellen, die ihnen der Lehrer zur Verfügung stellt. Damit Lernende digital kompetent werden, soll der Schwerpunk in allen Aktivitäten auf den sozialen Austausch, auf die Binnendifferenzierug der Lernenden, auf die Kreativität gesetzt werden. Ein geeignetes digitales Lehrwerk, das multikodal Sprachinhalte per Sharescreening, (auch analog mit Beamer) visualisiert und Lernende, die begeistert sind, die neuesten Apps einsetzten zu können wären wichtige Voraussetzungen zur Gestaltung eines interaktiven Unterrichtes.

Бобомуродов Озодбек Жўраевич

Тошкент ахборот технологиялари университети, ахборот технологияларининг дастурий таъминоти кафедраси мудири, техника фанлари доктори
Ҳозирги кунда маълумотлар алмашинувининг асосий қисми глобал тармоқ Интернетда макон топган. Матнли кўринишдаги маълумотларни таҳлил қилиш мақсадида бир қатор ишланмалар таклиф этилган. Бу борада кўпгина тадқиқотчилар томонидан иш олиб борилмоқда. Бу тадқиқотлар мазкур соҳанинг турли тор доирадаги йўналишларини ўзида мужассамлаштирган. Бу тор доиралар анти-спамлардан тортиб, кундалик истемол қилинадиган маълумот туркумларини таснифлашларни қамраб олади. Матнли маълумотларни таснифлашда бир қанча математик аппаратдан фойдаланилади. Буларга анъанавий усуллар билан бир қаторда табиий, норавшан, квант ва бошқа бир қанча алгоритмларни киритиш мумкин. Улар масала кўринишига қараб иш самарадорлиги турлича бўлиши кузатилган. Мазкур мақолада матнли ҳужжатларни таснифлаш учун чуқур ўқитишга асосланган таснифлаш усули тадқиқ қилинган ва ёндашув ишлаб чиқилган, уларнинг асосида гибрид кўринишдаги алгоритм таклиф этилган. Мазкур математик аппарат асосида ишлаб чиқилган дастурий восита ёрдамида модел ва амалий масалаларда тажрибавий тадқиқотлар ўтказилган. Олинган натижалар 93% аниқликни ташкил этган.

Елена Викторовна Ягунова

Профессор кафедры информационных систем в исскусстве и гуманитарных науках, доктор филологических наук, Санкт-Петербургский государственный университет. Россия
Ни один язык не является «чистым» представителем того или иного типологического класса. Во всех языках можно обнаружить черты агглютинации, флексии, изоляции и т. д., сочетающиеся  в разных «пропорциях» в каждом конкретном национальном языке? Именно это вызывает к жизни квантитативный подход в типологии. Разные “пропорции” характеризуют не только национальный язык в целом, но и функциональные особенности стилей, типов, жанров в рамках соответствующих национальных языков. Что такое стиль, жанр, тип в типологическом аспекте - это неоднозначный, но обязательный для решения вопрос. Набор типологических индексов зависит от задач и материала исследования. Необходимо создавать и использовать не столько репрезентативные корпуса, сколько однородные по заданному набору параметров, главным из которых является единство функционального стиля текстов корпуса. В докладе я расскажу о двух проектах под моим руководством: на материале жанровых корпусов турецкого, японского, венгерского языков (разных агглютинативных языков) и на материале художественных текстов русского языка (жанры, типы, возрастные страты) (ср. Д.Патин, А.Иванец и др.). Кроме того, кратко расскажу о текущих проектах под руководством В. Касевича и А. Аврутиной, а также о возможностях развития такого рода исследований на примере моих авторских магистерских курсов Восточного факультета СПбГУ.

Щеголева Людмила Владимировна

Профессор кафедры прикладной математики и кибернетики, доктор технических наук, Петрозаводский ГУ. Россия
Цифровые ассистенты набирают популярность в связи с развитием информационных технологий, проникновением их во все сферы человеческой активности, а также в связи с развитием методов обработки естественного языка. Коллектив Центра искусственного интеллекта Петрозаводского государственного университета разрабатывает цифрового помощника для преподавателей иностранных языков и студентов, изучающих иностранные языки. Система опирается на корпус текстов, представляющих собой эссе, написанные студентами на заданную тему на иностранном языке. Функционал системы включает личный кабинет преподавателя, личный кабинет студента и личный кабинет исследователя. Личный кабинет преподавателя позволяет организовать выдачу заданий, проверку выполненных работ, получение статистики по успеваемости студентов. Личный кабинет студента позволяет просмотреть задания и отправить преподавателю результат. Задания предполагаются нескольких типов: написание эссе, прохождение тестирования, поиск ошибок в текстах. Тесты будут генерироваться автоматически в зависимости от ошибок, допущенных студентом при написании эссе. При генерации тестов будут использованы тексты из внутреннего хранилища системы, а также из внешних корпусов текстов. Личный кабинет исследователя предназначен для работы с коллекцией собранных текстов и предоставляет возможности поиска по словам, тегам, получения статистической информации о словах, тегах, коллокациях и т.п.    

Теплоухов Семён Васильевич

Старший преподаватель кафедры АСОИУ, кандидат технических наук, Адыгейский ГУ. Россия
В статье рассмотрены основные виды моделей машинного обучения для обработки естественного языка (Natural language processing, NLP). Исследованы аспекты применения подхода градиентного бустинга для работы с категориальными текстовыми признаками выборки. Представлен алгоритм обработки входных текстов на естественном языке. В рамках данного алгоритма выделены основные этапы: синтаксический разбор текста, его анализ и генерация. Для каждого этапа алгоритма приведены основные используемые алгоритмы и программные средства. Рассмотрен алгоритм Word2vec для анализа семантики языков, реализуемый на основе искусственных нейронных сетей, предназначенных для получения векторных представлений слов на естественном языке. Вычисленное векторное представление слов используется в нейронных сетях с долгой краткосрочной памятью (Long short-term memory, LSTM) для эффективной обработки длинных предложений или документов. Кратко приведены текущее состояние современных исследований в области обработка текстов на естественных языках с применением архитектуры глубоких нейронных сетей - трансформер (Transformer). Ключевые слова: обработка естественного языка, Natural language processing, нейронные сети, Word2vec, долгая краткосрочная память, LSTM.

Абдурахмонова Нилуфар

Алишер Навоий номидаги Тошкент давлат ўзбек тили ва адабиёти университети доценти, PhD
The paper is devoted to the structure and its linguistic annotation for first building Uzbek Corpus. Linguistic annotation, metadata and corpus manager as formalfunctional model of the corpus are important for usage for many purposes. The fact that the platform allows users to address language and literature issues, use it online. The Uzbek corpus based on structural and sub corpus models, which partially represented in this paper, is going on process to develop Uzbek language technology.

Эргашева Гули Исмоил қизи

Ўзбекистон давлат жаҳон тиллари университети инглиз тили назарий фанлар кафедраси доценти, филология фанлари доктори
Амалий лингвистикада фанлараро аспектда тилга оид масалаларни кенг миқёсда тадқиқ этиб, уларнинг шахc ва жамият ҳаётидаги ўрнини белгилашга қаратилган фанларнинг ижтимоий потенциалини ўрганиш муҳим аҳамият касб этади. Бугунги кунда таржимани, хусусан автоматлаштирилган таржимани амалий тилшунослик объекти сифатида тадқиқ этилиши замонавий тилшуносликнинг долзарб муаммоларидан бири ҳисобланади. Зеро, профессионал таржимонларлар эҳтиёжини қондириш учун машина таржимасидан фойдаланиш анча қўл келиши табиий. Ушбу мақолада Америка амалий тилшунослик ассоциациясининг фаолияти, шунингдек машина таржимасининг қисқача тарихи, унинг лингвистик муаммолари ҳақида сўз бориб, контекстуал таржима дастурларини яратишнинг истиқболли йўналишлари белгиланган.

Норов Абдисаит Муродович

Қарши давлат университети информатика ўқитиш методикаси кафедраси доценти, PhD
Маълумки, бугунги кунда бутун дунёда табиий тилни автоматик қайта ишлашнинг дастлабки босқичи сифатида фонетик ҳодисалар, фонологик системаларнинг просодик элементлари билан боғлиқ моделлаштириш ишлари тадқиқот майдонида марказий ўринлардан бирини эгалламоқда. Айниқса матн-нутқ ёки нутқ-матн генераторларини моделлаштириш орқали биз ўз тилимизни машинавий ўқитишда, жамиятимиздаги имконияти чекланган кишилар учун интерфаол дастурларни яратишда, транскрибация дастурларини ишлаб чиқишда жуда катта имкониятлар эшигини очишимиз мумкин. Тил ва нутқни илмий жиҳатдан қайта ишлаш масалалари билан илгари информатика, лингвистика, психология, математика, физика ва бошқа фанлар алоҳида-алоҳида шуғулланган бўлса, XX асрга келиб, компьютер лингвистикаси уларни битта илмий йўналишга бирлаштирди. Ўзбек тилининг фонологик тизими ва унинг турли элементларини, хусусан, тилнинг транскрипция белгиларини компьютерли моделлаштириш масаласи ўзбек компьютер лингвистикасининг илмий тадқиқот доирасидаги энг марказий ўринлардан бирини эгаллайди. Табиий тилнинг транскрипция белгиларини моделлаштириш ушбу тилдаги сўз, гап, нутқ каби турли лисоний объектларнинг фонетик таҳлилини автоматик тарзда амалга оширишга имкон яратади. Мақолада ўзбек фонетикасига оид лингвистик объектлар учун лингвистик моделларни саралаш, улар асосида лингво-математик моделларни яратиш ва лингвистик ҳодисаларни компьютерли моделлаштириш тамойиллари ҳақида сўз боради.

Турсунов Мухаммадсолих Саъдин ўғли

Тошкент ахборот технологиялари университети Самарқанд филиали дастурий инжиниринг кафедраси ассистенти
Ҳозирги кунда тилларни ўқитиш, тил устида турли хил статистик таҳлиллар олиш ва тадқиқ қилишда маълумотларни автоматлашитириш, катта ҳажмдаги маълумотлар билан ишлашга доир дастурий таъминотлар яратилмоқда. Шундай вазиятда тил корпусларини яратиш жуда муҳим ҳисобланади. Корпуслар кўплаб соҳаларда, шу жумладан, таржимашунослик, стилистика, грамматика ва луғат  яратиш каби соҳаларда кенг қўлланила бошлади. Тилни ўрганишда, мақсадли контекстларда, тил қандай ишлатилишини ўқувчи мустақил равишда тадқиқ этиши учун корпуслардан фойдаланишни, яъни тилни ўрганишга “маълумотлар бошқаруви” деб аталувчи ёндашувга асосланади. Ўрганувчилар тилни тадқиқ қилишда ўзларига керакли бўлган маълумотларни олиши учун корпус бошқарув менежери ва корпус бўйлаб қидирув тизимидан фойдаланиши зарур бўлади. Бунда, тил хусусиятларини тўлиқ билиши ва улар устида амаллар бажариш имконини беради. Маълумотларни қайта ишлаш ва натижаларни тушунарли тарзда тақдим этишга хизмат қилувчи дастурий воситаларсиз тил корпусининг бирон бир фойдаси йўқ. Ушбу ишда ўзбек тилини ўрганиш ва тадқиқ қилишга, ўзбек тилидаги сўзлар ва ибораларни таҳлил қилишга ёрдам берувчи uzbekcorpora.uz тизими тавсифланган. Айни вақтда uzbekcorpora.uz тизими сўзлар ва матнларни таҳлил қилишда конкорданс (қидирув тизими), лемматайзер, токенайзер, разметкалаш ва частотали луғатлар тузишни ўз ичига олади. Бундан ташқари uzbekcorpora.uz тизими корпус тўғрисидаги маълумотларни, корпуснинг таркиби ва тузилишини, корпус статистикаси ва корпусдан фойдаланишни тақдим этади. Тизим фойдаланувчига тушунарли ва қулай бўладиган содда интерфейсга эга.

Leave a Reply