Проблема формирования тезауруса при использовании Интернет-ресурсов
Заказать уникальный реферат- 10 10 страниц
- 3 + 3 источника
- Добавлена 06.06.2020
- Содержание
- Часть работы
- Список литературы
- Вопросы/Ответы
С этой целью необходимо спроектировать структуру тезауруса таким образом, чтобы можно было легко настаивать тезаурус под любую область. Например, не ограничивать набор возможных отношений, выбирать универсальные критерии для отбора терминов, и т.д. Попытки улучшить качество работы программы неизбежно приводят к тому, что затраты на его улучшения превышают затраты на исправление таких ошибок вручную. Для решения данной задачи реализованный инструмент должен на первом этапе анализа текста выделять термины, а затем, основываясь на анализе выделенных терминов, осуществлять поиск отношений между ними. Как отмечает Н.С. Лагутина,полностью автоматическое построение тезауруса является на текущий момент невозможным. Однако было предпринято довольно много успешных попыток частично автоматизировать данный процесс. Методы искусственного интеллекта для автоматизированного построения тезаурусов можно условно разделить на две основные группы: статистические методы и методы, использующие лингвистические подходы.Самые распространенные лингвистические методы автоматизации построения тезаурусов основываются на правилах с использованием шаблонов. Подход заключается в генерации правил, на основе которых будут извлекаться знания из текста. В данном подходе активно используются все уровни анализа естественного языка: морфология, синтаксис и семантика. Синтаксические шаблоны сборки именных групп используются при извлечении терминов-словосочетаний. Одним из эффективных методов извлечения семантических отношений является метод лексических шаблонов.Исследования Марти Хёрст показали, что данный метод показывает «достаточно адекватный» результат для идентификации родовидовых отношений.Связи между словами являются материалом для построения лексико-семантических сетей для извлечения знаний, для определения семантической близости слов. Формализованность тезауруса позволяет легко автоматизировать его применение. Многие исследователи подчеркивают важность построения электронных тезаурусов и перспективу их использования в автоматических системах обработки текстов.Несмотря на то, что при изучении сущности знания в наше время не- редко проводятся параллели с компьютерной сферой, для того, чтобы понять принципы бытия знания в естественном языке, не меньшее значение имеет разработка таких тезаурусов, в котором в явном виде были представлены языковые знания носителя естественного языка. Одним из наиболее очевидных путей создания такого словесного ресурса является создание ассоциативных словарей.Проведенный в реферате анализ понятий и проблем формирования тезауруса при использовании Интернет-ресурсовиллюстрирует в полной мере сложности формирования тезаурусу при использовании Интернет-ресурсов с целью изучения иностранного языка. Представителей разных подходов к определению тезауруса и путей решения проблем его формирования, объединяет то, что, по их мнению, развитие тезауруса является неотъемлемой частью успешного обучения и профессионального начала. В заключение стоит отметить, что реферат имеет теоретический характер и решает поставленные в начале задачи:были рассмотрены разные взгляды на определение понятия «тезаурус»;были выявлены и проанализированы основные проблемы формирования тезауруса при использовании Интернет-ресурсов;были представлены отдельные пути решения проблем построения тезауруса. Список использованной литературы:1.Осокина, С.А. Основания лингвистической теории тезауруса / С.А. Осокина // Диссертация на соискание ученой степени доктора филологических наук. – 2015. – 467 с.2. Бименова, Ж.Б. Подход к построению русско-казахского тезауруса по информатике / Ж.Б. Бименова, Р.А. Джумамуратов, Е.А. Сидорова // Сборник статей Новосибирского государственного университета. – 2016. – № 3. – С. 53-62.3. Лагутина, Н.С.Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке / Н.С. Лагутина, К.В. Лагутина и др. // Моделирование и анализ информационных систем. Т. 25. – 2018. – № 4. –С. 435–458.
2. Бименова, Ж.Б. Подход к построению русско-казахского тезауруса по информатике / Ж.Б. Бименова, Р.А. Джумамуратов, Е.А. Сидорова // Сборник статей Новосибирского государственного университета. – 2016. – № 3. – С. 53-62.
3. Лагутина, Н.С. Русскоязычные тезаурусы: автоматизированное построение и применение в задачах обработки текстов на естественном языке / Н.С. Лагутина, К.В. Лагутина и др. // Моделирование и анализ информационных систем. Т. 25. – 2018. – № 4. – С. 435–458.
Вопрос-ответ:
Зачем нужен тезаурус при использовании Интернет ресурсов?
Тезаурус используется для организации информации и установления связей между терминами.
Как нужно спроектировать структуру тезауруса для его легкой настройки под любую область?
Структура тезауруса должна быть гибкой и позволять выбирать отношения и критерии отбора терминов в зависимости от области.
Что происходит при попытках улучшить качество работы программы?
Попытки улучшить качество работы программы приводят к увеличению затрат на ее улучшение, которые могут превышать затраты на ручное исправление ошибок.
Какие проблемы возникают при использовании Интернет ресурсов для формирования тезауруса?
При использовании Интернет ресурсов могут возникать проблемы с недостоверностью и неоднозначностью информации, а также с поддержкой разных языков и специализированных областей знаний.
Какие требования предъявляются к структуре тезауруса?
Структура тезауруса должна быть легко расширяемой, поддерживать разные типы отношений между терминами, учитывать специфику области знаний и иметь возможность быстрого поиска и обработки данных.
Какая проблема связана с формированием тезауруса при использовании Интернет ресурсов?
Проблема состоит в том, что при использовании Интернет ресурсов для формирования тезауруса становится сложно подобрать универсальные критерии для отбора терминов и определения отношений между ними.
Как можно преодолеть проблему формирования тезауруса при использовании Интернет ресурсов?
Чтобы преодолеть данную проблему, необходимо спроектировать структуру тезауруса таким образом, чтобы она позволяла легко настраивать тезаурус под любую область знаний. Например, можно использовать открытые онтологии, не ограничивать набор возможных отношений и выбирать универсальные критерии для отбора терминов.
Какие проблемы возникают при попытках улучшить качество работы программы формирования тезауруса?
При попытках улучшить качество работы программы формирования тезауруса часто возникает проблема того, что затраты на улучшение программы превышают затраты на исправление ошибок вручную. Это может быть связано с сложностью алгоритмов, неидеальными данными или ограничениями в выборе показателей качества.