что такое тезаурус в информатике

Что такое тезаурус? Как пользоваться тезаурусом в Ворде (Word)

Что такое тезаурус? В статье рассмотрим общий термин и поговорим о тезаурусе в Ворде. На практике воспользуемся тезаурусом в программе Word. Эта информация может вам пригодится при написании текстов или в процессе замены слов.

Что такое тезаурус, для чего он нужен

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.Здравствуйте, друзья! Что такое тезаурус? Это информационный вид словаря или по-другому словарь синонимов. Он хранит в себе различные слова, которые можно использовать для того или иного слова в тексте. То есть, подбирает для слов похожие синонимы или антонимы – противоположные слову.

Для чего нужен тезаурус? Как правило, он нужен для поиска похожих слов и замены старых словосочетаний. Рассмотрим простой пример необходимости использования тезауруса. К примеру, копирайтер написал текст, а он выглядит не уникальным. Чтобы повысить уникальность, можно подобрать слова синонимы для текста. В этом случае, как раз помогает тезаурус.

Вы просто используете набор слов готового словаря и заменяете в тексте слова на другие. Главное подобрать то слово, из-за которого не потеряется смысл текста.

Что такое тезаурус в программе Ворд

Тезаурус в программе Ворд – это словарь синонимов. Данный инструмент встроен в программу. В поздних версиях программы Ворд 2007, 2010, 2013 и так далее, эта функция работает без сбоев.

Так выглядит тезаурус в программе Word (скрин 1).

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

При нажатии данного инструмента, вы увидите список слов, которые будут доступны в справочном материале.

Как пользоваться тезаурусом в Ворде

Рассмотрим инструкцию, с помощью которой вы научитесь пользоваться тезаурусом в Ворде:

Рассмотренную выше инструкцию мы разберем ниже на практике.

Как пользоваться тезаурусом из интерфейсного меню

Для начала у вас должен быть открыт документ Ворд. Далее выделите слово для замены, и нажмите в разделе «Рецензирование» «Тезаурус» (скрин 2).

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

Справа в программе будет открыт справочник, откуда вы можете выбрать словосочетание (скрин 3).

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

Далее наводите курсор мыши на слово в тезаурусе и нажимаете на стрелку справа. Затем из меню выбираете «Вставить», после чего слово в тексте будет заменено. Если вы не нашли подходящего слова, то нажмите в этом окне кнопку «Все справочники». Данная функция поможет найти больше синонимов.

Как пользоваться тезаурусом из контекстного меню

Работать с тезаурусом из контекстного меню так же просто. Выделяете слово в тексте, например, «пользоваться» левой клавишей мыши (скрин 4).

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

Далее нажимаете правой кнопкой и выбираете из меню «Синонимы». В этом небольшом списке находите подходящее по смыслу слово и нажимаете по нему, чтобы оно вставилось в текст. Если синонимов не хватает, нажмите в данном окне «Тезаурус», чтобы открыть больше информации по словам.

Заключение

В данной статье рассмотрели, что такое тезаурус и как им пользоваться. Применив готовый словарь к своему тексту, вы сможете его улучшить, разбавить новыми словами или повысить уникальность. Измененный текст можно публиковать на ресурсах в Интернете или отправлять работы заказчикам.

Спасибо за внимание!

С уважением, Иван Кунпан

На блоге есть статьи по работе с программой Ворд:

Источник

Как устроено современное информационное обеспечение: часть 2. Тезаурус

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

Тезаурус – такое непонятное слово, что захотелось вынести его в отдельный раздел статьи. И обсудить более детально.

Как только математики-информатики определились с определениями, так сразу же источниками и преемниками информации занялись спецслужбы.

При этом каналами передачи информации занялись инженеры (и тоже спецслужбы!), а вот информационный тезаурус они оставили математикам-информатикам, так как ни черта в этом не смогли понять! Шутка.

Просто тезаурус и стал тем важнейшим компонентом информационного обмена, без которого немыслимо современное информационное обеспечение. Им-то и занялись всерьез.

Действительно, а можно ли определить, что такое информационный тезаурус? Математики никогда не боятся давать определений. Они сразу же сказали, что тезаурус – это множество дескрипторов. Коротко и ясно! А ведь действительно, что может быть проще? Например, глюкало – это набор финти-флюшек. Финти-флюшка очень напоминает множество смурзиков. Не так ли?!

Но оказалось, что не смешно, а полезно. Все сразу упростилось.

Если тезаурусы источника и приемника информации совпадают полностью, то это значит (по определению математиков!), что у них эти тезаурусы состоят из одинаковых дескрипторов. Верно? А как это звучит по-русски?

Если два человека говорят на одном языке, то они пользуются одними и теми же словами. Вот и весь перевод с математического языка на русский.

А если тезаурусы совпадают частично, это значит, что только некоторые дескрипторы этих тезаурусов совпадают. Один человек учил английский в школе, а другой вырос в Великобритании. Но «hi» (здесь – «привет») и «bye» (здесь – «пока») они, как ни странно, понимают одинаково. Значит, могут поздороваться и даже попрощаться. То есть, некоторые дескрипторы их тезаурусов являются общими!

Ну и какой от этого прок? В чем практическая жилка информационных тезаурусов? Можно согласиться, что если под эти понятия подводить только общечеловеческое общение, то ничего, кроме силы абстрактного мышления математиков, мы не увидим. А только сможем восхититься, как эти математики-информатики (возможно, за государственный счет!) обогащают свой научный язык.

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

Но все не так просто, когда появляются человеко-машинные системы. Когда начинается общение людей с компьютерами (по сути, с программируемыми автоматами). Когда, хоть убейся, компьютер не научишь понимать простую, хотя бы русскую речь. Ну ладно, пусть хоть бы английскую, они ведь нас обогнали в этих вопросах (ну ничего, мы им еще покажем, например, на ниве космоса!). «Я б выучил английский только за то, что его понимает компьютер!» – так можно было бы перефразировать очередного классика.

Увы, обогнать-то обогнали, но английскому компьютер не обучишь, и китайскому тоже, и вообще никакому языку не получится обучить. Тут тоже математики постарались, они и виноваты. Ввели ряд определений (например, об уровнях кибернетических систем), доказали ряд теорем (например, о невозможности адекватно моделировать системы более высокого уровня с помощью систем более низкого уровня).

А чтобы еще больше запутать простых пользователей ПК, математики полезли в лингвистику. Дали определение языкам. Не рискну его здесь воспроизвести полностью, можно умереть от скуки. «А в общих чертах можно понять, о чем он говорит?» – спрашивал Иван Васильевич про пламенную речь посла шведского (а толмача сварили в кипятке перед этим, брр!). Конечно, можно…

Попробуем. Язык (по определению математиков) – это набор воспроизводимых символов средствами языка и невоспроизводимых символов средствами языка, а также набор правил вывода всех понятий языка.

Поясню. Предположим мы учим английский (чтобы потом говорить hi и bye). Можно по-английски написать эти два слова, я уже это сделал. Они записываются с помощью букв этого языка. А значит – это относится к набору воспроизводимых символов.

Но для нас, для начинающих эти символы ничего не значат, мы не знаем значения этих слов. Поэтому нам сначала говорят не по-английски, а по-русски примерно следующее: «Эти слова звучат «хай» и «бай», означают «привет» и «пока», если их произносят два джентльмена, встретившиеся утром на Бейкер-стрит».

Но ведь то, что записано в кавычках, записано без использования букв английского языка. Ну, тупые мы, начинающие юзеры английского. Нам надо сначала по-русски растолковать. Это математики и называют невоспроизводимыми символами (или короче, нетерминалами). Это такие понятия, с помощью которых можно давать описание языкам, но в самом языке отсутствуют выразительные средства, чтобы их там можно было бы воспроизвести.

Стойте! Бред какой-то. Ведь фразу, записанную в кавычках, можно перевести на английский. И, значит, она станет воспроизводимым символом (или короче, терминалом) по определению математиков. Да, согласен, если говорить о языках общения между людьми. Но машинные языки устроены, к сожалению, так, что в них средства описания структуры языка не могут быть записаны с помощью воспроизводимых символов этого языка. Вот тот-то и начинаются ПРИНЦИПИАЛЬНЫЕ отличия социальных систем высшего уровня сложности (состоящих из сообществ людей) от гораздо более примитивных человеко-машинных систем.

Хоть умри, но машине нельзя объяснить, как устроен ее машинный язык. Сам этот язык она понимает, выполняет команды этого языка. Но почему она их выполняет именно таким образом, а не иначе, она (машина) не понимает. И не поймет никогда, потому что в понимаемом ею языке нет ни слов, ни понятий, ни даже намеков на эту тему. Да и нужны ли эти понятия машине? Для надежной работы – не нужны, это точно.

что такое тезаурус в информатике. картинка что такое тезаурус в информатике. что такое тезаурус в информатике фото. что такое тезаурус в информатике видео. что такое тезаурус в информатике смотреть картинку онлайн. смотреть картинку что такое тезаурус в информатике.

Люди же по мере освоения иностранного языка перестают нуждаться в объяснениях структуры и понятий этого языка с применением родного языка. Начиная с какого-то момента, развивать знания иностранного языка мы можем, пользуясь только этим иностранным языком.

В этом принципиальное отличие человека от машины. В этом принципиальное отличие человеческого интеллекта от программируемых устройств.

Математики, кстати, доказали (между прочим, с помощью теорем!) о недостижимости интеллекта человека машинными системами.

Разобравшись с терминалами и нетерминалами, мы легко преодолеем последнюю часть определения языка о правилах вывода (напомню определение, язык – это набор воспроизводимых символов средствами языка и невоспроизводимых символов средствами языка, а также набор правил вывода всех понятий языка – правила вывода).

Это есть то, что есть: правила вывода всех конструкций языка. И у них есть общий термин – синтаксис языка (правила написания) и семантика языка (правила употребления). Это мы знаем еще со школьной скамьи.

И что же мы имеем сухим остатком, после того, как погрузились в мир абстракций? А то, что в человеко-машинных системах, а мы только о них и говорим, так как постоянно подразумеваем человека (пользователя ПК), общающимся с машиной (персональным компьютером); в человеко-машинных системах информационные тезаурусы не только не совпадают по определению, а еще и относятся к разным классам языков, к разным уровням языков.

И между ними настолько большая разница, что

компьютер никогда невозможно научить человеческому языку, а машинные языки могут освоить только некоторые представители славного человечества (программисты, особо продвинутые пользователи и т.п.).

О фантастике, когда компьютеры общаются с людьми на равных, мы не говорим. Мы говорим о реалиях, доказанных наукой. Хотя когда-то наука уверенно доказывала, что Земля – плоская. Так что рано или поздно компьютеры все равно заговорят.

Но это уже будет совсем другая история, и совершенно иная компьютерная грамотность.

Источник

Контрольная работа: Информационно-поисковый тузаурус

Федеральное агентство по образованию Российской Федерации

Нижнетагильская государственная социально-педагогическая академия

Кафедра прикладной информатики

студент(ка) 531(д) ИФ (ОЗО)

1. Информационные системы

2. Информационно-поисковый тезаурус: определение, цель разработки

3. Использование информационно-поисковых тезаурусов

4. Структура информационно-поискового тезауруса

5. Построение информационно-поисковых тезаурусов

6. Сфера применения и перспективы развития информационно-поисковых тезаурусов

В настоящее время в связи с возрастанием объема документальной информации, необходимой для принятия эффективного управленческого решения, и возможностями, предоставляемыми новыми компьютерными технологиями, автоматизированные информационно-поисковые системы стали широко использоваться в различных сферах экономики.

Организация быстрого и эффективного поиска документальной информации становится все более неразрешимой проблемой.

Традиционно информационно-поисковые системы (ИПС) применяются для тематического поиска научно-технической информации в крупных библиотеках, научно-технических центрах, архивах, патентных библиотеках.

Таким образом, сфера приложения для технологий информационно-поисковых систем представляется достаточно широкой.

При автоматизации поиска документальной информации важнейшей является задача формализации содержания документа и запроса. При этом поиск происходит по всему тексту документа или по его поисковому образу, а в качестве запроса чаще всего выступают отдельные ключевые слова или их логические комбинации. Именно на этой технологии основано действие информационно-поискового тезауруса (ИПТ). Цель моей работы – дать необходимые определения, определить цели разработки ИПТ, его структуру и построение, а также значение и перспективы развития.

1. И нформационно-поисковые системы

Автоматизированный документальный поиск может быть организован на основе различных технологий: поиска по поисковому образу документа, поиска по полному тексту документа, поиска документов по гипертекстовым ссылкам.

Технология полнотекстового поиска является неотъемлемой составляющей таких современных и перспективных информационных технологий, как: системы управления документами (Documentmanagementsystem, DMS), технологии групповой работы над документами (groupware), технологии поиска в Internet/intranet. На технологии гипертекста базируется самый известный сервис InternetWorldWideWeb (WWW).

Информационно-поисковая система для управленческих документов, как правило, требует раз­работки собственного информационно-поискового языка, адекватного данной предметной области.

Важнейшей структурной составляющей является информационно-поисковый язык.

Перевод текстов документов и запросов на ИПЯ называется индексированием.

Индексирование может быть ручным (когда его производит человек) или автоматическим.

Для общения человека с компьютером разрабатываются специальные искусственные языки, естественный язык (ЕЯ) в этом качестве пока не может быть использован без специального предварительного преобразования. В естественном языке присутствуют: синонимия, омонимия и полисемия, избыточность, субъективность и другие свойства, препятствующие его автоматизированной обработке.

Искусственный язык, как правило, разрабатывается на основе ЕЯ. При этом устраняется многозначность слов ЕЯ.

Слова любого языка в процессе отображения предметов реального мира вступают между собой в определенные отношения. Эти отношения можно разделить на парадигматические и синтагматические.

Наиболее часто в качестве основания деления при классификации ИПЯ используют способ организации понятий. По способу организации понятий различают: предкоординируемые (классификационные) ИПЯ; посткоординируемые (дескрипторные) ИПЯ.

Дескрипторные языки семантически более сильны, чем классификационные, но более сложны для формальной обработки.

Разработка дескрипторного языка фактически сводится к разработке информационно-поискового тезауруса.

2. Информационно-поисковый тезаурус: определение, цель разработки

Тезаурус – термин, широко используемый в информатике как составная часть информационно-поисковых систем.

Можно выделить два определения информационно-поискового тезауруса:

1. Информационно-поисковый тезаурус представляет собой словарь, отображающий семантические отношения между лексическими единицами дескрипторного информационно-поискового языка (дескрипторами) и предназначенный для поиска слов по их смысловому содержанию.

2. Информационно-поисковый тезаурус (ИПТ) – контролируемый словарь терминов предметной области, создаваемый для улучшения качества информационного поиска в данной предметной области.

И в том, и в другом случае речь идет о словаре, который призван облегчить поиск необходимой информации.

Возможно два способа расположения слов в словарях: по близости их буквенного состава и по смысловой близости.

Цели разработки ИПТ:

— перевод языка авторов на контролируемый язык, используемый для индексации и поиска;

— обеспечение последовательности в присваивании индексных терминов;

— обозначение отношений между терминами;

— облегчение информационного поиска.

3. Использование информационно-поисковых тезаурусов

Тезаурусы используют в своей работе специалисты, в той или иной степени связанные с подготовкой и обработкой текстовой информации: переводчики, редакторы, научные работники, референты и др.

Информационно-поисковые тезаурусы используются при индексировании документов и запросов.

Различают безтезаурусное индексирование и индексирование с тезаурусным контролем лексики.

При безтезаурусном индексировании поисковый образ документа представляется в виде списка ключевых слов, выбранных непосредственно из текста документа. Такое индексирование требует меньше времени и менее трудоемко. Однако такой режим индексирования обладает рядом недостатков: возможна синонимия; нельзя отразить парадигматические отношения.

При индексировании с тезаурусным контролем лексики для выражения содержания документа и запроса используют только дескрипторы, входящие в информационно-поисковый тезаурус, что позволяет исключить синонимию и учесть парадигматические связи, и, в конечном счете, повышает эффективность поиска.

Таким образом, информационно-поисковые тезаурусы используются для:

— перевода текста с ЕЯ на дескрипторный ИПЯ путем замены ключевых слов соответствующими дескрипторами, при этом исключается многозначность;

— отображения парадигматических связей между дескрипторами.

4. Структура информационно-поискового тезауруса

Тезаурус имеет вид словаря, в котором в определенном порядке расположены термины и зафиксированы связи между ними.

Как правило, тезаурус состоит из введения, алфавитного указателя (словарная часть) и систематического указателя.

Алфавитный указатель включает алфавитный перечень дескрипторных статей.

Дескрипторная статья может иметь следующую структуру:

— ключевые слова из класса эквивалентности;

— дескрипторы, подчиняющие заглавный;

— дескрипторы, подчиненные заглавному;

— дескрипторы, ассоциированные с заглавным.

Систематический указатель служит для раскрытия, учета и контроля парадигматических отношений между дескрипторами. Для каждого дескриптора ИПЯ должны быть найдены соответствующие родовые и видовые дескрипторы. Причем предварительно необходимо сформулировать критерии, определяющие число уровней иерархии. Определение степени отображения парадигматических отношений зависит от требований, предъявляемых к системе. Чем шире эти отношения отображены, тем выше полнота выдачи, но одновременно происходит увеличение словарного запаса, усложняется система ссылок и может произойти уменьшение точности поиска.

5. Построение информационно-поисковых тезаурусов

Тезаурусы разрабатываются для отдельных отраслей. Например, существует «Тезаурус по документации», «Дескрипторный словарь по информатике» и т.п. Тезаурус может быть разработан и для обслуживания конкретной информационно-поисковой системы.

Построение тезауруса состоит из нескольких взаимосвязанных этапов.

Критерием включения слов в класс эквивалентности является семантическая значимость этого слова при поиске документов, т.е. если данное слово при поиске документа может быть заменено другим словом, так, что на любой запрос выдача документов будет такой же, как и до замены, то такие два слова объявляются условными эквивалентами и включаются в один класс эквивалентности. Ключевые слова, относящиеся к одному классу эквивалентности, помещаются в соответствующую дескрипторную статью и помечаются символом «с».

В процессе построения тезауруса и выделения множества дескрипторов происходит устранение синонимии, омонимии, полисемии ключевых слов, а также выявление парадигматических связей между дескрипторами.

В ЕЯ многие слова могут быть правильно истолкованы только с учетом контекста. В ИПЯ для правильной трактовки ключевых слов необходимы средства для исключения многозначности трактования слов.

Для устранения многозначности (омонимии и полисемии) ключевое слово, которое можно неоднозначно трактовать, снабжается пометой, в которой указывается в каком значении данное ключевое слово используется в ИПЯ.

Большинство автоматизированных методов создания тезауруса основано на автоматическом подсчете частоты слов, содержащихся в документах, считающихся типичными для данной предметной области. Результаты такой обработки обычно представляются в виде матрицы «документ-термин», (рис.1). Элемент матрицы на пересечении строки и столбца, трактуется как вес слова в документе. На основе полученной матрицы вычисляются коэффициенты подобия между словами, определяемые в зависимости от частоты, с которой слова совместно встречаются в анализируемых документах, и формируется структура тезауруса.

Название: Информационно-поисковый тузаурус
Раздел: Рефераты по информатике, программированию
Тип: контрольная работа Добавлен 09:47:34 27 июля 2009 Похожие работы
Просмотров: 1070 Комментариев: 20 Оценило: 3 человек Средний балл: 5 Оценка: неизвестно Скачать
ДокументыЧастота слова в документе
1234567
D1 D2 D3 D4

Рис.1. Пример матрицы «термин-документ»

Автоматические информационно-поисковые тезаурусы являются составным элементом систем автоматического индексирования документов и запросов. В словарной статье автоматического тезауруса, как правило, зафиксированы отношения условной эквивалентности (синонимии), отношение подчинения и ассоциативные отношения.

6. Сфера применения и перспективы развития информационно-поисковых тезаурусов

В настоящее время происходит расширение сфер применения автоматических тезаурусов. При этом тезаурусы выступают составной частью современных систем подготовки текстов, осуществляя лингвистическую поддержку процесса подготовки и обработки текстов на естественном языке.

Среди наиболее перспективных направлений развития автоматических тезаурусов можно указать следующие:

1. Получение справки по используемому слову. Указав слово, в качестве ключа для запроса, пользователь в ответ получает соответствующий фрагмент словаря, содержащий лингвистическую информацию о данном слове. Например, автоматический тезаурус получает от пользователя некоторое существительное и в ответ выдает совокупность устойчиво сочетающихся с ним глаголов или все наиболее часто сопровождающие его определения. При этом автоматически выполняется процедура нормализации входного слова (т.е. приведение существительного к именительному падежу).

2. Контекстные замены по требованию пользователей. В данном случае тезаурус не только подбирает вместо одного словосочетания другое, которое пользователь счел более соответствующим контексту по смысловым или стилистическим соображениям, но и автоматически переоформляет параметры слов (например, род прилагательного) в соответствии с контекстом. Это означает, что синтаксические операции, производимые тезаурусом, существенно усложняются.

3. Автоматическая оценка стиля. Если слова и словосочетания в тезаурусе снабдить стилистическими пометками, то он может использоваться для стилистической оценки текста с выделением слов и словосочетаний, выпадающих, из общего стиля документа.

В условиях конкурентной борьбы, необходимости постоянного повышения качества работы органа управления и всего предприятия в целом на руководителя обрушивается мощный поток информации, прежде всего документальной, и у него возникают проблемы с ее переработкой. Необходимы специальные методы информационной обработки документов, организации быстрого и эффективного поиска документальной информации. Именно информационно-поисковые тезаурусы служат решению этой проблемы.

Считаю, что в моей работе достаточно подробно и логично изложены способы использования и построения информационно-поискового тезауруса, а также сфера его применения и перспективы развития.

1. Ивасенко А.Г. Информационные технологии в экономике и управлении: учебное пособие / А.Г.Ивасенко, А.Ю.Гридасов, В.А.Павленко.- 2-е изд., стер.- М.: КНОРУС, 2007.- 160с.

2. Информатика для юристов и экономистов / Симонович С.В. и др.- СПб.: Питер, 2001.- 688с.: ил.

3. Информатика: Базовый курс/С.В.Симонович и др.- СПб.: Питер, 2002.- 640с.: ил.

4. Михеева Е.В. Информационные технологии в профессиональной деятельности: учебное пособие.- М.: ТК ВЕЛБИ, Изд-во Проспект, 2007.- 448с.

5. Организация работы с документами: Учебник / Под ред.проф.В.А.Кудряева.- 2-е изд., перераб. и доп.- М.: ИНФРА-М, 2001.- 592с.- (Серия «Высшее образование»).

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *