Глава 1. Лингвистические истоки теории тезауруса.
1.1 Общая характеристика и критерии классификации словаря тезаурусного типа.
Тезаурус (от греческого слова ???????? — сокровище) в современном
смысле означает «всю сумму накопленных знаний». Голландский лингвист П.В. Стеркенбург в книге «A Practical Guide to Lexicography» представляет три различных определения тезауруса:
-толковый словарь, составленный с целью представления всего словарного состава языка;
-словарь синонимов;
-тематический словарь, который "представляет значения слов и словосочетаний, расположенных по тематическим категориям" [19, с.142-143].
Лингвист Юрий Николаевич Караулов в свою очередь описывает тезаурус как «словарь, который в явном виде фиксирует семантические отношения между составляющими его единицами <…>.» [6, с.148]. Единицей тезауруса принято считать слово, словосочетание, также термины, выраженные словами словосочетаниями, включенные в тезаурус в качестве дескриптора или аскриптора.
Караулов также описывает два основных типа тезаурусов: 1) общеязыковые и 2) информационно-поисковые. Он упоминает что «принципиальной разницы между общеязыковым и информационно-поисковым тезаурусом нет: тезаурус является лексическим инструментом информационно-поисковых систем. Он состоит из контролируемого, но изменяемого словаря терминов, между которыми указаны смысловые связи» [6, с.148]. Общеязыковые словари подразумевают точное описание и лексическое представление некоторой области объективной действительности, в то время как целью информационно-поисковых словарей является анализ логически непротиворечивое представление существующей и общепринятой терминологии данной отрасли. На этом основании главным отличием общеязыкового словаря от информационно-поискового принято считать предмет их действия. А именно отличие термина от слова.
Критерии классификации тезауруса: тип смысловых связей между единицами словника; объем словника; генерализованность словника; разработка значения лексем; грамматико-стилистическая квалификация лексем; демонстрация функционирования лексем; количество представленных языков; тип семиотических средств, используемых для семантизации лексем.
Валерий Вениаминович Морковкин - советский и российский лингвист в своих трудах выделяет три основные классификации идеографических словарей:
-идеографический тезаурус (лексический состав языка представляет собой систематизированные группы слов, близких по смыслу);
- учебный идеографический (тематический) словарь;
- аналогический словарь (тематические доминанты идут в порядке алфавита);
Позже, опираясь на труды В. В. Морковкина наиболее полную классификацию представит И. А. Воронцова. Она определила 8 критериев для словарей тезаурусного типа: тип смысловых связей между единицами словника; объем словника; генерализованность словника; разработка значения лексем; грамматико-стилистическая квалификация лексем; демонстрация функционирования лексем; количество представленных языков; тип семиотических средств, используемых для семантизации лексем. По типу смысловых связей между единицами словника тезауруса Воронцова выделяет: идеографический тезаурус (тематические или предметные связи) показывает лексические единицы в составе тематических групп и организовывает их в иерархию для концептуализированного знания о мире, аналогический тезаурус (лексико-семантические связи) слова объединяются по принципу семантического содержания, ассоциативный тезаурус (семантико-синтаксические связи) слова объединяются в группы, которые обусловлены их двойными связями: смысловыми и синтаксическими.
В рамках того же критерия идеографический тезаурус делится на четыре следующих типа: собственно идеографический тезаурус, тематический словарь, систематический словарь, тематико-систематический словарь.
По степени генерализованности речи тезаурусы делят на общие и специальные. Общие отражают лексику общелитературного языка, а специальные - лексику языковых стилей
С точки зрения разработки значения лексем тезаурусы делятся на следующие типы:
Кумулятивные - представляющие собой группировки лексем без определения их значений.
Дефинитивные - содержащие одноязычное толкование каждой лексической единицы.
Переводные - раскрывающие смысл лексической единицы посредством другого языка.
1.2 Печатные тезаурусные словари.
Можно выделить три этапа в истории создания идеографических словарей в зависимости от методологических основ, на которых базировались данные словари. Это древние идеографические словари, словари эпохи Нового времени, современные словари, изданные в XX-XXI веках.
Первые попытки построения подобных словарей относятся к ІІ в. н. э.
Как пишет в своей книге Ш. Балли: «Основная идея создания таких словарей состояла в том, чтобы определить какими конкретными словами языка выражается тот или иной смысл или идея, поэтому такие словари называют иногда «идеологическими». [2, с.1517].
Словарей, дошедших до наших дней немного, один из них словарь Ю. Поллукса «Ономастикон», II в., в него входит 10 книг, в каждой книге содержатся слова, относящиеся к той или иной теме.
В промежутке между II и III в.в. создается словарь «Амарокша», написанный на санскрите (Амарокша в переводе - «Сокровища Амара»). В нем описываются порядка десяти тысяч слов в трех книгах, каждая из которых разбивается на общие и частные темы, рассуждение о которых изложено в стихах, например, первая книга посвящена небу, богам, и всему, что с этим связано. Словарь несколько раз переиздавался и переводился на европейские языки.
Самым популярным тезаурусом Нового времени, считается «Тезаурус английских слов и выражений» Питера Марка Роже (1852 г.). Словарь до сих пор является актуальным: систематически переиздается и переведен на несколько языков, в котором максимально учтены идеи составителей предшествующих словарей. В тезаурусе Роже слова разделены на 6 групп - абстрактные понятия, пространство, материя, разум, воля, чувства - которые делятся на логические группы и подгруппы. Роже не ставил себе целью дать дефиницию слов или описание смысла слов, но считал необходимым привести синонимы и антонимы, так как, по его мнению, это помогает лучше найти слово в словаре и служит подсказкой памяти, если невозможно вспомнить какие еще слова выражают определенное понятие.
Один из недостатков словаря-тезауруса Питера Марка Роже это излишняя схематизация для слов, которые отнесены в рубрики. Также за схемы «Тезаурус английских слов и выражений» осуждается за запутанность при поиске искомого слова. Отвечая на критику, Роже утверждал, что основной задачей его словаря была возможность найти слово, которое пользователь словаря не может вспомнить.
Позже, над словарем продолжили трудиться сын и внук Питера Роже, после чего словарь был исправлен и дополнен. Именно поэтому нынешняя версия «Тезауруса английских слов и выражений» существенно отличается от первозданного материала.
Стоит также обратить внимание на отечественные идеографические словари, изданные до 20 в. Некоторые из них «Номенклатор, на русском, латинском и немецком языке» И. Ф. Копиевского (1700 г.) и «Краткое собрание имен» Ф. П. Поликарпова (1701 г.). И тот и другой являются тематическими тезаурусами, «Номенклатор, на русском, латинском и немецком языке» был переведен с русского на латынь и немецкий язык, а «Краткое собрание имен» в свою очередь с русского на греческий и латынь. Сравнивая эти словари между собой, а также с другими словарями-тезаурусами, написанных в то время, мы понимаем, что в них нет полного сходства в кол-ве основных рубрик и их расположении и наполнении.
Рассмотренные словари представляют собой печатные лексикографические издания, отображающие особенности лексических связей слов того или иного языка. С развитием информационных технологий содержание словарей такого типа было положено в основу разработки электронных баз данных, создаваемых при помощи компьютерных программ.
1.3 Электронные тезаурусы.
Основной причиной, по которой тезаурусы получили преимущество в
создании компьютерных ресурсов по сравнению с толковыми словарями, является то, что в тезаурусах так или иначе отражена система логических категорий, соотносимая с системой математических зависимостей в компьютерных программах. Также использование тезаурусных словарей, очевидно, оказалось более эффективным потому, что компьютерные программы (языки программирования) представляют собой системы, предполагающие наличие переходов от одного компонента программы к другому - в тезаурусных словарях уже были сформированы подобные переходы от олова к слову, в то время как в толковых словарях содержание каждой статьи представляет собой замкнутый юнит.
В середине прошлого века языковые тезаурусы стали использоваться как инструмент для создания информационно-поисковых тезаурусов в различных сферах деятельности. Разрабатывались словари, которые были не просто перечнем слов, а источником сведений по определённому вопросу. Такие словари получили название информационно-поисковых тезаурусов. Основная проблема при использовании информационно-поисковых тезаурусов состоит в том, что необходимо точно знать, по крайней мере, материальную оболочку термина, вводимого в поисковик, так как тезаурус может выдать ответ на запрос, только если искомый термин является структурной единицей данного тезауруса. В настоящее время информационно-поисковые тезаурусы создаются для систем автоматизированной обработки документов, таких как машинный перевод, информационный поиск, вопросно-ответные системы. Трудности, возникающие при создании электронных ресурсов использования языка, связаны, прежде всего, с тем, что только часть лексики поддается структурированию в рамках указанных выше отношений. Принимая во внимание то, что наименее проблемными оказываются только отношения «род-вид» и «целое-часть», можно предположить, что в информационно-поисковых тезаурусах преобладает номинативная лексика (имена существительные и именные словосочетания), которая не может покрывать всю систему знания и в отдельной предметной области.
Весь текст будет доступен после покупки