семинар10

Семинар 10. Компьютерная лексикография
Вопросы для обсуждения
Что такое словарь? Что такое машинный (автоматический) словарь? Какие виды словарей вам известны?
Словарь – организованное собрание слов с комментариями, в которых описываются особенности структуры и/или функционирования этих слов. Виды словарей: лингвистические и энциклопедические:
-в лс описываются сами слова – их значения, особенности употребления, структурные свойства, сочетаемость, соотношение с лекс. системами других языков и т.д.
-в эс описываются понятия, факты и реалии, т.е. экстралингвистическая информация
Промежуточный тип: лингвострановедческие и терминологические словари

Опишите два типа представления лексических единиц в словаре. Какой из этих типов лучше подходит для описания флективных языков, а какой –агглютинативных?
1ый тип представление лексической единицы в виде словоформы – включаются все формы слов, они подаются гнездами, относящимися к одному лексическому значению. Например: включает-включаешь-включаю
2ой в виде основы слова (квазиосновы) – группа форм, относящихся к одному лексическому значению представляется в виде общей основы этих слов. Например блок-включ-ча он больше подходит для флективных и агглютинативных языков т.к. они имеют очень много форм слов.
Представьте структуру машинной словарной статьи (4 зоны). Что может указываться в зоне синтаксических сведений?
Зона морфологических, семантических, лексических и синтаксических сведений (включают как минимум управление глагола и предлога).

Опишите зону морфологических сведений. Какие кодировки используются для обозначения частей речи и представления морфологической информации?
В самом простейшем виде здесь располагаются следующие признаки: признак части речи, к которой относится лексическая единица; морфологические признаки единицы. Для кодировки морфологических признаков лекс. единиц используют специфичные наборы грамматических признаков.

Чем различаются зона семантических и зона лексических сведений машинной словарной статьи? Проиллюстрируйте различия примерами.
В зоне лексических сведений минимально сообщается о: стилистическом использовании лексической единицы (общеязыковая или принадлежит к подъязыку), использовании этой единицы как части фразеологизма или устойчивого словосочетания. Зона семантических сведений включает: семантический признак единицы (ее принадлежность к семантическому подклассу: «одушевленный», «физическое движение» и т.д.), переводные эквиваленты иностранного слова.
Дайте определение базы данных. Что такое «данные»? Каковы основные способы организации баз данных?

База данных – совокупность определенным образом упорядоченных сведений о некоторых объектах.
Данные – показатели, которые характеризуют объект и принимает для конкретного экземпляра объекта некоторое значение.
Способы организации баз данных:
Иерархическая: представляет из себя взаимосвязь данных в виде иерархического дерева состоящего из узлов. На верхнем уровне иерархии один узел – корень, каждый узел кроме корня связан с одним из узлов на более высоком уровне (исходном узлом данного узла). Каждый узел может быть связан с одним или несколькими элементами на более низком уровне (порожденные). Элементы в конце иерархии не имеющих порожденных называются листьями.
Сетевая модель: тут любое данное может быть связанно с др. данным. Здесь так же можно использовать понятия корня, порожденных и т.д. Порожденные элементы располагаются ниже исходных, однако у порожденных может быть несколько исходных узлов в отличие от иерархической модели.
Реляционная: данные представляются в виде таблицы. Каждая таблица выражает отношения между включенными в нее данными.

Приложенные файлы

  • doc 26590818
    Размер файла: 36 kB Загрузок: 0

Добавить комментарий