Курс лекций (8)

2.6 Применение методов хеширования для поиска по соответствию

Напомним, что основная цель введения адресации по содержанию состояла в выделении всех элементов, определенные фрагменты которых в точности совпадали бы с заданным аргументом поиска. Очевидно, что работа биологической ассоциативной памяти построена несколько на иных принципах. Например, человек способен воспроизводить события, часто руководствуясь весьма неопределенной ключевой информацией. Однако важнейшая особенность памяти человека, отличающая ее от АЗУ ЭВМ, состоит в том, что она не производит перебора всей информации, отвечающей в какой-то мере ключевой, а концентрируется обычно на одном воспоминании, степень совпадения для которого оказывается максимальной. Вероятно, процесс выборки данных из биологической памяти более близок к работе устройств, предназначенных для распознавания образов.

В этих устройствах объект представляется в виде набора сигналов, формируемых во времени либо параллельно, либо последовательно. В результате анализа некоторых характеристик указанного набора (часто именуемых признаками) устройство выдает решение, позволяющее либо идентифицировать объект, либо причислить его к определенному классу. Классический подход к машинному распознаванию образов базируется на применении систем, получивших название персептрон.

Персептрон система автоматического распознавания образов, реализующая корректируемое в процессе обучения персептрона решающее правило в пространстве вторичных признаков, которые обычно являются фиксированными заранее случайно выбранными линейными пороговыми функциями от первичных признаков.

Математическим аналогом персептрона является дискриминантная функция.

(Дискриминант на языке Ада -  отличительный компонент объекта, или значение именуемого типа).

(далее…)

ПОСТРОЕНИЕ И ПРОВЕРКА ТАБЛИЦ ХЕШИРОВАНИЯ

Лабораторная работа № 2

Тема:  ПОСТРОЕНИЕ И ПРОВЕРКА ТАБЛИЦ ХЕШИРОВАНИЯ

Цель работы: освоение навыков построения и проверки таблиц хеширования


1. Краткие теоретические сведения

1. Таблицы хеширования применяются для обеспечения программного поиска информации по содержанию специального ключевого слова или фрагмента (части) самих данных.

2. Для формирования таблиц хеширования используются следующие компоненты и понятия:

К ключевое слово (любое имя, слово, сочетание любых символов, …);

V числовое значение ключевого слова;

h (V) ХЕШ-адрес, вычисленный по числовому значению V ключевого слова К;

В начальный адрес таблицы;

Н общее количество ячеек памяти в таблице.

Отметим, что при совпадении хеш-адресов, вычисленных по разным ключевым словам, возникает коллизия (конфликт). В этом случае для размещения второй и последующих записей необходимо использовать резервные ячейки памяти, которые размещаются либо в самой таблице хеширования (внутренняя адресация), либо в области переполнения.

Для поиска свободных резервных ячеек применяется процедура пробинга (линейного, квадратичного или случайного).

(далее…)