Информационный центр "Центральный Дом Знаний"

ЖМИ: ТУТ ТЫСЯЧИ КУРСОВЫХ РАБОТ ДЛЯ ТЕБЯ

cendomzn@yandex.ru

Наш опрос
Я учусь (закончил(-а) в школе техникуме институте академии университете Результаты \| Архив опросов Всего ответов: 2691

Онлайн всего: 1

Гостей: 1

Пользователей: 0

Форма входа

Алгоритм Кнута — Морриса — Пратта

Алгоритм Кнута — Морриса — Пратта (КМП-алгоритм), алгоритм поиска образца (подстроки) в строке.

Алгоритм был открыт Д. Кнутом и В. Праттом и, независимо от них, Д. Моррисом. Результаты своей работы они опубликовали совместно в 1977 году.

Поставим следующую задачу: имеется образец $\displaystyle S$ и строка $\displaystyle T$ , и нужно определить индекс, начиная с которого строка $\displaystyle S$ содержится в строке $\displaystyle T$ . Если $\displaystyle S$ не содержится в $\displaystyle T$ — вернуть индекс, который не может быть интерпретирован как позиция в строке (например, отрицательное число). При необходимости отслеживать каждое вхождение образца в текст имеет смысл завести дополнительную функцию, вызываемую при каждом обнаружении образца.

Рассмотрим сравнение строк на позиции $\displaystyle i$ , где образец $\displaystyle S[ 0, m - 1 ]$ сопоставляется с частью текста $\displaystyle \displaystyle T[ i, i + m - 1 ]$ . Предположим, что первое несовпадение произошло между $\displaystyle T[ i + j ]$ и $\displaystyle S[ j ]$ , где $\displaystyle 1 < j < m$ . Тогда $\displaystyle T[ i, i + j - 1 ] = S[ 0, j - 1 ] = P$ и $\displaystyle a = T[ i + j ] \ne S[ j ] = b$ .

При сдвиге вполне можно ожидать, что префикс (начальные символы) образца $\displaystyle S$ сойдется с каким-нибудь суффиксом (конечные символы) текста $\displaystyle P$ . Длина наиболее длинного префикса, являющегося одновременно суффиксом, есть префикс-функция от строки $\displaystyle S$ для индекса $\displaystyle j$ .

Это приводит нас к следующему алгоритму: пусть $\displaystyle \rm{\pi}[ j ]$ — префикс-функция от строки $\displaystyle S[ 0, m - 1 ]$ для индекса $\displaystyle j$ . Тогда после сдвига мы можем возобновить сравнения с места $\displaystyle T[ i + j ]$ и $\displaystyle S[ \rm{\pi}[ j ] ]$ без потери возможного местонахождения образца. Средствами амортизационного анализа можно показать, что таблица $\displaystyle \rm{\pi}$ может быть вычислена за $\displaystyle \Theta( m )$ сравнений перед началом поиска. А поскольку строка $\displaystyle T$ будет пройдена ровно один раз, суммарное время работы алгоритма будет равно $\displaystyle \Theta(m + n)$ , где n - длина текста $\displaystyle T$ .

Календарь

Архив записей
2010 Август 2010 Сентябрь 2010 Октябрь 2010 Ноябрь 2010 Декабрь 2011 Январь 2011 Февраль 2011 Март 2011 Апрель 2011 Май 2011 Июнь 2011 Июль 2011 Август 2011 Сентябрь 2011 Октябрь 2011 Ноябрь 2011 Декабрь 2012 Январь 2012 Февраль 2012 Ноябрь

Друзья сайта
Заказать курсовую работу! Выполнение любых чертежей Новый фриланс 24

Информационный центр "Центральный Дом Знаний"

Наш опрос

Форма входа

Алгоритм Кнута — Морриса — Пратта

Календарь

Архив записей

Друзья сайта