Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Автоматическое доказательство теорем ⇐ ПредыдущаяСтр 9 из 9
Автоматическое доказательство теорем является основой логического программирования, одним из способов построения систем искусственного интеллекта. Алгоритм, который проверяет соотношение G |-T S для формулы S, множества формул G и теории T называется алгоритмом автоматического доказательства теорем. Для достаточно простых формальных теорий, например, прикладных исчислений первого порядка такой алгоритм существует. Автоматическое доказательство проводится методом резолюций, в основе которого лежит способ доказательства от противного. Часто логическим программированием называют автоматическое доказательство методом резолюций, однако этот метод лишь наиболее разработанный его частный случай. Теорема 7.1. Если G, Ø S |- F, где F – любое противоречие, то G |- S. Доказательство. Если G, Ø S |- F, то GÙ (Ø S)|- F, так как GÙ (Ø S)|- G и GÙ (Ø S)|- Ø S. Следовательно, |- GÙ (Ø S) ® F. Так как GÙ (Ø S) ® F º º º º , то |- и, следовательно, G |- S. Метод резолюций работает со стандартной формой формул, называемой предложениями. Предложением называется бескванторная дизъюнкция литералов. Любая формула исчисления предикатов может быть преобразована в множество предложений по следующему алгоритму. 1. Построить предварённую нормальную форму формулы. Напомним, что для этого нужно: a) преобразовать формулу к приведённому виду, т.е. исключить операцию ® и спустить операцию отрицания до атомарных формул; b) провести разделение связанных переменных; c) вынести операции связывания переменных в начало формулы. 2. Преобразовать предварённую нормальную форму в предклазуальную, т.е. привести матрицу U нормальной формы к КНФ. 3. Провести сколемизацию нормальной формы (построить клазуальную нормальную форму, исключив операции связывания переменных). 4. Удалить операции Ù (дизъюнкции клазуальной нормальной формы составят искомое множество предложений). Далее к предложениям, полученным из формул множества G и из формулы Ø S, применяется правило резолюции. Сформулируем это правило для исчисления высказываний, а, затем, обобщим его для исчисления предикатов. Определение. Пусть – предложения исчисления высказываний, такие что , . Правило вывода называется правилом резолюции исчисления высказываний, предложения – резольвируемыми, а – резольвентой. Замечание. Многие рассмотренные ранее правила вывода являются частными случаями правила резолюции. Например, основное правило исчисления ИВ – правило заключения можно представить в виде . Таким образом, множество предложений будет являться противоречивым, если в результате последовательного применения правила резолюции, получим пустую формулу, которую будем обозначать . Действительно, если резольвента пуста, то резольвируемые предложения – взаимно противоположные высказывания и система предложений противоречива. Задание 1. Доказать методом резолюций |- . Решение. В данном примере G – пусто, . Преобразуем формулу в множество предложений. º º º º º º º 1. A 2. 3. Ø A 4. Применив к предложениям 1, 3 правило резолюции, получим пустую формулу, то есть противоречие. Следовательно, формула S является выводимой из пустого множества посылок или теоремой рассматриваемой теории. Для того чтобы сформулировать правило резолюции для исчисления предикатов введём понятие унификатора. Определение.Подстановкой q сигнатуры s называется конечное множество вида , где – терм сигнатуры s, отличный от переменных и все переменные различны. Например, множества и являются подстановками сигнатуры . Пусть U – формула, а q – подстановка сигнатуры s. Обозначим через формулу, полученную заменой всех вхождений на термы . Определение. Подстановка q сигнатуры s называется унификатором для множества формул сигнатуры s, если . Множество формул сигнатуры s, называется унифицируемым, если для него существует унификатор сигнатуры s. Например, множество формул сигнатуры унифицируемо, так как подстановка является его унификатором. Определение.Пусть и – подстановки сигнатуры s. Композицией подстановок q и l (обозначается q ° l) называется подстановка, которая получается из множества вычеркиванием всех элементов , для которых , и всех элементов , для которых . Пример. Пусть , . Тогда = , а так как и , то . Определение.Унификатор t для множества формул сигнатуры s называется наиболее общим унификатором (НОУ), если для каждого унификатора q сигнатуры s этого множества существует подстановка l сигнатуры s такая, что . Так для множества наиболее общим унификатором является подстановка . Определение. Пусть – предложения исчисления предикатов, такие что , , а атомарные формулы унифицируемы наиболее общим унификатором t. Правило вывода называется правилом резолюции исчисления предикатов. Задание 2. Проверить G |- , где G: , , , . Решение. Выпишем множество предложений G, Ø S, пронумеровав их. 1. 2. 3. 4. 5. Далее будем добавлять предложения в это множество, применяя правило резолюции с возможной предварительной унификацией. Рядом с новым предложением будем указывать способ его получения (правило резолюции или унификация) и номера предложений, к которым он применялся. 6. R (1, 5) 7. (2, 6) 8. R (6, 7) 9. (4, 8) 10. R (8, 9) Следовательно, G |- . Работа метода резолюций может иметь следующие варианты результатов: 1) на очередном шаге получено пустое предложение и, следовательно, формула S является следствием G (теорема доказана); 2) если во множестве предложений нет новых резольвируемых предложений, то теорема опровергнута; 3) множество предложений постоянно пополняется новыми предложениями (зацикливание), что означает, что средств данной теории недостаточно ни для того, чтобы доказать теорему, ни для того, чтобы её опровергнуть. Представим алгоритм работы метода резолюций на языке описания алгоритмов. Результат 1 – если S выводимо из G, 0 – в противном случае. Обозначим M – множество предложений, C – множество предложений, полученное из G и Ø S. Функция choose выполняет выбор резольвируемых предложений, R – вычисляет резольвенту. while ÿ Ï C begin choose ( ) if then return 0 R( ) end return 1 ТЕОРИЯ АЛГОРИТМОВ Неформально понятие алгоритма, как последовательности действий направленных на решение некоторой задачи, вводилось ещё в курсе информатики. Далее в курсах технологии программирования, дискретной математики, математической логики рассматривались алгоритмы решения различных типов задач. В данном разделе мы формализуем понятие алгоритма, введём понятие вычислительной сложности алгоритма, классифицируем алгоритмы. Вид формальной модели алгоритма зависит от тех понятий, которые положены в основание модели. 1) Первый подход основан на представлении об алгоритме, как о программе для некоторого детерминированного устройства. К моделям этого типа относятся машины Тьюринга, канонические системы Поста, нормальные алгорифмы Маркова. 2) Второй подход основан на понятии вычисления и числовой функции, основная теоретическая модель этого вида – рекурсивные функции. Перед введением формальных определений алгоритма сформулируем понятия, необходимые для дальнейшего изложения. Всюду далее будет рассматриваться некоторая массовая задача P. Массовая задача P определяется следующей информацией: 1) общим списком параметров задачи; 2) формулировкой свойств, которым должно удовлетворять её решение. Напомним, что этот набор называют ещё спецификацией задачи. Индивидуальная задача I получается подстановкой в массовую задачу P данного вида конкретных значений параметров. Будем говорить, что алгоритм решает массовую задачу P, если применим к произвольной индивидуальной задаче I, соответствующей задаче P, и даёт решение задачи I. В качестве массовой задачи P будем рассматривать задачу распознавания, т.е. задачу решением которой могут быть ответы “да” или “нет”. Например, задачей распознавания является задача определения – делится ли заданное натуральное число нацело на 4. Это не ограничивает общности, так как любая задача может быть сформулирована в терминах задачи распознавания. Обозначим через – множество всех индивидуальных задач, соответствующих задаче P, – множество индивидуальных задач с ответом “да”. Таким образом, задача распознавания состоит в определении этих двух множеств. Для записи задачи распознавания используется естественный формальный эквивалент, называемый языком. Обозначим S – конечное множество символов (алфавит), S* – множество всех конечных цепочек, составленных из S (слова), – подмножество S*, называемое языком. Соответствие между задачами распознавания и языками устанавливается с помощью схем кодирования. Схема кодирования e записывает каждую индивидуальную задачу из P словом в фиксированном алфавите S. Множество S* делится задачей P и схемой кодирования e на 3 класса: 1) слова, не являющиеся кодами индивидуальных задач из P; 2) слова, являющиеся кодами с отрицательным ответом; 3) слова, являющиеся кодами с положительным ответом. Третий класс слов обозначим .
Одноленточная детерминированная машина Тьюринга (ДМТ) представляет собой логическое устройство, которое состоит из: 1) неограниченной в обе стороны ленты, разделенной на одинаковые пронумерованные ячейки; 2) читающей/пишущей головки; 3) управляющего устройства с конечным числом состояний. Схематически ДМТ можно представить в виде рисунка
Программу для ДМТ определяют следующие компоненты: 1) G – конечное множество символов, записываемых на ленте, – множество входных символов, – выделенный пустой символ; 2) Q – конечное множество состояний, в котором выделено начальное состояние и два конечных – ; 3) функция переходов . Т.е. . Порядок работы ДМТ под управлением программы . 1. Входное слово записывается на ленте в ячейках с номерами ( – длина слова x), все другие ячейки содержат пустой символ. Управляющее устройство находится в состоянии , а читающая/пишущая головка – над ячейкой с номером 1. 2. Если текущее состояние q не совпадает с одним из конечных состояний, то машина переходит в следующее состояние, определяемое согласно функции переходов. Пусть , где s – считанный головкой символ из текущей ячейки. Тогда управляющее устройство переходит в состояние , головка вместо символа s записывает символ и сдвигается на одну ячейку влево, если , или вправо, если . Затем, текущим становится состояние . 3. Если , то вычисления заканчиваются с результатом “да”, если , то – с результатом “нет”. В качестве примера рассмотрим упоминавшуюся выше задачу распознавания “делимость на 4”. Построим ДМТ-программу для решения этой задачи. Для представления чисел будем использовать символы 0 и 1, а в качестве схемы кодирования – двоичную запись числа. Значит, , . Опишем словесно действия ДМТ, а затем формализуем в виде программы . Число делится нацело на 4, если два последних символа в его двоичном представлении являются нулями. Поэтому, вначале машина будет считывать, повторять все символы входного слова и двигаться вправо, пока не дойдёт до пустого символа. После чего будет выполняться движение влево и анализ последнего и предпоследнего символа с последующей заменой его на символ b. Если хотя бы один из этих символов не равен 0, то результирующее состояние – , в противном случае – . При любом конечном состоянии результатом на ленте будет частное от целочисленного деления, причём, если , то им является пустое слово, т.е. 0. Представим функцию переходов наглядно в виде ориентированного графа. Вершинами графа будут являться состояния управляющего устройства, дуги графа означают переход из одного состояния в другое, причём, над каждой дугой будем писать символ(ы), по которому выполняется переход, а после знака ® – замещающий символ(ы) и направление движения головки. Следовательно, .
Функцию переходов d можно также задать табличным способом.
Программа , имеющая входной алфавит S, принимает слово в том и только том случае, когда, будучи применённой ко входу x, она останавливается в состоянии . Язык , распознаваемый программой , определяется следующим образом . Если , то работа программы может либо завершиться в состоянии , либо бесконечно продолжаться без остановки. Будем говорить, что ДМТ-программа решает задачу распознавания P при схеме кодирования e, если останавливается для любых и . Работу ДМТ-программы можно рассматривать, как вычисление некоторой функции . Если слово и программа останавливается на любом входе из S*, то результатом вычисления будет слово, составленное из символов, записанных на ленте после остановки машины в ячейках с 1-ой по последнюю непустую ячейку. Функция называется вычислимой (по Тьюрингу), если существует вычисляющий её алгоритм, т.е. $ программа , такая что . Свойства вычислимых функций. 1. Суперпозиция вычислимых функций вычислима. 2. Любая вычислимая функция вычислима на машине Тьюринга с правой полулентой. 3. Если функции вычислимы, то разветвление также вычислимо. Выше мы каждому алгоритму поставили в соответствие функцию. Является ли верным обратное утверждение: можно ли для произвольной функции построить алгоритм её вычисляющий? Ответ на этот вопрос отрицательный, т.е. произвольная функция не является вычислимой. Выделим класс функций, для которых вычисляющий их алгоритм существует, таким образом, мы дадим другое определение алгоритма в терминах функций. Рекурсивные функции Очевидно, что вычислимыми являются все натуральные константы. Как и в формальной арифметике натуральных чисел, определим их с помощью константы 0 и функции следования . Также вычислимыми являются функции тождества. Через обозначим множество функций, вычисляемых по правилу . Мощным средством построения новых функций является их суперпозиция. Определение. Оператором суперпозиции называется подстановка в функцию от m переменных m функций от одних и тех же n переменных, т.е. , где и . Функции тождества и оператор суперпозиции задают всевозможные операторы подстановки функции в функцию, а также переименования, перестановки и отождествления переменных. Оператор примитивной рекурсии определяет n+1-местную функцию f через n-местную функцию g и n+2-местную функцию h. Определение. Система равенств называется схемой примитивной рекурсии, а оператор оператором примитивной рекурсии. Если , то . Например, так определяется хорошо знакомая функция факториал. Здесь . Определение. Функция называется примитивно рекурсивной, если она может быть построена из 0, функций и с помощью конечного числа применений операторов суперпозиции и примитивной рекурсии. Примеры. 1) Функция суммы, определяемая равенством , является примитивно рекурсивной, так как она задаётся схемой примитивной рекурсии , т.е. , где , причём функции g и h являются примитивно рекурсивными. 2) Функция арифметического вычитания . (Проверить самостоятельно). Арифметизированные логические функции также являются примитивно рекурсивными, так, например, . Также с помощью арифметического вычитания можно выразить Ù и Ú (самостоятельно). Из функциональной полноты множества функций следует примитивная рекурсивность всех логических функций. Определение. Отношение называется примитивно рекурсивным, если его характеристическая функция примитивно рекурсивна. Так как существует взаимно однозначное соответствие между отношениями и предикатами, то будет характеристической функцией и для соответствующего отношению R предиката. Например, предикат делимости нацело числа x на n является примитивно рекурсивным, так как его характеристическая функция , где – функция, вычисляющая остаток от целочисленного деления x на n, примитивно рекурсивна. Определение.Оператор называется примитивно рекурсивным, если он сохраняет примитивную рекурсию функций. Например, условный оператор , где , является примитивно рекурсивным. Примитивно рекурсивными являются также операторы конечного суммирования и конечного произведения , . Определение. Ограниченный оператор наименьшего числа, называемый ограниченным оператором минимизации (ограниченный m-оператор), определяется равенством . Пример. Пусть задан предикат , который принимает значение 1, если число y нацело делится на . Применение ограниченного оператора минимизации к предикату имеет результатом функцию . Ограниченный оператор минимизации примитивно рекурсивен, он является средством построения обратных функций. Функция является обратной к функции . Например, функция целочисленного деления z на x определяется ограниченным оператором минимизации . В результате рассмотрения примеров функций, которые все являлись примитивно рекурсивными, возникает вопрос: существуют ли не примитивно рекурсивные функции. В данном случае ответ положительный, класс примитивно рекурсивных функций не исчерпывает класс всех вычислимых функций. Функция Аккермана. Построим функцию, которая является вычислимой, но не примитивно рекурсивной. Определим последовательность функций по правилу . Функции обладают общими свойствами , , , . Продолжим последовательность по этому рекуррентному правилу ( ) (2) Функции примитивно рекурсивны и растут очень быстро. Так, например, , , , ¼ , , ¼ Зафиксируем и рассмотрим последовательность функций , , ¼ , , ¼ Определим функцию , которая обладает свойствами (3) Функция Аккермана определяется как диагональ функции , т.е. = . Функция Аккермана является вычислимой, так как соотношения (2), (3) позволяют построить программу для её вычисления. Однако данная функция не является примитивно рекурсивной, так как она в силу (3) является двукратно рекурсивной. Поэтому средства построения вычислимых функций нуждаются в расширении. Оператор кратной рекурсии не замыкает класс вычислимых функций, так как для любого n можно построить функцию, которая является -рекурсивной, но не n-рекурсивной. Средством завершающим построение вычислимых функций является m-оператор. Определение. Определение. Функция называется частично рекурсивной, если она может быть построена из 0, функций и с помощью конечного числа применений операторов суперпозиции, примитивной рекурсии и m-оператора. Частично рекурсивная функция может быть определена не для всех значений. Например, функция обратная к функции следования , задаваемая равенством , не определена при . Определение. Частично рекурсивная функция называется общерекурсивной, если она всюду определена. 3. Временная сложность алгоритма. Классы P и NP. При решении массовой задачи P требуется не просто найти алгоритм, решающий эту задачу, но построить наиболее эффективный алгоритм. Под эффективностью алгоритма понимают все вычислительные ресурсы, необходимые для работы алгоритма. Так как ограничения по времени являются детерминирующими, то основное внимание сосредотачивается на этом ресурсе. Временная сложность алгоритма является одной из важнейших характеристик алгоритма, которая определяет затраты машинного времени на его реализацию. Кроме временной сложности алгоритма анализируется еще и сложность по памяти. Временная сложность алгоритма отражает требующиеся для его работы затраты времени. Время работы алгоритма удобно выражать в виде функции от переменной, характеризующей размер индивидуальной задачи (размерности задачи) т.е. объём данных, требуемых для описания этой задачи. Например, для графа, задаваемого списками инцидентности, размерность задачи представляется как пара (n, m). Эта функция каждой входной длине n ставит в соответствие максимальное время, затрачиваемое алгоритмом на решение индивидуальной задачи этой длины. Значение времени зависит от схемы кодирования и вычислительного устройства, определяющего время работы. Нас же будет в дальнейшем интересовать не точная временная сложность алгоритма, а асимптотическая сложность, которая определяется скоростью роста числа шагов алгоритма при неограниченном увеличении размерности задачи. Для сравнения скорости роста двух функций и будем использовать обозначения или . Будем говорить, что функция имеет порядок роста не более, чем функция , что обозначается , тогда и только тогда, когда существуют и , такие, что Будем говорить, что функция имеет порядок роста не менее, чем функция , что обозначается , тогда и только тогда, когда существуют и , такие, что Например, для функции в силу принятых обозначений, можно записать, что или . В общем случае, если - многочлен степени: , то Непосредственно из определения вытекают следующие свойства: ; ; . Если рассматривается представление алгоритма, как ДМТ-программа M, то временная сложность алгоритма определяется равенством . ДМТ-программа M называется полиномиальной, если существует полином некоторой степени k, такой что , т.е. . С помощью этого понятия введём класс языков P. Класс языков P образуют языки, для которых существует полиномиальная ДМТ-программа распознавания, т.е. . Будем говорить, что задача распознавания P принадлежит классу задач P при схеме кодирования e, если язык принадлежит классу языков P. Однако не для любой задачи полиномиальная программа существует. Рассмотрим, например, задачу коммивояжера. Как задача распознавания она формулируется следующим образом: дано множество городов, расстояния между ними и граница B, существует ли проходящий через все города маршрут длины, не превосходящей B. Полиномиальный алгоритм решения этой задачи неизвестен. Опишем вначале неформально класс задач, к которому она принадлежит, а потом формализуем это определение. Неформально класс NP можно определить с помощью недетерминированного алгоритма. Он состоит из 2-х стадий: угадывания и проверки. По индивидуальной задаче I происходит угадывание структуры S, для задачи о коммивояжере такой структурой является вариант пути между вершинами графа. Затем I и S подаются на стадию проверки, которая выполняется детерминированным образом. В нашем примере проверяется, является ли предъявленный путь гамильтоновым циклом, вычисляется его длина и сравнивается с границей B. Недетерминированный алгоритм решает задачу распознавания P, если выполняются свойства: 1) Если , то $ структура S, угадывание которой приводит к положительному ответу; 2) Если , то такой структуры не существует. Таким образом, класс з |
Последнее изменение этой страницы: 2017-03-15; Просмотров: 370; Нарушение авторского права страницы