Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология Образование Политология Производство Психология Стандартизация Технологии |
Обучение, память и парадигмы
" Природа дает ребенку различные средства для исправления всяческих ошибок, которые он может совершить по отношению к окружающим его предметам. При каждой возможности его взгляды корректируются опытом; неудача и боль являются непременными спутниками ошибочных взглядов, тогда как удовольствие и наслаждение возникают при правильных суждениях. Имея таких учителей, нам ничего другого не остается, как стать хорошо информированными людьми и быстро научиться рассуждать правильно... В научной практике наблюдается нечто совершенно противоположное: ошибочные суждения, которые мы вырабатываем, не влияют ни на наше существование, ни на наше благополучие, и никакая физическая необходимость не заставляет нас их изменить. Напротив, воображение, которое вечно старается выйти за рамки истины, в сочетании с самовлюбленностью и самонадеянностью, которые мы так склонны лелеять, побуждают нас делать заключения, которые непосредственно из фактов не следуют..." А.Лавуазье(1952)
Парадигма (от греч. Paradeigma - пример, образец) – система форм; изменяющегося слова или целой конструкции в предположении. Здесь этот термин используется для обозначения совокупности различных представлений об одних и тех же объектах или процессах. Как удается обнаружить фрейм для представления новой ситуации? Очевидно, что мы не можем разрабатывать какую-либо законченную теорию вне рамок глобальной схемы для организации знаний вообще. Если же допустить, что мы работаем в относительно узкой области, то у нас появится возможность обсудить некоторые важные вопросы: ПРЕДВОСХИЩЕНИЕ: как сделать первоначальный выбор такого фрейма, который бы, удовлетворял некоторым заданным условиям. ДЕТАЛИЗАЦИЯ: как выбирать и конкретизировать субфреймы, чтобы иметь возможность представлять дополнительные подробности. ИЗМЕНЕНИЕ: где и как искать другой фрейм, если предыдущий подходит недостаточно хорошо. ОБНОВЛЕНИЕ: что делать, если приемлемого фрейма найти не удается. Можно ли модифицировать один из существующих или надо строить совершенно новый? ОБУЧЕНИЕ: какие фреймы должны запоминаться в долговременной памяти, а какие модифицироваться в процессе накопления опыта? Широко распространено мнение, что память - это нечто совершенно отличное от остальной части мышления; однако для того, чтобы создать полезную и эффективную модель памяти, требуются те же стратегические принципы, которые используются при анализе других аспектов мышления. Мы говорим о человеке, что он умен, если он может быстро находить весьма подходящие фреймы. Система извлечения информации у этого человека работает лучше, чем у других при выработке правдоподобных гипотез, при определении условий, которым должен удовлетворять новый фрейм, и в части использования тех знаний, которые были приобретены на " неудачных" ветвях процесса поиска. Организация удачной модели памяти является задачей не менее сложной, чем решение любых других задач того же класса. Поэтому хороший механизм извлечения информации лишь частично может базироваться на основных " врожденных" механизмах. Он в значительной степени должен зависеть от (приобретенных в процессе обучения) данных о структуре своих собственных знаний. Наше предложение по этому вопросу объединяет в себе ряд компонентов, включая методы распознавания образов, теорию групп и сети подобия. При зрительном восприятии, например, комнаты или процессе понимания рассказа человек собирает сеть, состоящую из фреймов и субфреймов. В этой сети представляется все, что было замечено, или существует в предположении, будь то правильным или ошибочным. Мы уже отмечали, что активный фрейм, т.е. участвующий в процессе " понимания" системой ИИ (в данном случае) внешней для нее ситуации, не может оставаться таковым, если не выполнены условия, определяемые маркерами его терминалов. Теперь мы вводим постулат о том, что все фреймы, задания которых конкретизированы в некоторой ситуации, обязательно должны выступать в качестве значений для терминалов фреймов более высоких уровней. Это же относится и ко всем существенным фрагментам " данных", собранным при наблюдении и хранимым в памяти системы ИИ. Конечно, здесь не может не быть исключений! Мы должны предусмотреть возможность существования определенного числа групп данных, связанных с чем-то подобным регистрам " кратковременной памяти". Следует, однако, помнить, что лишь незначительная часть информации может длительно храниться в памяти, если она не связана с соответствующими фреймами. Предложенная схема концептуальна по своей сути, но, тем не менее, в определенных областях следует допустить существование других типов " зацепок" в памяти и специальных сенсорных буферов.
Требования к памяти
Мы можем представить себе, что память - это система, управляемая двумя дополняющими друг друга потребностями. С одной стороны, это потребность в правильном представлении объектов (сообщений, новых предметов и пр.), которое осуществляется с помощью подключения их к более крупным фреймам; с другой - потребность в конкретизации заданий, терминалов. Остальная часть этой системы будет стремиться сбалансировать их требования, но не столько на базе " общих Принципов", сколько в соответствии со специальными знаниями и темп условиями, которые определяются текущими целями. Если применение какого-либо фрейма окажется неудачным (например, нельзя подобрать нужное задание по какому-то важному условию), следует что-то предпринять, но что? На наш взгляд, существуют следующие возможные пути приспособления фреймов СОПОСТАВЛЕНИЕ ОБРАЗЦОВ. Когда ничего более конкретного найти не удается/можно воспользоваться одним из основных механизмов - механизмом ассоциативного поиска. Это может принести - успех в относительно простых ситуациях, но должно являться лишь вспомогательным средством при использовании других тактик. ОПРАВДАНИЕ. Довольно часто может быть найдено объяснение или оправдание неудаче при согласовании. Например, маленький по своим размерам стул может относиться к классу предметов " игрушки". СОВЕТ. Фрейм содержит четкие указания относительно того, что делать при его неудачном согласовании. Ниже мы рассмотрим обширную " сеть подобия", получаемую в результате обучения и хранящую подобные знания. РЕЗЮМЕ. Если фрейм нельзя приспособить к реальной ситуации или заменить другим, от него следует отказаться. Но прежде надо четко указать причину отказа или составить резюме так, чтобы в будущем помочь любому процессу в решении задач, связанных, с аналогичной переориентацией субфреймов. На мой взгляд, все эти четыре варианта жизненно необходимы, поэтому дальше я рассматриваю их более подробно.
Сопоставление образцов
При замене одного фрейма другим не имеет смысла начинать весь процесс согласования заново. Но каким образом можно сохранить то, что было уже ранее установлено? Будем рассматривать лишь тот случай, когда при отсутствии специальных знаний система обращается за помощью к некоторой " общей" стратегии. Ни на один из универсальных методов мы не можем в данном случае возлагать очень больших надежд, но если удастся подыскать такой фрейм, который использует достаточное число общих со старым фреймом терминалов, то некоторые из общих заданий можно будет сохранить и это, видимо, будет лучшим выходом из положения. Данная проблема может быть сформулирована следующим образом: допустим, что Е есть штраф за потерю очного полностью согласованного терминала, а F - потери от того, что какой-то другой терминал не может конкретизировать свои задания. Тогда, если Е больше F. то любой новый фрейм должен сохранять старый субфрейм. При наличии какой-либо приоритетности среди терминалов типичный запрос на вызов нового фрейма должен включать: 1. Поиск фрейма с возможно большим числом терминалов, общих с конкретизированными терминалами (a, b, … z) старого фрейма и расположенных в порядке убывания их приоритетности. Следует помнить, что заменяемый фрейм является обычно субфреймом некоторого более крупного фрейма и ПОЭТОМУ должен удовлетворять маркерам того терминала, к " которому он подключен. Это предопределяет наличие другой формы обращения к памяти, направленной в ее иерархии скорее вверх, нежели вниз. 2. Поиск или создание нового фрейма, обладающего свойствами (a, b, …, z). В том случае, когда мы в большей степени подчеркиваем различия, а не их общие характеристики, можно объединить оба правила в одно: 3. Помимо нового фрейма, во всем подобного старому фрейму, за исключением различий (a, b, …, z) между ними. Реализация правил 1 и 2 может быть выполнена с помощью процесса поиска в памяти с параллельной выборкой или хаш-кодированием (метод функции расстановки), если терминалы или свойства (a, b, ..., z) - простые атомарные понятия. (В любом случае должен существовать какой-то механизм для поддержания работы генерирующих программ или для одного из видов сопоставления образцов). К сожалению, для осуществления всего этого имеется так много различных способов, что нельзя указать на какие-нибудь характерные для данных целей требования к конструктивным особенностям этих механизмов. Хотя правила 1 и 2 формально являются частными случаями правила 3, на практике они различны, поскольку для работы со сложным правилом 3 требуются знания о том, каковы же эти различия (а, Ь, ..., z). Действительно, последнее правило слишком сложно чтобы его можно было использовать по той схеме, как это предполагалось выше: я приведу доводы в пользу того, что следует в большей степени полагаться на особые, выявленные в процессе обучения различия между парами фреймов, чем на общие принципы. Нужно еще раз подчеркнуть, что основании считать реальной возможность быстрого достижения успеха практически нет. Для решения новых и трудных задач необходимо построить новую структуру представления, а это потребует применения как общих, так и специальных знаний. Работа П.Фримэна н А.Ньюэлла(1971), в которой рассматривается проблема конструирования структур, дополняет данную работу в одном важном направлении. В ней рассматривается вопрос о том, каким образом следует создавать структуры, удовлетворяющие наборам функциональных требований, т. е. условиям, связанным с достижением целей, в дополнение к тем требованиям, которые определяются необходимостью использования определенных субфреймов и символов.
Оправдание
Можно допустить, что фрейм представляет собой " идеальный" образ реального предмета или явления. В том случае, когда какой-то фрейм не может быть согласован с действительностью (по своей природе все идеальное ошибочно), он должен быть заменен, другим фреймом. Особенность " идеальных" образов заключается в том, что они являются превосходными упрощениями действительности; они привлекательны своей простотой, но реальные возможности и преимущества таких структур зависят от дополнительных знаний об их взаимодействии между собой. Следовательно, у нас нет особых причин отказываться от такого " идеального" образа только потому, что не удалась попытка заполнения конкретными данными всех его пробелов, правда, если при этом подобные расхождения можно объяснить, прибегнув к помощи межфреймовского взаимодействия. Ниже приводятся примеры, в которых " оправдание" такого рода может помочь при неудаче процесса согласования. ЗАСЛОНЕНИЕ. Мы знаем, что у стола четыре ножки. Однако стоящий рядом стул может заслонять одну из них; чтобы убедиться в правильности такого " оправдания", можно попытаться найти Т-образные соединения элементов конструкций или проанализировать тени от этих предметов. ФУНКЦИОНАЛЬНОЕ НАЗНАЧЕНИЕ. Геометрически ножка стула представляет собой обыкновенный брусок, но что более важно, в функциональном отношении она представляет собой опору. Поэтому в качестве приемлемой замены для всех ножек можно предложить конструкцию, состоящую из центрального стержня и прикрепленной к нему сверху пластины. Многие предметы могут использоваться для самых различных целей, поэтому в их описании должен преобладать функциональный, а не физический подход. ПОЛОМКА. Отсутствие необходимых деталей можно объяснить либо тем, что их просто нет, либо тем, что они поломаны. В реальной жизни существует огромное число причин - ниспровергателей наших идеальных представлений. ПАРАЗИТНЫЕ КОНТЕКСТЫ. Предмет, отличающийся от стула только лишь размерами, может быть (и, видимо, является) игрушечным стулом. Сетование на то, что кто-то или что-то является " слишком маленьким", может быть неправильно интерпретировано с помощью контекстов, содержащих другие предметы из мира детей и их игр. В большинстве этих примеров для исправления заданий и сохранения текущего фрейма используются знания достаточно общего типа; они могут быть присоединены к фреймам более высоких уровней. В дальнейшем упор будет сделан на более локальные типы знаний, которые естественно разместить в самом фрейме в целях выработки рекомендаций относительно его собственной замены.
Суждения и сети подобия
" Подтверждение правильности утверждения Наполеона (если оно вообще принадлежит ему) о том, что люди, пытающиеся представить себе любое событие во всех его будущих подробностях, не имеют данных для того, чтобы стать командирами, следует искать именно в первой части этого высказывания. Командир, ожидающий, что ход сражения будет протекать точно так же, как и раньше, через две минуты после его начала обнаружит нечто совсем иное. Его ожидания не оправдаются, а в запасе будет в лучшем случае еще одна схема, да и та не сможет быть ему полезной длительное время. Не менее правдивым может оказаться и такой вариант, когда после первой неудачи этот горе-командир вспомнит сразу так много различных примеров, что не будет знать, как поступить в данном конкретном случае. Слишком конкретизированный опыт прошлого создает такие же затруднения, как и его полное отсутствие. Для правильного удовлетворения требований постоянно меняющейся обстановки мы должны не только уметь выделять те объекты и явления, которые имеют отношение к переменам, но и знать, какие их части (свойства) могут развиваться и изменяться, не нарушая при этом общего смысла и функциональной значимости". Ф.Бартлетт(1932)
При перемещении по знакомой квартире нам известна структура поиска информации, основанная на фрейме комната. Когда мы проходим через дверь D комнаты X, то ожидаем, что очутимся в комнате Y (конечно, если D не является наружной дверью). Этот факт может быть представлен с помощью трансформации простейшего типа, состоящей из указателей между двумя фреймами комнат в рамках системы фреймов типа дом. Если дом, где происходит действие, ранее не был знаком, то в своих рассуждениях логично переместиться вверх на один классификационный уровень и использовать следующее правило: когда вы выходите из одной комнаты, обычно следует предполагать лишь то, что вы очутитесь в какой-то другой комнате и не более. Недостаточность конкретной информации может быть преодолена использованием обобщений типа классов ситуаций; если же вернуться к незадачливому командиру Ф.Бартлетта, то описанная у него дилемма разрешается применением некоторой формы абстракции или обобщения. В некотором смысле использование обобщений (классов) является неизбежным: если конкретная информация отсутствует, человек обращается к классам как к теории " первого порядка", лежащей в основе любых сложных моделей. К счастью, нет необходимости использовать классы явным образом, что могло бы повлечь за собой определённые неприятности. Если рассматривать класс в буквальном или строго математическом смысле, то это вовлекает нас в проблему иерархии, основанную на включении в нее различных понятий; порядок в такой системе будет неудовлетворительным из-за различным образом связанных между собой концепций, находящихся в разных контекстах. Этот вывод справедлив также для процедур и фреймов. Нам следует стремиться к тому, чтобы не оказаться связанными с подобными негибкими классификаторами знаний. П.Уинстон(1970) предложил способ создания системы поиска информации, в которой могли бы быть представлены классы и обеспечен ряд дополнительных возможностей. Указатели поиска информации в такой системе можно приспособить для выражения целевых условий и результатов действий, а также для определения принадлежности понятий к определенным классам. Поскольку эта идея известна еще далеко не всем, я попытаюсь объяснить ее на примере, взятом из работы П.Уинстона(1970). Что означает ожидать увидеть стул? Обычно то, что он состоит из четырех ножек, нескольких перекладин, сидения и спинки, находящихся друг с другом в определенных отношениях. Например, ножки должны опираться на пол и находиться ниже, а спинка выше сидения; само сидение должно располагаться горизонтально, спинка - вертикально и т. д. Предположим теперь, что система зрительного восприятия не смогла обнаружить спинку: все есть (четыре ножки, ровная поверхность - сидение), а спинки нет. " Различие" между тем, что мы видим, и тем, что мы ожидали увидеть, состоит в отсутствии требуемого числа спинок, а это свидетельствует скорее о наличии не стула, а скамьи или стола. П.Уинстон считает целесообразным снабдить каждое описание, находящееся в памяти, указателями к другим описаниям, причем каждому указателю должен соответствовать свой маркер отличия между связанными нм парами понятий. Если в процессе согласования фрейма встретятся какие-либо затруднения, то они должны согласовываться с указателями, выходящими из данного Фрейма; это может снабдить систему предложениями по выбору более подходящего фрейма. П.Уинстон назвал образующуюся при этом структуру сетью подобия. Он предлагает поручить компьютеру вести упорядоченное сопоставление находящихся в памяти моделей во время его " холостого хода" и при выявлении между ними существенных различий вводить соответствующие указатели. Та же информация может быть получена и в процессе согласования какой-либо реальной ситуации с хранимыми в памяти данными, ибо следующие одна за другой попытки дают результаты далеко не во всем отличные друг от друга, а различия эти всегда можно зафиксировать. Таким образом, в процессе обычного использования содержащихся в памяти данных можно получать дополнительные сведения и использовать их для расширения сети подобия. Если процедура образования новых указателей чувствительна к записи различий, относящихся к достижению цели, то результат будет еще более ценным, ибо появится возможность реализации механизма обучения на основе собственного опыта. Можно ли на практике создать сети подобия? На первый взгляд кажется, что это может привести к неограниченному росту требуемого объема памяти. И в самом деле, если имеется N фреймов и К типов различий, то общее число указателей может достигнуть величин KNN и следует опасаться того, что: 1) если N велико, скажем, равно 107, то NN будет слишком велико и объем требуемой памяти, по крайней мере, для людей, может оказаться попросту нереальным; 2) для устранения какого-то различия или согласования фрейма может потребоваться такое большое число указателей, что система окажется малоэффективной ввиду ее плохих избирательных свойств; 3) само К может быть весьма велико в том случае, когда параметры системы вариативны. Фактически же ни одна из этих проблем не представляется достаточно серьезной, если рассматривать их по отношению к возможностям человеческой памяти. По современным представлениям (правда, еще недостаточно обоснованным) скорость накопления информации в долговременной памяти человека такова, что вопрос о ее насыщении затрагивать вообще не следует. Реальность состоит в том, что нам не только не грозит опасность насыщения, но, как это ни парадоксально, связей может просто не хватить! Более того, нельзя рассчитать, во-первых, что мы получим достаточно времени, чтобы установить все требуемые связи, и, во-вторых, что каждое нуждающееся в указателе различие будет в действительности им обладать. Ниже мы рассмотрим вопрос о том, как следует хотя бы частично обойти эту проблему.
|
Последнее изменение этой страницы: 2017-04-13; Просмотров: 396; Нарушение авторского права страницы