02 октября 2008
4767

Александр Нариньяни. НЕ-ФАКТОРЫ: Неточность и Недоопределенность - различие и взаимосвязь

(до-формальное исследование)




А н н о т а ц и я

В этой статье, которая является обновленной версией препринта [1], я делаю попытку расширить сферу исследования НЕ-факторов, которое пока не выходило за рамки недоопределенности.

Термин НЕ-факторы был предложен автором семнадцать лет назад [2] для обозначения комплекса свойств, характерных для человеческой системы знаний о реальном мире, но плохо представленных в формальных системах (неполнота, неточность, недоопределенность, некорректность и т.п.).

Недоопределенность [3] была за эти годы довольно основательно исследована, что привело к созданию оригинальной и весьма перспективной технологии обработки знаний, ассоциируемой с ключевым понятием constraint.

В то же время неточность - другой НЕ-фактор, тесно связанный с недоопределенностью и играющий не менее важную роль в приложениях остается практически не изученным.

Настоящая работа обсуждает феномен неточности на содержательном, т.е. до-формальном, уровне. Прежде всего уточняется круг явлений, которые предлагается ассоциировать с термином неточность и проводится их сопоставление с близким, но существенно различным по прагматике понятием недоопределенности.

Неточность является универсальным фактором, свойственным всем реальным параметрам, единственное исключение из этого правила количество - может быть точным, но в достаточно узких контекстах. В работе выделены следующие пять базовых типов неточности:

- объективная,

- ситуационная,

- семантическая,

- методическая и

- генерализации,

не являющиеся сущностями одного ряда, поскольку неточность реальных параметров в реальных ситуациях формируется на основе их взаимодействия.

Обсуждение представления неточности с помощью интервала более точных значений или некоторыми другими способами показывает, что эти методы не позволяют выделить единый подход, дающий удовлетворительный результат для всех реальных ситуаций.

Работа делает первый шаг в до-формальном изучении неточности как одного из базовых компонентов системы знаний. Выполняемая ею задача - рассмотрение неточности под самыми разными углами зрения и постановка как можно большего числа вопросов.



Итак, придется ли доказать свои знание или же незнание, но во всяком случае нужно наконец дойти до чего-нибудь положительного касательно природы этой предполагаемой науки, потому что в прежнем положении оставаться ее невозможно.

Имманул Кант, Пролигомены, Предисловие

(Перевод В.С.Соловьева)







1. НА ГРАНИЦЕ ЗНАНИЯ

1.1. Картография неизвестного

У этой работы довольно необычный жанр, который явно требует нескольких слов предварительного пояснения.

Мне кажется совершенно непоследовательным с точки зрения логики развития нашей науки, что подобные работы не появились намного раньше, скажем, двадцать лет назад. Однако этого по тем или иным причинам не произошло и поэтому сейчас я чувствую себя как человек, прокладывающий лыжню по целине: при этом не только легко провалиться в любую яму, но и вообще отправиться в ошибочном направлении.

Инженерия знаний - область деятельности, еще только начинающая формироваться. Я уже писал как-то, что предмет ее изучения напоминает огромный, практически не изученный материк, что-то вроде только что открытой Америки. Многочисленные группы смелых исследователей- конкистадоров высаживаются в различных точках этой terra incognita, считая окружающую местность то островом, то Индией и объявляя всю территорию своей вплоть до следующего океана.

При этом возникает множество новых направлений с большими претензиями и плохо определенными границами. Растут, как грибы, сооружаемые ad hoc из подручного материала причудливые теории и формальные аппараты, имеющие примерно такое же сходство с объектом изучения, какое имели древние карты с изображенными на них далекими странами, никогда не виденными авторами этих карт, а чаще и вообще не существовавшими в природе.

Продолжая эту метафору, стоит вспомнить, что первые карты, пока они не достигли достаточного сходства с действительностью, были весьма мало пригодны в качестве руководства при путешествиях, а служили лишь объектами рассмотрения "чистой" науки и - иногда - большой политики.

Попытки же прокладывать по ним настоящие маршруты вели к сотням безымянных крушений и редким счастливым открытиям, сделанным вопреки такой картографии. Мы же, ни мало не сомневаясь, пытаемся смело пускать в ход наши формализмы при создании систем, которые предназначаются для реальных приложений.

1.2. Формальная модель? Чего?

Представляется, что изображенная картина относится не только к новым направлениям инженерии знаний, но и ко всей этой дисциплине в целом.

С удивительным "дурным" постоянством воспроизводится один и тот же сюжет: некто берется за создание нового аппарата, отражающего определенные особенности свойств данных и знаний. Начав с нескольких простеньких примеров, иллюстрирующих предмет рассмотрения, автор тут же набрасывает эскиз формализма, обладающего некоторым внешним сходством с оригиналом, изучение которого на этом, как правило, и завершается.

Реальный объект исследования как бы перестает существовать, - реальностью становится то, что ваяет автор формализма. Это тот самый дом, который не надо строить "по правде": нарисовал и живи в нем за милую душу.

Конечно же, что касается самого аппарата - тут шутки в сторону: это должна быть настоящая математика, удовлетворяющая самым строгим требованиям. А уж что она там изображает, это вопрос даже как бы не совсем уместный.

Подобный modus operandi иначе как методологией абсурда не назовешь. Осмысленность любой формальной модели с очевидностью требует, чтобы для ее построения было точно зафиксировано, какие свойства реальных объектов она представляет, - ведь именно эти свойства определяют выбор конкретных операций и отношений над формальными объектами, т.е. содержательную интерпретацию и объектов и самой модели.

В противном случае карта, составленная на основе такой науки, годится только для украшения интерьеров да увеселения потомков, которых будет до слез смешить наше умение полностью исключать действительность из предмета рассмотрения.

В качестве свидетельства, не требующего комментариев, приведу цитату из того же Предисловия Канта к его "Пролегоменам", из которого взят и эпиграф к всей этой работе.

Впрочем, нет ничего необыкновенного в том, что после долгого изучения известной науки, когда думают, что она Бог весть как далеко ушла, наконец кому-то приходит в голову вопрос: да возможна ли еще вообще такая наука, и если возможна, то как? Разум человеческий так склонен к созиданию, что много раз уже он возводил башню, а потом опять сносил ее, чтобы посмотреть, крепко ли лежит фундамент.

Никогда не поздно взяться за ум; но если разумное понимание приходит поздно, то труднее бывает дать ему ход.

1.3. Итак, до-формальное исследование.

Для того чтобы избежать опасности такой псевдо-формализации, существует только один путь - тщательное до-формальное исследование изучаемой области. Этот путь является азбукой любой конкретной науки: экономики, физики, лингвистики.

До сих пор, к сожалению, такой естественный порядок не был характерен для науки о знаниях. Причины подобного странного положения дел можно (и, видимо, надо) обсуждать особо, но покончить с ним необходимо как можно скорее.

В соответствии с вышесказанным я хочу в данной работе сделать попытку подобного до-формального исследования в весьма специальной, но достаточно важной области: попытаться выяснить, что мы - как носители знаний - имеем в виду под "неточностью".

При этом речь идет не о семантике или прагматике весьма многозначной и широкой по смыслу лексемы "неточность", что могло бы быть предметом изучения лексической семантики или психолингвистики. Темой обсуждения будет некоторый конкретный феномен нашей системы знаний, которому я вполне условно присваиваю (или, вернее, присвоил в предыдущих работах) этикетку неточность.

Естественно, что для подобного рассмотрения необходимо уточнить сам предмет, что можно сделать либо (а) снизу-вверх, отталкиваясь от представительного множества конкретных примеров, либо (б) сверху-вниз, определив охватывающий контекст данной темы. Поскольку мы пытаемся ориентироваться на местности практически не изученной, нам потребуются оба этих метода.

Поэтому я начну с обсуждения контекста, чтобы сформировать у читателя начальное, пусть самое общее, представление об области дальнейшего рассмотрения, а затем, в основной части публикации, перейду к заполнению этой области реальными примерами, позволяющими составить более полное представление о "фактуре" и конкретике материала.

2. НЕ-ФАКТОРЫ КАК КОНТЕКСТ ДАННОЙ РАБОТЫ

2.1. Что такое НЕ-факторы.

Термин НЕ-факторы был предложен автором семнадцать лет назад [2] для обозначения комплекса свойств, характерных для человеческой модели мира, но плохо представленных в формальных системах (неполнота, неточность, недоопределенность, некорректность и т.п.).

Общее имя НЕ-факторы было выбрано в связи с тем, что каждое из этих свойств получило наименование, лексически и содержательно отрицающее одно из традиционных свойств формальных систем - точность, полноту, корректность и т.п.

Фактически введение термина НЕ-факторы означало попытку осознать как целое ту область исследований, которая охватывает новые срезы системы знаний:

совокупность форм знания, плохо поддающихся формализации традиционными методами (этих форм, вне всякого сомнения, гораздо больше, чем хорошо формализуемых),

различных дефектов знания и

возможных форм незнания, являющегося неотъемлемой и основной частью любого знания.

Таким образом, НЕ-факторы - отнюдь не периферия науки о знаниях.

Ввиду своей универсальности, они пронизывают саму ткань структуры знаний, играя ключевую роль не только в искусственном интеллекте, но и таких, казалось бы, далеких от него областях, как вычислительная математика.

Чтобы подчеркнуть значимость этой проблематики, я решусь здесь на весьма рискованную метафору, уподобив еще совершенно не разработанный комплекс НЕ-факторов своего рода таблице Менделеева, сочетание элементов которой образует все многообразие форм существования знания в нашей картине мира.

Для того чтобы такая система появилась, предстоит еще огромная работа - дифференциация и исследование многообразия ее составных частей, и только затем разработка адекватных аппаратов, которые обеспечат точность отражения естественной прагматики изученных НЕ-факторов в жесткой прагматике соответствующих формальных средств.

2.2. По-прежнему без карты.

Итак, представляется очевидным, что обсуждаемое направление имеет без преувеличения стратегическое значение, поскольку его задачей является реконструкция фундамента предмета исследования инженерии знаний, без чего сам данный предмет, т.е. знания, в значительной степени теряет свою "предметность".

Тем не менее до последнего времени это направление оставалось практически вне зоны внимания даже тех исследователей, чья область профессиональных интересов непосредственно связана с обсуждаемой проблемой.

К настоящему времени таких областей сформировалось немало, причем некоторые из них относятся к центральным разделам тематики искусственного интеллекта. Достаточно упомянуть только некоторые: нечеткая (fuzzy) математика, различные модели beliefs и uncertainty, аппарат rough sets, интервальное напраление constraint propagation (tolerant programming) и т.п., как становится ясно, что деятельность на нашем метафорическом континенте бьет ключом.

Однако, несмотря на впечатляющий масштаб вовлеченных в эту деятельность интеллектуальных сил, до последнего времени не сложилось не только общего видения проблемы, но даже осознания самого ее существования. Размерами и формой континента по-прежнему никто не интересуется, - это ведет к полному отсутствию соотнесенности отдельных направлений, непониманию их места в структуре охватывающего пространства исследований, границ применимости их результатов.

2.3. Неточность и недоопределенность.

2.3.1 Итак, термин НЕ-факторы продолжает обозначать только постановку проблемы, поскольку ее разработка не продвинулась пока настолько, чтобы предложить хотя бы ядро соответствующей теории.

В качестве иллюстрации к этой постановке в работе [4] были рассмотрены четыре НЕ-фактора, условно названные неточность, недоопределенность, неоднозначность и нечеткость (fuzzy). В данном случае выбор был определен тем, что формальное представление этих факторов связывается обычно с использованием интервала значений, - такое внешнее сходство делало более наглядным обсуждение их взаимосвязи, а, главное, содержательных различий в их прагматике.

Мы позаимствуем из этой работы неформальные определения первых двух из перечисленных НЕ-факторов, с тем, чтобы очертить круг явлений, обсуждение которых является основной задачей настоящей публикации.

2.3.2 Неточность: неточное значение есть величина, которая может быть получена с точностью, не превышающей некоторый порог, определенный природой соответствующего параметра.

Очевидно (и мы убедимся в этом при последующем рассмотрении), что практически все реальные величины являются неточными и что сама оценка точности также является неточной. Например, интервал, представляющий неточное числовое значение, задается двумя более точными величинами-границами.

Основным общим свойством неточных переменных, представляющих реальные параметры, является то, что попытка сделать их значение более точным просто не имеет смысла, - например, оценка глубины реки с точностью до сантиметра или точного числа людей, находящихся в Киеве сегодня в полдень.

2.3.3 Недоопределенность: недоопределенное значение является приблизительной, но корректной оценкой некоторой реальной величины, более точной по своей природе, чем позволяет нам установить текущая информация.

Таким образом, интервал, представляющий недоопределенное числовое значение содержит внутри себя представляемую им реальную величину, которая остается пока неизвестной (вернее, известной с точностью до данного интервала) ввиду грубости измерений и/или недостатка информации. При поступлении дополнительных данных недоопределенный интервал может стягиваться, отражая представляемую величину все с большей определенностью.

Это означает, что в отличие от неточной переменной, текущее значение которой всегда равно той реальной величине-денотату [3,4], которую она представляет, для недоопределенной переменной следует различать два значения:

представляемое ею реальное (неизвестное нам) значение-денотат и

ее текущее значение, являющееся доступной оценкой этого реального значения.

2.3.4 Еще раз отметим, что и неточность и недоопределенность - факторы, присущие практически всем параметрам реальных объектов.

Таким образом, каждая переменная полноценной математической модели должна быть одновременно и неточной, и недоопределенной, т.е. обладать способностью доуточняться, но до предела, заданного уровнем точности ее области значений.

Кроме того, несколько забегая вперед (гл.5), отметим, что, будучи качественно различными, оба эти НЕ-фактора остаются тесно связанными: одно и то же значение может быть либо неточным, либо недоопределенным в зависимости от контекста его использования.

3. НЕСКОЛЬКО САМЫХ ОБЩИХ СООБРАЖЕНИЙ

3.1 Значения параметров vs. все остальное.

В этом исследовании я собираюсь ограничиться рассмотрением только значений параметров. Таким образом, термин неточный будет относиться только к параметрам (простым и структурным переменным) и их значениям.

На данной стадии изучения этого НЕ-фактора я практически не имею материала (ср. гл.9) для обсуждения вопроса о том, каким образом понятие неточности может быть расширено на такие более сложные компоненты структуры знаний как объекты, отношения, процессы и т.п. Однако последовательно отделить параметры от остальной системы знаний, естественно, невозможно.

Определения понятий и их параметров тесно взаимосвязаны и поэтому оказываются в сфере действия целого комплекса НЕ-факторов, многие из которых можно пока только наблюдать, но ни выделить, ни различать между собой не удается.

Чтобы проиллюстрировать сказанное, приведем пример: Численность человечества а) в 99 году, б) 23 мая 99 г., в 11ч.37м.16".

Очевидно, что параметр численность человечества определяется через весьма приблизительное (приблизительный здесь не термин, а лишь "намек" на еще не выделенный НЕ-фактор или "пучок" НЕ-факторов) понятие быть живым.

Этому понятию подчинены приблизительные же понятия родиться и умереть, которые, в частности, являются также и неточными в интересующем нас узком смысле: действительно, вряд ли кому-нибудь придет в голову пытаться определять момент рождения или смерти с точностью до долей секунды.

3.2. Параметры сложные и элементарные.

Итак, неточность параметров может рассматриваться на двух уровнях, соотносимых с весьма условным разделением параметров на сложные и элементарные.

Неточность сложных параметров связана с приблизительностью определений сложных понятий через более простые, в пределе - через элементарные. Наглядное подтверждение тому - пример, касающийся численности человечества.

Элементарные параметры делятся в свою очередь на две группы качественные и количественные; первые приблизительны по самой своей природе, вторые можно также разделить надвое:

количество (число сущностей),

все прочие физические параметры, измеряемые количественно - расстояние, масса, время и пр., а также их "чистые" производные: объем, скорость, волновые (цвет, звук и т.п.), электрические и пр.

В данной работе мы в основном ограничимся рассмотрением количественных элементарных параметров, поскольку обсуждение сложных и качественных элементарных параметров связано с учетом явления, обобщенно названного выше приблизительностью и остающегося пока белым пятном на нашей карте.

В следующем разделе мы обсудим параметр количество (число сущностей), поскольку он стоит несколько особняком от остальных количественных параметров.

3.3. Количество как параметр особого типа.

Следует отметить, что количество было отнесено выше к элементарным параметрам весьма условно, поскольку его определение связано с выделением считаемых объектов, среди которых даже самые простые вряд ли можно отнести к элементарным.

Впрочем, уже говорилось, что проблематично и само разделение параметров на элементарные и сложные. Тем не менее, количество - это, кажется, единственный параметр, который может быть точным, хотя и в относительно узком контексте: например, число присутствующих сейчас в данной комнате. Относительно потому, что даже это число является точным только в тот момент, когда никто не входит и не выходит.

В общем же случае мы сталкиваемся с теми же проблемами, что и примере с численностью человечества: войти в этот мир или в эту комнату - и в том, и в другом случае невозможно точно определить моменты перехода из одного состояния в другое.

Основным источником неточности параметра количество является тот факт, что считать можно только объекты конкретной выборки или класса. Определение объектов счета связано с определением выборки, которое и приблизительно и неточно, поскольку оперирует другими неточными и приблизительными объектами, отношениями и параметрами.

В реальной деятельности повысить точность определения выборки (а, следовательно, и оценки количества) часто пытаются за счет формализации естественных неточных параметров, входящих в определение выборки. Например: Кто из присутствующих родился в мае 1963 г.? Это те, у кого в паспорте стоит соответствующая дата рождения.

При этом происходит очевидная подмена исходной реальности (дата рождения) псевдо-реальностью (отметка в паспорте). Однако и все подобные формализации также точны лишь в определенной степени: нет паспорта, дата испорчена или неоднозначно читается и т.п.

4. ТИПОЛОГИЯ НЕТОЧНОСТИ

4.1. Основные источники неточности.

4.1.1 Основные источники неточности значений параметров можно разделить на следующие группы:

(а) Объективная неточность связана с самим "устройством" нашего мира; сюда относятся:

квантовая неточность, определяемая соотношением неопределенности Гейзенберга.

тепловая - движение атомов и молекул в жидкости и газе, их колебание в твердом теле.

релятивистская, связанная с относительностью системы координат.

(б) Ситуационная неточность определяется уровнем точности текущего использования значения того или иного параметра (в принципе можно точнее, но в данном контексте это не имеет практического смысла). Например, обычно не имеет смысла излишняя точность: скорость ветра в 11ч. 37м., вес паровоза с точностью до грамм и т.п. Однако это не исключает другого, также ситуационного, уровня точности в другом контексте: скажем, обычно никто не определяет объема жидкости в бутылке с точностью до миллилитра, однако такая точность может оказаться нужной при проверке работы разливочной машины.

(в) Семантическая неточность "встроена" в само понятие, связанное с данным параметром; имеет место для любых реальных понятий. Приведем несколько примеров.

(в1) Объекты сложной, неправильной формы (т.е. все реальные объекты) описываются параметрами, ориентированными на спецификацию более простых, геометрически правильных объектов, идеализированно аппроксимирующих сложные:

Глубина, ширина, длина, скорость течения реки связаны с неточностью определения края воды, ее поверхности, дна и других параметров, характеризующих геометрию реки; эти параметры предназначены для характеристики прямого канала равномерной ширины, с поперечным сечением правильной формы и гладким ложем из плотного материала.

Земля - геоид, хотя и далекий от идеального; однако говорится о радиусе и центре, как для шара; более того, длина экватора этого псевдо-шара, замещающего псевдо-геоид, который в свою очередь замещает реальное физическое тело неправильной и меняющейся (приливы, движения материков и т.п.) формы была положена в основу эталона метра!

Любая доска трактуется как вытянутый параллелепипед; при этом речь идет о длине, ширине и толщине, но игнорируются детали реальной поверхности и формы конкретной доски.

(в2) То же самое относится и к реальным процессам, поскольку их начало и конец подразумеваются как бы мгновенными, а длительность - точной: родиться и умереть в примере п.3.1, оценка спортивных результатов на время, и многое другое.

(г) Методическая неточность определяется неточностью измерения, связанной с рядом факторов:

физической природой приборов/инструментов, изготовленных с конечной точностью,

"встроенным" в определение параметра сопоставлением с эталоном (неточность эталона),

отсутствием идеальной процедуры замера значения: практически все такие процедуры опираются на понятия `равно`, `больше` и т.п., программирующие неточное сравнение неточных величин,

невозможностью замера в идеальной точке по времени и пространству (наличие обобщения или усреднения).

(д) Неточность генерализации имеет своим источником обобщение значения какого-либо параметра у объектов некоторого класса или выборки:

- вес взрослой овчарки,

- время полета рейсов Новосибирск-Москва и т.п.

Усугубляется упомянутой неточностью самой выборки.

4.1.2 Конечно, перед нами лишь очень грубая схема, представляющая собой попытку установить хотя бы самую общую классификацию различных типов неточности. Например, к объективным выше было отнесено три совершенно разных явления, связь каждого из которых с неточностью явно требует дополнительного обсуждения и уточнения.

Кроме того, ограничившись в п.3.2 количественными параметрами, я использовал в качестве примеров до сих пор только те параметры, неточные значения которых представляются интервалом в той или иной шкале измерений.

Однако понятие неточности может быть достаточно естественно перенесено на параметры, области значений которых являются неупорядоченными или частично упорядоченными множествами. Например, использование категории негр в качестве значения параметра национальность является иллюстрацией ситуационной неточности, достаточной, в частности, для среднего европейца.

Более того, если вы уточните это значение, использовав, скажем, более конкретное значение уруньярванда, вас поймет только специалист по этнографии Африки, хотя по численности эта народность не уступает населению Дании. В данном случае это будет не лишняя, а "вредная" точность: ваш собеседник почти наверняка не поймет, что речь идет о негроидной расе, а может быть, и вообще, что это значение относится к параметру национальность.

Данный пример может служить иллюстрацией диалектической взаимосвязи рассмотренных типов неточности: в Европе неточное значение негр является, скорее всего результатом чрезвычайно огрубленной массовой модели этнической структуры негроидной расы (семантика). В Африке, где население, естественно, разбирается в тонкостях местных национальных различий, оно может носить ситуационный характер в контексте, где важно только подчеркнуть различие между белым, негром, арабом и т.д.

И, наконец, оно может перейти из неточного в недоопределенное (см. гл.5), если собеседники решат уточнить обсуждаемую национальную принадлежность.

Отметим, что неколичественные параметры часто обладают развитой "иерархией уточнения" - например, для того же параметра национальность можно привести уточняющийся ряд: лицо кавказской национальности, дагестанец, лезгин, табасаранец.

4.2. Взаимосвязь различных источников неточности.

Как я уже отметил, предложенная выше классификация условна, поскольку перечисленные источники неточности взаимосвязаны и не поддаются "чистому" разделению. Можно сказать, что они и сами неточны.

4.2.1 Содержательно зависимы ситуационная и семантическая неточность: в практике человеческой деятельности устойчиво формировались те понятия (того уровня неточности), которые определялись совокупностью контекстов реального использования в быту, производстве, науке.

Поскольку обычно понятие, обеспечивающее более высокую точность, является и более сложным, то параметры с избыточной точностью, если и появлялись, то не "выживали", так как не находили применения. Так обыватель обычно с раздражением воспринимает детали какого-нибудь научного изложения, поскольку этот уровень подробности/точности не нужен ему в его модели мира, обслуживающей только бытовые ситуации.

Семантическая неточность является как бы нижней границей ситуационной: как мы видели, уровень ситуационной неточности может варьироваться в зависимости от контекста, но стать более точной, чем это позволяет используемая модель мира, она, конечно, не может.

4.2.2 С другой стороны, и сама модель того или иного объекта не является чем-то абсолютным. Уровень ее сложности также является контекстно-зависимым.

Например, мы пользуемся целой системой моделей Земли самой различной полноты, сложности и соответственно точности: от наиболее полной, учитывающей всю совокупность информации, включая самые подробные географические и геологические карты, модели атмосферы и гидросферы, движения материков и т.п., до самой простой - точки, обладающей определенной скоростью и массой в модели солнечной системы.

Здесь уместно вспомнить о работе [5], в которой для сложных объектов наряду с основным, наиболее полным фреймом-спецификацией предлагалось рассматривать систему последовательно упрощающихся заместителей, представляющих данный объект в различных контекстах.

И, наконец, следует добавить, что семантическая неточность тем или иным образом вписана и в методическую, и в неточность генерализации, поскольку нет знаний без формирующей их модели. Именно эта модель решает, например, является ли точность данного прибора предельной для измеряемого параметра (скажем, точность измерения напряжения для не слишком стабильного источника тока) или есть смысл заменить прибор на более точный.

4.2.3. В свою очередь генерализация в той или иной форме присутствует почти во всех остальных видах неточности. Например:

обобщенные характеристики (температура, давление) газа являются результатом генерализации броуновского движения его молекул,

ситуационная неточность понятия определяется обобщением тех более частных и более точных случаев, которые "покрываются" этим понятием, оставаясь невостребованными в конкретной практике использования знаний (урожайность картофеля в Сибири vs. урожайность в каждом сибирском районе, каждом хозяйстве, на каждом гектаре и т.д.);

то же самое относится и к семантической неточности: замена сложной реальности более простой моделью приводит к тому, что значение параметров модели и, соответственно, их неточность определяются некоторой процедурой, обобщающей совокупность реальных значений, представляемых тем или иным параметром; например, в случае представления Земли геоидом его поверхность должна обладать определенной "толщиной" (т.е. неточностью), в которую вписывается реальная поверхность Земли;

связь методической неточности с генерализацией была отмечена в самом ее определении п.4.1(г): действительно, любое измерение, каким бы точным и точечным оно ни было, производится не в идеальной точке, а некотором реальном подпространстве А, имеющим определенную длительность во времени и объем; следовательно, значения любого параметра, измеряемого в А, являются обобщением значений данного параметра в точках, заполняющих это подпространство.

5. НЕТОЧНОСТЬ, НЕДООПРЕДЕЛЕННОСТЬ И КОНТЕКСТ

5.1 Между неточностью и недоопределенностью

Выше, в гл.2, мы противопоставили два НЕ-фактора - неточность и недоопределенность, поскольку прагматика отражаемых ими явлений совершенно различна.

Однако, как уже отмечалось, во многих случаях одно и то же значение может интерпретироваться как неточное или как недоопределенное в зависимости от контекста использования соответствующего параметра. Например, для всех типов неточности (б)- (д) п.4.1 сужение контекста превращает неточность более широкого контекста в недоопределенность более узкого.

Рассмотрим этот эффект для каждого из них в отдельности.

Ситуационная неточность: численность жителей Москвы в 90-х годах vs. в мае 93 г.: интервал значений, неточный для более широкой и менее точной оценки (90-е гг.), является недоопределенным, т.е. способным к уточнению по отношению к более узкому контексту (май 93г.), предполагающему более точное значение.

Семантическая неточность: Волга, Волга в среднем течении, у Самары, у моста (ширина, глубина, скорость течения, температура и т.п.) - последовательно сужающиеся контексты и все более детальные модели, соответственно, все более узкие неточные значения, по отношению к которым все значения из более широких контекстов являются недоопределенными.

Методическая неточность: при появлении более точных приборов и методик измерения данные прежних приборов и методик являются недоопределенными по отношению к новым. Естественно, это относится только к тем случаям, когда большая точность возможна в принципе: та же численность человечества или результат прыжка в высоту. А толщина реальной доски не станет точнее от измерения самым прецизионным микрометром, поскольку разброс ее толщины определяется грубостью технологии ее изготовления и фактурой материала.

Неточность генерализации: то же самое для последовательно сужающихся выборок - школьники / шестиклассники / 6-ой Б / Петя Иванов (возраст, рост, знания, заболеваемость ОРЗ и т.п.); неточные значения параметров более широкой выборки являются недоопределенными значениями тех же параметров при более узкой выборке.

5.2 Метафора неточности

На этом этапе нашего рассмотрения можно сформулировать следующую метафору неточности:

Каждому неточному значению свойственна определенная "зернистость", отражающая меру неточности данного параметра; по отношению к величине зерна, которая является неделимой (и тоже, конечно, неточной) единицей измерения данного неточного значения, само это значение выражается целым числом, например, рост в 178 +-1 см. может рассматриваться как 89 зерен величиной в 2 см.

При сужении контекста и/или повышении точности приборов и соответственном увеличении точности значения параметра оно становится более мелкозернистым.

Как известно, у каждого количественного параметра существует шкала, в которой определяются его точные, неточные и недоопределенные значения. Шкала задается соответствующей системой единиц измерения (линейные, объем, вес и т.п.), наименьшая единица которой определяет абсолютную предельную зернистость соответствующего параметра. Этот предел обычно не достигается значениями реальных параметров (шкалы формируются "с опережением", обеспечивающим дальнейшее развитие и усложнение моделей знания). Такие же шкалы существуют, как мы видели, и у неколичественных параметров, множества значений которых включают и минимальные различимые при данной модели значения, и более крупные, неточные-недоопределенные, замещающие несколько минимальных.

6. ОПЕРАЦИИ НАД НЕТОЧНЫМИ ЗНАЧЕНИЯМ

Судя по примерам, обсуждаемым далее в этой главе, операции над неточными значениями могут определяться по-разному в зависимости от способа представления неточности и прагматики параметров предметной области.

Это означает, что существуют разные сорта неточности и разные методы работы с ними.

6.1. Неточность и интервал.

Как мы видели, во всех рассмотренных пока примерах неточное и недоопределенное значения не только представляются одинаковым образом, но и переходят друг в друга в зависимости от контекста.

При наличии в активе достаточно разработанного аппарата недоопределенной математики кажется естественным использовать для неточности те же формальные объекты, в частности, интервал для количественных параметров.

Однако, как мы убедимся далее, неточность далеко не так проста и однородна, чтобы обойтись при работе с нею прямой адаптацией недоопределенных типов данных.

6.1.1 Итак, для многих типов неточности (ситуационная, методическая, генерализации) вполне естественны операции, схожие с теми, которые используются в недоопределенной и интервальной математике. Рассмотрим примеры:

а). Некто зарабатывает около 3700 в месяц; на налоги, квартиру и прочие регулярные расходы он тратит примерно 85-87% этой суммы, таким образом, у него остается свободными около 500 в месяц;

б). Если падение напряжения на установке известно с точностью до 1%, а сила тока в цепи с точностью до 2.5%, то на основании этих данных потребляемую мощность можно определить с точностью до 3.5%;

в). Вес взрослого животного 50-60 кг.; при обычном коэффициенте отходов в 53-57% среднестатистическое стадо в 80-100 голов позволяет получить от 200 до 300 с лишним тонн мяса.

6.1.2 Как легко убедиться, во всех трех приведенных случаях можно использовать интервальные оценки неточности и известный набор операций интервальной математики.

В частности, для примера (а) это выглядело бы следующим образом:

месячный заработок х=[3650,3740] (взятый интервал значений х - моя произвольная интерпретация неточной оценки `около 3700`),

регулярные расходы (%) y=[85,87],

свободный остаток z=x*(100-y)/100, z=[474.5,564].

Однако бросается в глаза неестественная точность границ интервальной оценки результата, очевидным образом несоответствующая огрубленности исходных данных и расчета в самом примере.

Это происходит оттого, что мы пока не смогли учесть, что границы неточного интервала также неточны, причем их неточность может быть сравнимой с неточностью самого параметра.

Прежде чем рассмотреть эту проблему несколько подробнее, стоит отметить, что неточность значения заработка в примере (а) может быть связана с разными причинами:

с одной стороны, она может относиться к ситуационному типу, поскольку заработок часто характеризуют с точностью одного-двух первых знаков,

с другой, может являться неточностью генерализации, если обобщает несущественные вариации заработка от месяца к месяцу.

Наконец, она может быть комбинацией и того, и другого.

6.1.3 Формулировка примера (а) подразумевала, что неточность оценки заработка составляет по крайней мере +-20, а то и +-40, т.е. не меньше интервала в 40-50; поскольку точность оценки результата (свободного остатка) в данном случае явно не должна превышать точность исходных данных (заработок), интервальное значение остатка должно "уметь свертываться" до естественной оценки `около 500`.

При этом стоит добавить, что, если неточности аргументов существенно неравны, то при сложении и вычитании большая неточность "поглощает" меньшую, т.е. зернистость результата определяется наиболее крупнозернистым аргументом. Пример: от рулона ткани длиной 20 м. плюс-минус 40 см. отрезается кусок в 3 метра плюс-минус 5 см. Огрубленно можно принять, что остаток длиной в 17м. сохранит точность плюс-минус 40 см.

6.2. Интервал как внутреннее представление неточности

На основе рассмотренных примеров можно предложить следующую приблизительную схему адаптации интервального аппарата для представления и обработки соответствующих типов неточности.

"Внешняя" спецификация неточного значения/параметра (эту тему мы обсудим в следующем разделе) переводится во внутреннее представление, т.е. интервал, снабженный указателем огрубленности границ;

над внутренними представлениями аргументов выполняются расширенные интервальные операции, вычисляющие интервал результата, а также его показатель огрубленности границ;

полученный результат переводится при необходимости во внешнюю форму с учетом его показателя огрубленности.

Эта схема определяет лишь самый общий порядок интервального варианта обработки неточности. При создании конкретного аппарата предстоит решить целый спектр проблем, таких как обработка показателей огрубленности для базовых операций, сам способ представления этого показателя, проблема накопления ошибки при вычислениях с неточными величинами, недоопределенно-неточные типы данных и многие другие.

6.3. Альтернативные способы представления неточности

6.3.1 Итак, как мы видели, для рассмотренных типов неточности могут быть использованы интервальные операции. Таким образом, основой внутреннего представления неточного значения для этих типов остается интервал.

Однако в прикладной системе - а практически любая система обработки знаний ориентируется в конце концов на определенные приложения - важен способ не только внутреннего, но и внешнего, т.е. пользовательского, уровня представления.

Иногда такое различие между внутренним и внешним представлением отсутствует, поскольку они совпадают. Например, для спецификации недоопределенного значения на пользовательском уровне интервал во многих случаях является вполне естественным, поскольку он состоит из верхнего и нижнего ограничений на значение-денотат, представленное данной недоопределенной величиной.

В случае неточного интервала ситуация оказывается не такой простой. Это хорошо видно из примера п.6.1 с рулоном ткани длиной 17м. +-40 см. В интервальном виде эта величина будет выглядеть как [1660,1740], что, как очевидно, существенно менее наглядно, чем одна величина (17 м.) с указанием масштаба неточности, т.е. ее зернистости (+-40 см.).

6.3.2 Как очевидно, указание масштаба неточности в виде абсолютной величины, не является единственно возможным способом.

Альтернативой может быть относительная величина неточности, выраженная, в частности, в процентах к основному значению (см. примеры а-в, п.6.1). Неточность, представленная в процентах, позволяет рассматривать иной, не интервальный, способ реализации операций над неточными значениями. Например: (А,1%) * (В,2%) примерно равно (А*В, 1%+2%).

Однако не все операции над процентным представлением неточности реализуются так просто. Скажем, наш пример с рулоном ткани: с уменьшением остатка процент неточности явно должен был бы расти. Таким образом, видимо, это представление может оказаться неадекватным в качестве внутреннего представления, но во многих случаях весьма привычно в функции внешнего.

6.3.3 Еще один распространенный, весьма естественный для позиционной системы способ представления неточности значения указание количества значимых старших разрядов числа. Обычно это делается по умолчанию: как правило, значимыми являются либо все разряды числа, если последний разряд отличен от нуля, либо разряды, предшествующие нулевым, если число оканчивается нулями.

Например: 3.47 или 6200. Первое число соответствует округлению внутри интервала [3.4650,3.47499], а второе, соответственно, внутри [6150,6249].

Рассмотренная конвенция не является полностью определенной для целых чисел: скажем, число 2400 может представлять округленную неточную величину или само себя, т.е. точное число 2400. Как правило, конкретное значение таких чисел определяется контекстом либо явным указанием: ровно 300 человек, около 300 автомобилей т.п. Опять-таки, в данном случае могут быть использованы операции, не более сложные, чем интервальные.

Однако у позиционного представления неточности имеются серьезные недостатки, которые не позволяют использовать его в качестве универсального внутреннего представления, оставляя ему функции одной из привычных внешних форм. К этим недостаткам относятся: - слишком грубая "шкала зернистости", каждый шаг которой в десять раз отличается от предыдущего, - жесткий характер пространства позиционного огрубления.

Это означает, что позиционное представление неточности не работает, если (i) "зерно неточности" данного значения превышает размер единицы младшего точного разряда и (ii) не попадает на границы позиционного огрубления.

Например: население города колеблется, в зависимости от сезонности, в пределах от 14 до 18 тыс. человек. Такое неточное значение можно представить:

интервалом,

абсолютной неточностью: 16+-2 тысячи,

через проценты: 16 тыс. плюс-минус 12% ,

но никак не представишь позиционно, поскольку оно более точно, чем округление по первому разряду (около 10 тысяч, около 20 тысяч), и менее точно, чем округление по второму разряду, для которого требуется, чтобы зерно не превышало тысячи и "центр" этого зерна приходился примерно на одно из двухразрядных значений - 10, 11, и т.д.

6.3.4 Наконец, еще один вариант представления неточности мы уже упоминали выше - это целое число и мера неточности, указывающая размер зерна. Такое представление имеет по крайней мере один очевидный недостаток: непригодность его (ненаглядность, неестественность) на пользовательском уровне.

Действительно, все тот же наш отрез длиной 20 м. плюс-минус 40 см. выглядел бы как 25 единиц (зерен, квантов и т.п.) неточности размером в 80 см. Зато некоторые операции в таком представлении действительно просты (двойной наклонной чертой разделены число зерен и их размер):

25\80cm - 30\10см = 21\80см

100\10cм * 200\10см =_20000\100см2

Хотя к делению, например, это уже не относится: чтобы получить неочевидный результат операции 100\10м : 20\2 приходится перейти к интервальному представлению

[995,1005] : [39,41] = [24.3,25.8],

что и позволяет определить, что частное равно примерно 25\1 или, несколько более точно, 17\1.5.

Итак, мы обсудили несколько вариантов представления неточного значения. Как оказалось, только интервал достаточно универсален для того, чтобы выступать в качестве внутреннего представления, остальные же, по-видимому, могут использоваться только как внешние выражения для определенных типов ситуаций.

6.4. Не вполне интервальная неточность

Выше были рассмотрены примеры неточных параметров, достаточно естественно представляемых расширенными интервальными операциями. Однако, как мы увидим далее в этом разделе, некоторые типы неточных значений ведут себя как "не вполне интервальные".

Подобные ситуации возникают, в частности, в тех случаях, когда параметры некоторой системы определены с существенно более высокой точностью, чем параметры составляющих ее компонентов. К таким случаям можно отнести вид в2 семантического (п.4.1) типа неточности, т.е. те параметры, значения которых "смежны" по времени и/или пространству, - для них, по крайней мере, сложение и вычитание происходит по другим, не совсем интервальным законам.

6.4.1. В частности, это относится к граничащим друг с другом событиям или их этапам, разделяемым общим переходным процессом, который относится к обоим смежным событиям, определяя неточность их длительности.

Пример. Длительность импульса равна T1 с неточностью t1 + t2, где t1 и t2 - время переднего и заднего фронтов импульса (см. рис.); длительность паузы между импульсами равна T2 с той же неточностью, поскольку те же фронты являются началом и концом паузы; очевидно, что длительность n периодов импульс-пауза равна n*(T1 + T2 + t1 + t2) c той же неточностью t1 + t2, хотя интервальные операции дали бы в данном случае длительность n*(T1 + T2) c неточностью 2*n*(t1 + t2).



T1 T2






t1 t2



Еще пример.

Период "детство-отрочество" длится от рождения до 12-14 лет, юность от отрочества до 18-21 года; при сложении времени этих периодов их общая неточная граница аннигилирует, а при вычитании одного из них из суммы - восстанавливается.

6.4.2 Тот же эффект имеет место и для величин, смежных по пространственным отношениям.

Два примера:

- Граница города находится между 12-м и 13-м км по шоссе, дом расположен у 23 км. столба, т.е. в 10 - 11 км от границы города; таким образом, сумма имеет точность расстановки километровых столбов, т.е. метров, а слагаемые - километра.

- Поскольку между твердым ядром некоторого небесного тела, поясом магмы и внешней корой отсутствует достаточно определенная физическая граница, то геометрические размеры этих трех компонентов характеризуются неточностью, намного превышающей неточность размеров и массы всего тела, т.е. их суммы.

Заметим, что это относится, соответственно, и к массе - параметру, зависящему от геометрии тела и его компонентов.

6.4.3. К этой же категории можно отнести случаи, когда численность некоторой совокупности определена с более высокой точностью, чем численности ее частей, поскольку границы между этими частями достаточно размыты.

Пример.

Оценка количества учеников 6-го Б, едущих на лето в лагерь, остающихся в городе или отдыхающих с семьей, может быть весьма неточной в начале лета, когда еще не у всех окончательно определились летние планы, однако сумма числа ребят всех этих трех групп, т.е. численность класса, известна точно, или по крайней мере с гораздо более высокой точностью.

7. НЕТОЧНОСТЬ И ЕСТЕСТВЕННЫЙ РАЗБРОС ЗНАЧЕНИЙ

7.1. Базис генерализации

Многие виды неточности связаны с ситуациями, при которых величина неточного параметра определяется совокупностью более частных значений, размер которых непредсказуемым образом меняется в некоторых пределах.

Эту совокупность можно условно назвать базисом данного неточного параметра. Скажем, базисом длительности импульса в примере 6.4.1 является совокупность значений длительности индивидуальных импульсов, прошедших через прибор, который определил генерализованные значения параметров (период, амплитуду и т.п.) рассматриваемого импульсного сигнала.

Длительность же каждого индивидуального импульса зависит и от формы переходного процесса в данном частном случае и от конкретного момента этого переходного процесса, воспринимаемого как начало (конец) импульса тем устройством, на вход которого поступает сигнал.

7.2. Различные типы базиса

7.2.1. Заметим, что само определение генерализации значения некоторого параметра подразумевает наличие базиса и разброс значений параметра у элементов этого базиса. Соответственно, связь базиса с неточным значением - результатом генерализации может быть различной.

А. В некоторых случаях частные значения элементов базиса выступают в процессе генерализации явно:

- вес взрослой овчарки (на основе статистической информации о соответствующих измерениях веса конкретных собак),

- численность населения Москвы в 1993 г. (обобщение данных об учете населения по месяцам/неделям/дням),

- скорость течения реки (определяется генерализацией нескольких замеров), и т.п.

Б. В других случаях эти значения используются имплицитно, поскольку обобщение частных значений элементов базиса происходит внутри методики измерения, без их явного "прочитывания".

Так измерение температуры (воды, тела и т.д.) термометром происходит одновременно в целой совокупности точек подпространства, непосредственно соприкасающегося с датчиком, который суммирует определенным образом эти частные значения без разделения их друг от друга.

В. Существуют и промежуточные случаи, когда измеряемые частные значения элементов базиса разделяются внутри прибора, который экранирует эту информацию, предъявляя в качестве результата одно обобщенное значение: частота периодического сигнала в примере 6.4.1 замерялась как обобщенная оценка длительности каждого конкретного периода, имевшего место за время измерения.

7.2.2. Достаточно очевидно также, что базис различных параметров может существенно варьироваться по своему строению, в частности, быть дискретным либо континуальным.

В первом случае он состоит из конечного (граждане Монако, подводные лодки) или практически бесконечного (все зерна пшеницы, все молекулы воды) числа элементов, причем генерализация может производиться:

А. с учетом всех элементов базиса (ученики 6-ого А) или

Б. на основе представительной выборки при бесконечном базисе или конечном в тех случаях, когда учет всех его элементов затруднен либо оценка через выборку является достаточной для ситуационной точности генерализованного значения (все тот же вес овчарки).

Континуальный базис связан, как правило:

(i) с методической неточностью конкретного измерения любого физического параметра (п.4.1 г) - невозможностью замера в идеальной точке по времени и пространству: температура тела, толщина доски, скорость данного объекта в данный момент, и т.п., либо

(ii) с семантической неточностью (4.1 в), возникающей при аппроксимации реального, т.е. континуального, объекта более простым, идеализированным:

неточность поверхности геоида Земли имеет базисом континуум реальных точек ее поверхности,

расстояние между Москвой и Парижем (оба города принимаются за точки на карте) и т.п.

Противопоставление дискретного и континуального типов базиса также не носит абсолютного характера, а является контекстно зависимым. Так, базис параметров электрического тока является дискретным на том уровне модели, который представляет его как поток электронов. С повышением уровня модели, при котором учет по-электронной дискретности становится невозможен, базис получает континуальный характер. Однако на еще более высоком уровне параметры периодического переменного тока могут рассматриваться как генерализация дискретного базиса - совокупности отдельных периодов.

7.2.3 Связывая пп.7.2.1 и 7.2.2, отметим, что при обоих - дискретном и континуальном - типах базиса значения его могут использоваться генерализацией как явно, так и имплицитно:

определение скорости реки (континуальный базис) на основе нескольких замеров - пример явной генерализации на основе выборки;

любой электромагнитный измерительный прибор для измерения напряжения или силы переменного тока (дискретный базис) реализует имплицитную генерализацию отдельных периодов синусоидально меняющихся континуальных характеристик.

7.3. Распределение значений базиса

7.3.1 Базис любого параметра задает не только диапазон значений, но и их распределение. Это распределение не имеет отношения к собственно неточности, однако может использоваться непосредственно за границами неточности в тех случаях, когда она в связи с сужением базиса или контекста переходит в недоопределенность (гл.5).

Как уже отмечалось в [3] и [4], такое распределение может носить разный характер: быть отражением объективных статистических данных (вероятность), субъективных оценок (возможность), анализа частичной информации (правдоподобие) и т.п. Вне зависимости от способа формирования распределения оно выполняет одну основную задачу, - оценивает шансы каждого конкретного значения, принадлежащего данной недоопределенной величине, оказаться тем самым денотатом, который эта величина представляет.

Скажем, при таком-то распределении глубин реки в данном районе, каковы шансы, что в этой конкретной точке глубина равна 11 метрам? Таким образом, при решении многих практических задач с неточными параметрами, переходящих при сужении контекста в недоопределенные, распределение значений получает большую или меньшую предсказательную силу.

7.32. Рассмотрим подробнее пример: бочка (неточные 50 л) разливается по бутылкам емкостью 0.5 л. Пусть процедуры наполнения и в бочку, и в бутылки имеют устойчивый статистический разброс значений параметров (заметим, что это допущение, а не фундаментальное свойство любой реальной процедуры).

Возникает несколько проблем:

А. Что считать за точность бочки и бутылки? Кажется естественным выделить диапазон, включающий только статистически правдоподобные значения, отбросив очень редкие. Однако при этом, конечно, появляется определенный элемент ненадежности. Как известно, такая ненадежность (пусть как угодно малая) связана с любой оценкой, построенной на выборке, поскольку всегда возможно, что за пределами выборки осталось хотя бы одно значение, которое выходит за пределы диапазона распределения, полученного на ее основе.

Б. Если мы разливаем бочку, переливая в бутылки некоторый стандартный объем, то рискуем с определенным распределением вероятности получить меньшее или большее число бутылок (при одной, как правило, неполной). Таким образом, деление статистически неточного объема на меньший статистически неточный объем дает статистически неточное количество.

В. Если мы разливаем бочку точно на 100 бутылок процедурой равномерного наполнения, то получим другое распределение объема бутылки, которое будет зависеть от фактического объема бочки и неточности процедуры разливки.

Этот пример еще раз демонстрирует тонкую контекстную зависимость конкретных величин при соотнесении их с теми или иными НЕ-факторами. Вспомним наш пример из п.4.1(б): обычно при продаже бутылки жидкости достаточно сообщить покупателю, что объем ее равен 0.5 литра с точностью, например, 1%. Эта оценка есть ситуационная мера неточности объема жидкости, если она воспринимается как выходной параметр, и является мерой недоопределенности, если кто-то решит провести более точную процедуру измерения объема именно данной бутылки.

Результат такого измерения предсказуем с определенной вероятностью, правдоподобием и т.п., если имеется не только указанная оценка неточности/недоопределенности, но и распределение значений внутри ее.

Итак, распределение не является содержательным компонентом неточности в том смысле, который был закреплен нами за этим НЕ-фактором, но может продуктивно использоваться при переходах неточность - недоопределенность - неточность от генерализованного значения параметра к значению аналогичного параметра у объектов базиса.

8. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ НЕТОЧНОСТИ

8.1. Небезопасные упражнения

Последний аспект обсуждения неточности в данной работе - это возможность ее геометрической интерпретации. Графические образы всегда воспринимаются проще, чем более абстрактные представления тех же объектов. В связи с этим геометрия является традиционной областью наглядной интерпретации других математических аппаратов.

Попробуем воспользоваться эти методом для поиска достаточно убедительных вариантов представления неточности.

Следует сразу же оговориться, что это весьма рискованный путь. Выше уже подчеркивалась роковая для большинства исследований опасность подмены объекта моделирования "похожим" на него формальным объектом.

Я вполне сознаю высокую вероятность того, что и мы непроизвольно можем впасть в тот же грех, пытаясь осмысливать неточность в абстрактном мире геометрии, который коварен именно тем, что зрим и нагляден и тем самым очень похож на реальный, хотя, конечно, ни в коей мере не является таковым.

Однако в данном случае риск не является летальным для результата, поскольку мы обращаемся к геометрии не для того, чтобы понять или доопределить неточность, а чтобы примериться к различным возможностям ее формализации, работа над которой начнется только тогда, когда материал будет готов для создания соответствующего аппарата.

8.2. Неточность - вид из планиметрии

Ограничимся планиметрией и рассмотрим самые элементарные объекты - неточную точку и неточную прямую. Немедленно возникают далеко не простые вопросы:

А. Что такое неточная точка : - пара <неточный Х, неточный У>, т.е. прямоугольник? - неточный кружок с центром в ? С точки зрения интервального представления неточных переменных X и Y - явно первое, как представление пространственного объекта, например, точки на карте, - скорее второе.

Б. Что такое неточная прямая:

(i) уравнение У = А*Х + В с неточными А и В? или с неточными X и Y?

(ii) "широкая" прямая, ось которой проходит через центры образующих ее неточных точек? насколько эти центры могут отклоняться от оси прямой?

(iii) почти прямая, т.е. кривая, гармоники которой не превышают уровня неточности? не сводится ли (iii) к (ii)?

(iv) геометрическое место точек, каждые три из которых удовлетворяют требованию, что расстояние между крайними равно сумме расстояний между крайними и средней с заданной точностью?

В. Что такое "точка принадлежит прямой"? и т.п.

Возможно, что все эти варианты имеют право на представление того или иного вида неточности - все зависит от того, какую реальную проблему отражает данная модель.

8.3. Неточность по Гейзенбергу?

Можно представить (неточные? недоопределенные? нечто третье?) наборы параметров, подчиняющиеся своеобразному соотношению неопределенности Гейзенберга: чем точнее известен один/некоторые из параметров, тем менее точны остальные.

Например, свойство некоторого уравнения R(x,y)=0 таково, что каждому точному значению х или у соответствует определенное множество значений второго параметра, для нескольких точных значений пересечение соответствующих множеств.

Таким образом, чем менее точен один из параметров, тем более точен другой и наоборот. Можно говорить о "медиане" отношения R, которая соответствует тем парам значений х и у, точности которых равны.

Думаю, что и такая экзотическая модель может оказаться адекватной для определенных типов реальных ситуаций, причем, по-видимому, описанное поведение переменных не соответствует парадигме обоих рассмотренных НЕ-факторов - и неточности, и недоопределенности, хотя и имеет нечто общее с каждой из них.

8.4. Итак

Итак, рассмотренные в этой главе примеры еще раз показывают, что:

разрабатывая модель для реального явления (неточности), можно очень легко скатиться на искусственную метафору, полученную перенесением содержательного свойства на формальную среду - в данном случае, планиметрию;

следует внимательно отслеживать, что, собственно, мы собираемся представлять с помощью метафоры планиметрии: неточные величины, описываемые неточной - или точной - функциональной зависимостью (представленной неточной кривой/прямой), или операции над неточными топологическими объектами, или геометрическую интерпретацию неточной алгебры, или что-либо еще.

9. ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ

В этой статье, которая является обновленной версией препринта [1], я делаю попытку расширить сферу исследования НЕ-факторов, которое пока не выходило за рамки недоопределенности.

Задача этой работы - очертить проблему и поставить как можно больше вопросов самого разного плана. Поскольку исследование ведется на до-формальном уровне, причем оно только начато, то и проблема, и вопросы не могут формулироваться в достаточно точных терминах.

Более того, уже сейчас видно, что при следующей "прогонке" представленный материал должен претерпеть существенную перестройку, отражающую те взаимосвязи его составляющих, которые уже начали выявляться, хотя и не определились на данной фазе достаточно отчетливо. Вполне вероятно, что по мере продвижения вглубь многое из того, что обсуждалось выше, может оказаться весьма наивным - таков естественный риск постановочного этапа.

Резюмируя рассмотренный материал, мы отмечаем следующее.

А. Неточность в принятом здесь определении покрывает некоторый спектр сходных, но тем не менее различающихся факторов, которые надо научиться:

q достаточно надежно дифференцировать и

q представлять адекватными, а, следовательно, различающимися формальными аппаратами.

Б. Неточность весьма тесно связана с недоопределенностью и неоднозначностью - уточнение характера взаимодействия этих НЕ-факторов при изменении контекста требует дальнейшей разработки. Практически не затронутым осталось соотношение с нечеткостью такое сопоставление нуждается в специальном исследовании ввиду широкого разброса интерпретаций нечеткости в литературе.

В. Неточность свойственна всем - как простым, так и сложным - параметрам. Единственное исключение из этого правила - количество - может быть точным, но в достаточно узких контекстах.

Г. Выделены пять базовых типов неточности, различающиеся характером явлений, определяющих значения тех или иных параметров:

q объективная,

q ситуационная,

q семантическая,

q методическая и

q генерализации.

Перечисленные типы не являются сущностями одного ряда, поскольку неточность реальных параметров в реальных ситуациях формируется на основе их взаимодействия.

Д. Сделанные в гл.6 попытки моделировать неточность с помощью интервала более точных значений или некоторыми другими способами не позволяют выделить единого подхода, дающего удовлетворительный результат для всех реальных ситуаций. К этому следует добавить, что об интервальном представлении неточности можно говорить только для количественных параметров или для тех качественных, которые могут интерпретироваться количественными, как, например, для некоторых лингвистических переменных [6]. В других же случаях неточность передается иерархией значений: сошлемся на рассмотренный пример с параметром национальность или, скажем, обозначение материала для однородного объекта. В обоих этих случаях неточность является упрощенным отражением более сложной реальной картины - этнической генеалогии в первом случае и более детального состава веществ - во втором.

Все вышесказанное относилось к неточным значениям параметров или, более корректно, к значениям неточных параметров. Но, естественно, можно говорить и о неточных операциях, функциях, отношениях.

При этом различимы несколько уровней неточности неточных отношений:

q нулевой: отношение точное, но связывает неточные аргументы,

q первый: отношение включает неточные коэффициенты,

q второй: отношение неточно (приблизительно) представляет исходное отношение-денотат.

Исследование более высоких уровней планируется начать на этапе, когда сложится достаточно четкая концепция "устройства" рассмотренного здесь нулевого.

* * *

Я благодарен всем коллегам, принявшим участие в обсуждении данной работы на различных стадиях ее подготовки, - их замечания помогли мне во многом исправить и дополнить представленный материал.

Особо мне хотелось бы поблагодарить С.А.Шарова, обратившего мое внимание на Предисловие Канта к его Пролегоменам, послужившим как дополнительным источником моральной поддержки, так и материалом для цитаты и эпиграфа.

Список литературы

1. Нариньяни А.С. Неточность как НЕ-фактор. Попытка доформального анализа. - Москва-Новосибирск, 1994. Препринт РосНИИ ИИ N 2, 34 с.

2. Нариньяни А.С. Недоопределенные модели и операции с недоопределенными значениями. - Препринт ВЦ СО АН СССР, N 400, 1982.

3. Нариньяни А.С. Недоопределенность в системе представления и обработки знаний. - Техническая кибернетика, М,1986, N 5, с.3-28

4. Нариньяни А.С. НЕ-факторы и инженерия знаний: от наивной формализации к естественной прагматике В сб. Труды IV Национальной конференции Искусственный Интеллект94.v.1, Рыбинск 1994

5. Нариньяни А.С., Кандрашина Е.Ю. "Эскиз модели пространства в системе представления знаний о действительности". Препринт ВЦ СО АН СССР, N 368, 1982.

6. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. М: Мир, 1976.

7. Фреге Г. Смысл и денотат/Семиотика и информатика, М, 1977, вып. 8, сс.181-210.






http://www.artint.ru
Рейтинг всех персональных страниц

Избранные публикации

Как стать нашим автором?
Прислать нам свою биографию или статью

Присылайте нам любой материал и, если он не содержит сведений запрещенных к публикации
в СМИ законом и соответствует политике нашего портала, он будет опубликован