"В.Н.Щеглов. Логические модели смерти от злокачественных новообразований" - читать интересную книгу автора

В.Н. Щеглов

Логические модели смерти от злокачественных новообразований, сопутствующих
заболеваний и демографического статуса населения тульской области,
проживавшего в местности, пораженной в результате аварии на Чернобыльской
АЭС


1. Введение

Для построения моделей (М) была использована программа "искусственного
интеллекта" - вычисление алгебраических моделей конструктивной
(интуиционистской) логики ([1, 2], см. там же дополнительные ссылки на
литературу; необходимые программы были выполнены В.Ф. Бучелем). М вычисляет
тупиковые дизъюнктивные формы (АМКЛ в интервальном, и/или булевом и/или
вообще в виде значений k-значной логики). Для наглядности представим такую М
в виде следующего набора конъюнкций:

К*1 V К*2 V ... V - (K1 V K2 V ... ) -> Z = 1,

где К = (а1 < X1 < б1) & ... (аr < Xr < бr), причем К* относятся к целевой
модели и имеют свою порядковую нумерацию. Далее, & - логическая связка
конъюнкция ("и"), r - число интервалов (а, б), т. е. ранг К, V - логическая
связка дизъюнкция ("или"), - константа "ложь", "отрицание", -> - логическая
связка импликация ("если, то") и Z - цель исследования (обычно в булевом
виде, Z = 1 - проживание в пораженной радиацией местности). В данной работе
некоторые переменные Xi (i = 1, 2, ... ) будут булевыми, в этом случае при
обнаружении болезни X = 1, при ее отсутствии X = 0.
После вычисления К рассчитываются их оценки Г - число (повторяемость)
каждой К в выборке и множества, соответствующие Г (номера ликвидаторов),
затем упорядочиваются все К по их Г. Начиная с К с наибольшей Г строится
объединение множеств, соответствующих этим упорядоченным К. Отбрасываются те
из них, множества (соответствующие Г) которых входят в объединенное
множество всех ранее отобранных более "мощных" К. В итоге строится тупиковая
дизъюнктивная форма. Ошибка М рассчитывается следующим простым способом.
Известно, что идеальному генератору случая соответствует АМКЛ, где все Г =
1. Если после вычисления М удалить из исходного массива какую-либо одну
строку - ее Z все равно будет распознана с помощью К, для которых Г = 2 или
больше; однако возможна ошибка, если у некоторой К Г = 1 (полагаем, что
структура М мало меняется при удалении одной строки для достаточно большой
выборки). Будем называть максимальной ошибкой p для М суммарное число К, для
которых Г = 1, отнесенное к общему числу строк выборки. Эта ошибка в среднем
для приводимых здесь моделей приблизительно равна 5% (если учитываются все
вычисленные К по заданной выборке).
Программа построения АМКЛ предназначена для исследования сложных систем
в динамике. Предполагается, что эти системы зависят также и от "скрытых"
(незарегистрированных) переменных, медленно эволюционирующих во времени. Для
того, чтобы сделать К мало зависящими от этих переменных, сам алгоритм
построен на сопоставлении каждой целевой строки со своей окрестностью не
целевых строк при вычислении ЦМ; аналогично вычисляется и МК.