В статье рассматривается проблема исследования свойств объектов исходного пространства признаков с целью выявления закономерностей их отображения на классы определенных характеристик, что реализуется разработанным в работе алгоритмом, ориентированным на решение задачи кластеризации на основе метода последовательного выявления кластеров как в четкой постановке, так и исходя из нечетких представлений рассматриваемых характеристик. . Известно, что упорядочение знаний в когнитивных структурах наряду с другими факторами происходит также на основе оценки семантической близости понятий, расположенных в пространстве, изучение которого было произведено еще в начале прошлого века. Выявление закономерности расположения объектов указанного пространства позволили ввести понятие кластеров, отражающих некоторую типовую ситуацию. Поскольку, разработка интеллектуальных систем производится, как правило, с учетом интеллектуальных принципов, в большинстве из них упорядочение признаков, объектов и понятий производится методами кластерного анализа, интенсивное развитие которого отмечается к настоящему времени и, в определенной мере, связано с интересами Data Mining, Big Data и т.д. Таким образом можно предположить, что наряду с исследованиями заданного пространства признаков с позиций ассоциативных отношений его объектов, дерева решений, классификации целесообразно проведение анализа системы средствами кластерного анализа.
Следуем иметь в виду, что методы многомерной классификации ориентированы на выявление множества объектов, характеризующихся совокупностью признаков, определенных классов, что представляется в плоскости кластерного и дискриминантного анализа и, как правило, предполагает дополнительного рассмотрения задачи оценки информационности признаков. Это имеет важное значение при адаптации указанных подходов к большим и сверхбольшим объемам информации, когда кластеризация, в том числе, рассматривается как стартовый этап ее исследования и предполагает соответствие заданному критерию оптимальности как функционала, отражающего эффективность выявления кластеров, к примеру в виде внутригрупповой суммы квадратов отклонения:
Таким образом, если основная проблема классификации может восприниматься в определении принадлежности заданного вектора признаков тому или иному числу заранее известных классов, то кластеризация представляется, как классификация без обучающейся выборки с символами классов, При этом алгоритмы кластеризации в соответствии с подобием образов, традиционно, рассматривают эквивалентные образы в составе одного кластера, что стимулирует использование таких подходов в операциях на базах знаний интеллектуальных систем , а также в задачах по сжатию и исследованию свойств исследуемых объектов. Большей частью указанные подходы ориентированы на решение задач оптимизации, которая предполагает существование решения, удовлетворяющего системе ограничений и минимизирующих или максимизирующих целевую функцию.
Ключевые слова. Классы, кластеры, сходство объектов, расстояние между кластерами, нечеткие характеристики.