Для обработки очень больших наборов


Для обработки очень больших наборов данных используется иерархическое решение. Например, сначала весь массив входных данных отображается на небольшую по размерности плоскость выходных параметров. При этом каждый нейрон может содержать тысячи объектов. Затем из общего массива данных делаются выборки, соответствующие каждому из таких нейронов, и для них с помощью АНС строятся новые плоскости выходных изображении, каждый нейрон которых содержит в среднем уже десятки объектов. Затем проводится построение с более высоким разрешением и т.д. Как правило, используется от 2 до 5 уровней иерархии. Иногда более детальные изображения строятся не для каждого нейрона плоскости с низким разрешением, а для совокупностей нейронов, образующих кластеры. Это вносит осмысленность в иерархическую кластеризацию. Таким образом, любая типичная область более высокого уровня может быть (по аналогии с картографированием) увеличена для уточнения дополнительных подробностей. В ходе анализа финансово-экономических показателей предприятий необходимо использовать переменные, характеризующие весь спектр финансовых данных. Такие показатели должны давать представление об экономических результатах промышленных компаний в отношении к используемым ресурсам (валовая прибыль, чистая прибыль, платежеспособность, производительность и рентабельность), их относительным затратам (промежуточное потребление, расходы на персонал и финансовые обязательства), а также их финансовой структуре (размер и структура капитала компании, сумма и структура задолженности, резервные фонды) и структуре рисков. Целесообразно задействовать все имеющиеся в наличии переменные и варианты, не исключая предварительно каких-либо реализаций или паттернов на том основании, что они могут иметь атипические значения. Как правило, берется от 16 до 32 основных финансовых показателей из балансов и из отчетов о прибылях и убытках предприятий. Слишком малое число показателей не позволяет обосновать кластеризацию. Необходимым предварительным условием является наличие однородной финансовой информации о разных компаниях. Необходимо контролировать сбор данных и выверку балансов и отчетов о прибылях и убытках компаний, действующих в различных секторах экономики, так как каждый сектор имеет свои особенности, отражающиеся в структуре данных. Кроме этого, если целью анализа является не кластеризация, а определение какихлибо обобщенных характеристик компаний, предприятия в одну выборку должны подбираться с учетом их специализации и размера. Компании, занимающиеся реализацией крупных долгосрочных проектов, должны составлять отдельную выборку на том основании, что их финансовая отчетность имеет тенденцию варьироваться на различных стадиях осуществления этих проектов. В отдельные группы должны попадать очень мелкие предприятия, деятельность которых не может рассматриваться как устойчивый бизнес, и предприятия, масштабы деятельности которых значительно превосходят средний уровень.
Содержание раздела