Оценка результатов, полученных с помощью АНС
Для эффективного использования АНС в области финансов и экономики важно продемонстрировать высокую информативность получаемых результатов. В частном случае решения задачи оптимального инвестирования информативность моделей АНС можно измерить путем оценки эффективности (прибыли) и риска инвестирования в ценные бумаги эмитентов. Полученные результаты следует сравнить с результатами применения эталонных методов (например, с эффективностью работы моделей, основанных на более традиционных подходах). Прибыль обычно сопоставляется с риском, неразрывно связанным с процессом извлечения прибыли. Соотношение риск . прибыль можно также сравнивать с общепринятыми стандартами (например, со средними рыночными показателями или с показателями лучших инвестиционных компаний). Соотношение между скорректированной по риску прибылью и затратами на инвестирование дает представление об эффективности инвестиционной стратегии.
Методология оценки результатов, полученных с помощью АНС, представляется очень важной с точки зрения более конкретного применения этого алгоритма в области финансов и экономики. В общем случае оценка результатов может производиться следующим образом:
1. Конечным результатом кластеризации является количество полученных кластеров. Максимум может равняться числу наблюдений, если размер плоскости выходных изображений слишком велик, минимум . единице, если в данных отсутствует тенденция к кластеризации.
Если одной из целей использования АНС является сжатие данных, то желаемый итог будет, по-видимому, располагаться ближе к последнему пределу. Оптимальное число кластеров зависит, однако, от исходных данных, целей исследования и предназначения АНС. Число образовавшихся на плоскости выходных параметров кластеров можно рассматривать как своеобразный «эффект» кластеризации.
2. Другим результатом кластеризации является степень различий между кластерами. Кластеров может быть много или мало, они могут быть похожими друг на друга и в значительной степени отличаться. Качество кластеризации зависит от этого нечетко формулируемого результата. Предположим, что качество кластеризации измеряется по шкале от 0 до 100. Оно будет низким, если наблюдается слабая тенденция к кластеризации, число кластеров мало, а различия между ними незначительны.
Качество кластеризации будет высоким, если в результате процесса кластеризации получается множество кластеров или кластеры, которые очень сильно отличаются друг от друга (конкретный результат зависит от целей исследования). Низкое качество кластеризации указывает, что значительной разницы между кластерами, полученными с помощью АНС, не существует. Высокое качество кластеризации может указывать на множество различий. Результат кластеризации с помощью АНС следует сравнить с результатами (эталонами), полученными при использовании других способов кластеризации.
3. Устойчивость результатов кластеризации представляет собой еще один результат анализа. Важно оценить, насколько будут сходны результаты, полученные на разных подмножествах данных из одного входного множества. Кроме этого важна устойчивость результатов к информационным помехам и выбросам. Немаловажна также такая характеристика, как устойчивость числа кластеров по отношению к изменению порога кластеризации.