Современные методы выявления фальсификации отчетности |

Автор Алексей Ахрамейко, эксперт, специализация «Финансовая диагностика предприятий» Алексей Ахрамейко, эксперт, специализация «Финансовая диагностика предприятий»
Номер № 02/2020
Количество просмотров 230
Автор отчетность, отчетность, финансы, финансы, фроды фроды

Современное развитие области выявления фальсификации отчетности основано на использовании методов интеллектуального анализа данных. В статье представлен обзор практики использования этих методов.

Вопросы применения методов интеллектуального анализа данных для выявления фальсификации отчетности активно изучаются учеными и практиками. Предложена1 классификация финансовых мошенничеств, основанная на структуре финансовой преступности Федерального бюро расследований США, которая является одним из лучших бенчмарков в данной области. Обычно выделяют шесть классов приложений интеллектуального анализа данных: классификация, кластеризация, прогнозирование, обнаружение выбросов, регрессия и визуализация, в рамках которых уже выделяются методы интеллектуального анализа данных.

  1. Классификация. Модель классификации используется для разделения объектов на разные классы. Она строится на обучающей выборке объектов и затем используется на целевой выборке объектов для определения класса, к которому будет отнесен неизвестный объект. Классы являются предопределенными, дискретными и неупорядоченными. Методы классификации включают нейронные сети, наивный байесовский метод, деревья решений и метод опорных векторов. Классификация является одной из наиболее распространенных моделей обучения при применении интеллектуального анализа данных для обнаружения мошенничества.

  2. Кластеризация. Кластеризация используется для разделения объектов на ранее неизвестные концептуально значимые группы (то есть кластеры), причем объекты в кластере похожи друг на друга, но очень отличаются от объектов в других кластерах. Кластеризация также известна как сегментация или разбиение данных и рассматривается как вариант неконтролируемой классификации. Наиболее распространенными методами кластеризации являются метод K-ближайшего соседа, наивный Байесовский классификатор и самоорганизующиеся карты.

  3. Прогнозирование. Прогнозирование оценивает числовые и упорядоченные будущие значения на основе шаблонов набора данных. Следует отметить, что для прогнозирования атрибут, для которого прогнозируется его значение, является непрерывным (упорядоченным), а не категориальным (дискретным и неупорядоченным). Этот атрибут называется прогнозируемым атрибутом. Наиболее часто используемыми методами прогнозирования являются нейронные сети и логистическая модель.

  4. Выявление аномалий или обнаружение выбросов. Обнаружение выбросов используется для измерения «расстояния» между объектами данных, чтобы обнаружить те объекты, которые существенно отличаются или не соответствуют оставшемуся набору данных2. Данные, которые имеют характеристики, отличные от остальной части данных, называются выбросами. Проблема обнаружения выбросов/аномалий является одной из самых фундаментальных проблем в интеллектуальном анализе данных. Обычно используется метод обучения с подкреплением.

  5. Регрессия. Регрессия — это статистическая методология, используемая для выявления взаимосвязи между одной или несколькими независимыми переменными и зависимой переменной (которая непрерывна). Многие эмпирические исследования используют логистическую регрессию в качестве бенчмарка. Обычно используют логистическую и линейную регрессию.

  6. Визуализация. Визуализация относится к легко понятному представлению данных и к методологии, которая преобразует сложные характеристики данных в четкие образы, чтобы позволить пользователям увидеть сложные образы или взаимосвязи в данных, обнаруженные в процессе интеллектуального анализа данных. Исследователи используют возможности визуальной системы человека обнаруживать образы, создав набор инструментов и приложений, которые гибко кодируют данные с использованием цвета, положения, размера и других визуальных характеристик. Визуализация лучше всего подходит для предоставления сложных образов посредством четкого представления данных.

Рассмотрим конкретные методы и модели интеллектуального анализа данных.

Модели регрессии. Большинство из них основаны на логистической регрессии, ступенчато-логистической регрессии, методе принятия многокритериальных решений и экспоненциальной обобщенной бета-2. Логистическая модель представляет собой обобщенную линейную модель, которая используется для биномиальной регрессии, в которой переменные предиктора могут быть числовыми или категориальными. Логистическая регрессия позволяет эффективно выявлять фальсифицированные финансовые отчеты. Для этих же целей также использовались методы Probit и Logit. Модели обнаружения мошенничества, основанные на логистической регрессии, широко распространены в литературе, поскольку их точность может достигать 95,1%.

Нейронные сети. Нейронные сети представляют собой нелинейные статистические инструменты моделирования данных, основной идеей которых является использование по аналогии с функциональностью человеческого мозга набора взаимосвязанных узлов. Нейронные сети широко применяются в классификации и кластеризации, поэтому они популярны и при построении систем обнаружения фальсификации отчетности. Гибридные модели, основанные на нечетких нейронных сетях, по своим характеристикам превосходят традиционные статистические модели.

Байесовская сеть. Байесовская сеть — это графовая вероятностная модель, представляющая собой множество переменных и их вероятностных зависимостей по Байесу. Байесовские сети превосходят по точности нейронные сети и методы деревьев решений и достигает точности классификации 90,3%.

Деревья решений. Дерево решений — это инструмент поддержки принятия решений с древовидной структурой, где каждый узел представляет тест на атрибут, а каждая ветвь представляет возможные последствия. Таким образом, прогнозирующая модель пытается разделить наблюдения на взаимоисключающие подгруппы и используется для задач интеллектуального анализа данных и машинного обучения. Эти деревья могут быть построены с помощью алгоритмов машинного обучения, таких как ID3, CART и C4.5 (C5.0). Опыт использования деревьев решений для выявления и прогнозирования мошенничества с финансовой отчетностью представлен в 3.

Наивный байесовский классификатор. Наивный байесовский классификатор используется как простой вероятностный классификатор, основанный на байесовском условном правдоподобии.

Метод ближайшего соседа. Метод ближайшего соседа является подходом классификации, основанным на сходстве. Этот метод также известен как метод K-ближайшего соседа.

Нечеткая логика и генетические алгоритмы. Модель нечеткой логики для обнаружения мошенничества была реализована в некоторых исследованиях4, точность модели составила 86,7%. Эта модель была развита5, точность составила 76,7%.

При рассмотрении 6 подхода для выявления мошенничества в финансовой отчетности на основе генетического алгоритма обнаружено, что аномалии являются ценными показателями для характеристики корпоративного финансового поведения, и что анализ этих показателей с течением времени представляет собой эффективный способ выявления потенциально мошеннического поведения.

При выявлении фальсификации отчетности известной популярностью пользуются и экспертные системы.

Перечисленные методы могут быть использованы как самостоятельно, так и в комбинации. 

 

1 Ngai, E.W.T., Hu, Y., Wong, Y. H., Chen, Y., & Sun, X. (2010). The application of data mining techniques in financial fraud detection: A classification framework and an academic review of literature, Decision Support System (2010), doi:10.1016/j.dss.2010.08.006.

2 Han, J., & Kamber, M. (2006). Data Mining: Concepts and Techniques, Second edition, Morgan Kaufmann Publishers, 2006, pp. 285–464.

3 Bai, B., Yen, J. & Yang. X. (2008). False financial statements: characteristics of China’s listed companies and CART detecting approach, International Journal of Information Technology & Decision Making 7 (2) 339359.

4 Lenard, M. J., & Alam, P. (2004). The use of fuzzy logic and expert reasoning for knowledge management and discovery of financial reporting fraud. In H. Nemati and C. Barko (Eds.), Hershey, PA: Idea Group, Inc.

5 Lenard, M. J., Watkins, A.L., and Alam, P. (2007). Effective use of integrated decision making: An advanced technology model for evaluating fraud in service-based computer and technology firms. The Journal of Emerging Technologies in Accounting 4(1): 123–137.

6 Hoogs, B., Kiehl, T., Lacomb, C., & Senturk, D. (2007). A genetic algorithm approach to detecting temporal patterns indicative of financial statement fraud, Intelligent Systems in Accounting, Finance and Management, 2007, vol. 15: 41–56.

<...>


Полный текст документа находится в платном доступе только для зарегистрированных пользователей. Если у Вас уже есть доступ, пожалуйста, войдите в систему.

Войдите под своей учетной записью

Поделиться в соцсетях:

Возврат к списку



Свежие статьи
Сейчас читают

1. Оплата QR-кодом как альтернатива эквайрингу

Метод оплаты без использования терминала, при помощи QR-кода будет интересен интернет-магазинам, кафе, парикмахерским, такси, любым торговым/сервисным предприятиям, а также самозанятым гражданам (ремесленникам). Оплата QR-кодом позволяет бизнес-клиентам принимать платежи без установки терминалов, а их покупателям – оплачивать товары и услуги в один клик - отсканировав QR-код при помощи смартфона!

2. Приостановка действия базового документа еврозоны не окажет значимой поддержки евровалюте

На горизонте нескольких месяцев, в случае необходимости продления карантина, рост финансовой нагрузки на государства может вылиться в долговой кризис, что, напротив, ускорит падение к уровням 2015-2017 годов - ниже 1,05 евро за доллар. Если цены на нефть останутся на низком уровне, то на среднесрочном горизонте Европа сможет рассчитывать на положительный эффект от низких цен на энергоносители. В этом случае повысится вероятность укрепления евро.

3. Белорусским предприятиям планируется предоставить налоговые каникулы

Белорусским предприятиям планируется предоставить налоговые каникулы. Об этом сегодня журналистам в парламенте сообщил министр по налогам и сборам Сергей Наливайко. В свою очередь заместитель председателя правления Национального банка Сергей Калечиц прокомментировал возможность предоставления кредитных каникул предприятиям. Пакет мер предусматривает временные послабления для банков с точки зрения требований по управлению рисками.

4. МОТ прогнозирует уровень безработицы. S&P говорит о дефолтах

Около 25 млн человек могут остаться без работы из-за пандемии коронавируса, если правительства стран не отреагируют, говорится в заявлении Международной организации труда (МОТ). В S&P прогнозируют рост корпоративных дефолтов в США и Европе на 10% в текущем году. Ущерб кредитоспособности нанесут падение денежного потока, более жесткие условия финансирования и обвал цен на нефть, считают аналитики.

5. Прогноз: Украину ждет падение ВВП на 4−9% и курс 30−35 грн/USD

Этот прогноз базовый, но то, как развивается ситуация сейчас, свидетельствует, что он может оказаться оптимистическим. ВВП Украины может упасть в этом году на 9%, если карантин будет продлен до июня-июля. В таком случае гривня подешевеет к доллару до 35 грн/USD. Падение на 9% - это такое же падение, как было в Украине в 2015 году.

6. Романчук: Нас ждёт настоящий шок и это не шутки

Коронавирус – лишь часть крайне негативного сценария для Беларуси. Обвал экспорта сырьевых ресурсов, стопор многих секторов (отдых, путешествия, общественное питание, транспорт, логистика), резкое снижение активности промышленных предприятий, мощный удар по бюджету страны, по бюджетам бизнесов, банков и домашних хозяйств – всё это материализуется на наших глазах.