본문 바로가기
데이터자격증/재무빅데이터분석사FDA2급 실기

재무빅데이터분석사(FDA 2급) 실기 - Fraudit 개요

by orangecode 2023. 1. 7.
728x90

 

Fraudit 이란?

Fraudit 이란 데이터 감사 및 데이터 분석에 사용되는 소프트웨어로 python 기반으로 만들어진 software이다.

 

Fraudit이란 부정적발, 분식회계탐지 등을 목적으로 개발되었으나, 데이터 분석 툴로도 확장성이 뛰어난 software이다.

 

Fraudit 사용의 장점

Fraudit의 사용 장점
level 1 기본적인 데이터 분석 단계 지원 절차
level 2 level1 절차를 결합하여 일반 분석가도 강력한 분석이 가능하게 하는 기능
level 3 level2에 전문가 시스템을 사용하여 회계부정을 자동 발견하는 기능

 

 

Fraudit 특징

Fraudit은 python을 기반으로 설계되어, python의 라이브러리들을 분석 목적에 맞게 사용이 가능하다.

 

Fraudit은 GUI에서 사용자가수행한모든 결과를 스크립트 코드로 확인할 수 있다. 

사용자가 Fraudit 함수를 알지 못해도 Console창을 통해 쉽게 알 수 있고, 자동화 절차를 수행할 수 있는 python 코드도 작성이 가능하다. 또한 사용자가 제대로된 python 기초 코드만 이해하고 있어도, 아주 효율적인 분석이 가능하다.

 

Fraudit은 인공지능(딥러닝, 머신러닝) 분석 기법을 이용할 수 있다.(상용 버전만 가능)

 

 

Fraudit  vs Excel 차이

Excel은 아주 오래된 수치 분석 및 차트 어플리케이션으로 ad-hoc(임시 분석)에 적합한 툴이다.

재무, 회계 계산에는 Excel이 아주 적합하지만, 쿼리 분석에는 그렇지 않다.

또한 필터링 기능이 있으나 그루핑(group), 요약(summary), 매칭(match), 조인(join) 등을 전문적인 처리에 한계가 있다.

 

 

Excel은 100만개의 record를 처리할 수 있는데 반해,

Fraudit은 수천만개의 대규모 데이터 베이스를 사용하여 작업이 가능하다. 

 

Fraudit은 Excel에서 불가능한 규모의 데이터 처리가 가능하며, 그루핑, 요약, 매칭, 조인 등의 기능을 매우 손쉽게 사용 가능하다.

 

(개인적인 생각이지만... 몇백만개 이상의 데이터를 다루려면 일정 성능 이상의 데스크탑이 필요하다, gpu 필수...)

 

 

Fraudit - Numpy, Pandas

- Numpy

Fraudit에는 기본적으로 Numpy가 설치되므로 Numpy 기능을 사용할 수 있다.

Fraudit은 기업데이터에 초점을 맞추고 있으나 Numpy는 선형대수 등 과학적 목적에 초점을 맞춘다. 

 

Numpy는 array(배열) 스토리지 및 표시에 특화되어 있으나, array 조작, 수학 등에 초점을 맞추고 있고, Numpy 는 큰 행렬의 데이터로 빈셀을 포함하지 않는게 일반적이다.

 

 

- Pandas

pandas 라이브러리는 pandas 자체만으로도 2차원 표형태의 분석 패키지이다.

pandas는 DataFrame을 하나의 객체로 columns, row를 분리하여 여러 기능을 추가하기 위해 pandas 자체의 사용법에 익숙해져야 한다.

 

Fraudit은 pandas와 유사한 테이블을 주로 다루고 있으나, columns/row를 별도로 구분하여 사용자가 직접 조건문을 적용하기가 쉽다.

 

Fraudit은 pandas를 Fraudit shell(console)에서 그대로 사용가능하고, Fraudit 테이블과 pandas 데이터프레임을 서로 호환하는 함수를 가지고 있어 필요한 데이터만 추출하고 데이터 분석에 유리하다.

 

반응형

댓글