Fraudit 이란?
Fraudit 이란 데이터 감사 및 데이터 분석에 사용되는 소프트웨어로 python 기반으로 만들어진 software이다.
Fraudit이란 부정적발, 분식회계탐지 등을 목적으로 개발되었으나, 데이터 분석 툴로도 확장성이 뛰어난 software이다.
Fraudit 사용의 장점
Fraudit의 사용 장점 | |
level 1 | 기본적인 데이터 분석 단계 지원 절차 |
level 2 | level1 절차를 결합하여 일반 분석가도 강력한 분석이 가능하게 하는 기능 |
level 3 | level2에 전문가 시스템을 사용하여 회계부정을 자동 발견하는 기능 |
Fraudit 특징
Fraudit은 python을 기반으로 설계되어, python의 라이브러리들을 분석 목적에 맞게 사용이 가능하다.
Fraudit은 GUI에서 사용자가수행한모든 결과를 스크립트 코드로 확인할 수 있다.
사용자가 Fraudit 함수를 알지 못해도 Console창을 통해 쉽게 알 수 있고, 자동화 절차를 수행할 수 있는 python 코드도 작성이 가능하다. 또한 사용자가 제대로된 python 기초 코드만 이해하고 있어도, 아주 효율적인 분석이 가능하다.
Fraudit은 인공지능(딥러닝, 머신러닝) 분석 기법을 이용할 수 있다.(상용 버전만 가능)
Fraudit vs Excel 차이
Excel은 아주 오래된 수치 분석 및 차트 어플리케이션으로 ad-hoc(임시 분석)에 적합한 툴이다.
재무, 회계 계산에는 Excel이 아주 적합하지만, 쿼리 분석에는 그렇지 않다.
또한 필터링 기능이 있으나 그루핑(group), 요약(summary), 매칭(match), 조인(join) 등을 전문적인 처리에 한계가 있다.
Excel은 100만개의 record를 처리할 수 있는데 반해,
Fraudit은 수천만개의 대규모 데이터 베이스를 사용하여 작업이 가능하다.
Fraudit은 Excel에서 불가능한 규모의 데이터 처리가 가능하며, 그루핑, 요약, 매칭, 조인 등의 기능을 매우 손쉽게 사용 가능하다.
(개인적인 생각이지만... 몇백만개 이상의 데이터를 다루려면 일정 성능 이상의 데스크탑이 필요하다, gpu 필수...)
Fraudit - Numpy, Pandas
- Numpy
Fraudit에는 기본적으로 Numpy가 설치되므로 Numpy 기능을 사용할 수 있다.
Fraudit은 기업데이터에 초점을 맞추고 있으나 Numpy는 선형대수 등 과학적 목적에 초점을 맞춘다.
Numpy는 array(배열) 스토리지 및 표시에 특화되어 있으나, array 조작, 수학 등에 초점을 맞추고 있고, Numpy 는 큰 행렬의 데이터로 빈셀을 포함하지 않는게 일반적이다.
- Pandas
pandas 라이브러리는 pandas 자체만으로도 2차원 표형태의 분석 패키지이다.
pandas는 DataFrame을 하나의 객체로 columns, row를 분리하여 여러 기능을 추가하기 위해 pandas 자체의 사용법에 익숙해져야 한다.
Fraudit은 pandas와 유사한 테이블을 주로 다루고 있으나, columns/row를 별도로 구분하여 사용자가 직접 조건문을 적용하기가 쉽다.
Fraudit은 pandas를 Fraudit shell(console)에서 그대로 사용가능하고, Fraudit 테이블과 pandas 데이터프레임을 서로 호환하는 함수를 가지고 있어 필요한 데이터만 추출하고 데이터 분석에 유리하다.
'데이터자격증 > 재무빅데이터분석사FDA2급 실기' 카테고리의 다른 글
재무빅데이터분석사(FDA 2급) 실기 - Fraudit 데이터 형식 Datㄷtime (0) | 2023.01.09 |
---|---|
재무빅데이터분석사(FDA 2급) 실기 - python 산술 연산자, 비교연산자, 식별 연산자, 복합연산자 (0) | 2022.12.22 |
재무빅데이터분석사(FDA 2급) 실기 - python 변수 설정, 변수명 규칙, 변수명 여러개 만들기, python 금액 3자리수 구분 (0) | 2022.12.22 |
재무빅데이터분석사(FDA 2급) 실기 - Fraudit 설치 (0) | 2022.12.19 |
댓글