본문 바로가기

전체 글134

python 증권데이터 분석 - 웹 스크래핑(웹 크롤링), HTML 예시, 한국거래소 상장법인목록 가져오기 웹 스크래핑(웹 크롤링) 웹 스크래핑(웹 크롤링)이란 웹페이지에서 자신이 원하는 데이터를 추출하는 기법을 말한다. 한국거래소 시장 정보, 한국은행 경제통계시스템, 공공 데이터포털 등 증권데이터를 비롯데 다양한 데이터를 엑셀 형태로 수집이 가능하다. 또한 네이버 금융, 다음금융 등 포털 사이트에서 증권 관련 데이터를 직접 웹 스크랩를 통해 정보를 수집할 수 있다. 한국거래소에서 제공하는 상장법인 목록과 네이버 금융 웹 스크래핑을 통해 데이터 분석을 해볼 것이다. 한국거래소 기업공시채널 상장법인목록 가져오기 한국거래소 기업공시채널(https://kind.krx.co.kr/main)의 '상장법인상세정보' → '상장법인목록' 이동 엑셀 파일을 다운로드 한다. 상장법인목록 EXCEL 파일인 '상장법인목록.xls'.. 2022. 12. 23.
python 증권데이터 분석 - 회귀 분석과 상관관계, KOSPI 다우존스 회귀분석 회귀 분석과 상관관계 회귀분석이란 데이터의 상관관계를 분석하는데 사용되는 통계분석 방법을 말한다. 회귀분석은 회귀 모형을 설정한 뒤, 실제로 관측된 표본을 대상으로 회귀 모형의 계수를 추정한다. 독립변수라 불리는 하나 이상의 변수, 종속변수라 불리는 하나의 변수 간의 관계를 나타내는 회귀식이 도출되면 임의의 독립변수에 대해 종속 변수 값을 추측해볼 수 있는데 이를 예측(prediction)이라고 한다. 회귀라는 단어는 영국의 통계학자 프랜시스 골턴(Francis Galton)이 수행한 부모 자식간 키의 상관관계 연구에서 유래되었다. 골턴의 연구에서 키가 매우 큰 부모의 자식은 부모들보다 대부분 작고, 키가 작은 부모의 자식은 작지만 부모들보다 크다는 사실을 발견했다. 키는 평균적으로 회귀하려는 경향이 있.. 2022. 12. 23.
python 증권데이터 분석 - 최대손실낙폭 MDD(KOSPI MDD구하기) MDD 최대 손실 낙폭 Maximum Drawdown : MDD 최대손실 낙폭은 특정 기간에 발생한 최고점에서 최저점까지의 가장 큰 손실을 의미한다. 퀀트 투자에서는 수익률을 높이는 거도 중요하지만 MDD를 최소한으로 낮추는 것이 더 낫다고 이야할 정도로 중요한 지표이다. MDD는 특정기간동안 최대 얼마의 손실이 날 수 있는지 나타내주는 지표이다. KOSPI의 MDD KOSPI(Korea Composite Stock Price Index, 한국종합주가지수)는 1983년 처음으로 발표되어, 1980년 1월 4일부터 상장된 모든 종목의 시가 총액을 지수기준 100포인트로 집계한다. 현재 코스피지수는 2316.48이므로 1980년 당시보다 23.1배가 올라있음을 나타낸다 KOSPI의 MDD가 가장 컸던 시기는.. 2022. 12. 23.
python 증권데이터 분석 - 삼성 vs 애플 주식, 주가, 일간변동률 비교하기 2019년부터 야후 파이낸스에서 API 기반의 주식 데이터를 제공하고 있다. 야후 파이낸스(finance.yahoo.com)의 경우, 미국 주식 데이터는 정확하지만 국내 주식의 경우 데이터가 누락되거나 값이 틀린 경우가 있으니 주의할 필요가 있다. 국내 시가총액 1위 삼성전자와 미국 애플의 일별 주가 데이터를 야후 파이낸스로부터 다운로드 받아 어떤 종목의 수익률이 더 좋았는지 비교 확인할 것이다. 야후 파이낸스로 주식 시세 구하기 ① 야후 파이낸스 설치하기 # pip install pip install yfinance # conda install pip install -i https://pypi.anaconda.org/ranaroussi/simple yfinance ② pandas-datareader 라.. 2022. 12. 23.
python 증권데이터 분석 - 퀀트 투자를 위한 파이썬 퀀트 투자(Quant Investment) 퀀트 투자의 '퀀트(Quent)'란 '계량적인', '측정가능한'의 뜻을 지닌 Quantitative에서 파생된 것이다. 전통적인 퀀트 투자란 금융공학자들이 고도의 수학적, 통계적 지식을 바탕으로 파생상품의 가격을 모델링하여 투자하는 걸 의미하였다. 하지만 IT와 4차 산업혁명시대가 도래하면서 금융 전문지식이 없는 일반인들도 소프트웨어의 힘을 빌려 계량화된 수치에 따라 퀀트투자가 가능한 시대가 되었다. 글로벌 투자 은행들의 변화 2017 CSE 심포지엄에서 골드만삭스 최고재무책임자 마티 차베스는 "앞으로 투자는수학 원리와 소프트웨어 프로그램이 주도할 것"이라고 이야기했다고한다. 약 3만 5천여명의 골드만삭스 전체 임직원의 25%가 컴퓨터 엔지니어라고 이야기했는데,.. 2022. 12. 23.
재무빅데이터분석사(FDA 2급) 실기 - python 산술 연산자, 비교연산자, 식별 연산자, 복합연산자 재무빅데이터분석사 FDA 2급 출제범위 이론 데이터베이스 데이터베이스 시스템 관계형 데이터베이스 개요 관계형 키 기초 SQL 기초회계 회계의 정의 회계의 기본가정, 회계등식 회계상 거래, 복식부기의 원리 회계등식, 재무제표의 구성요소 분개, 전기, 시산표의 이해 결산, 정산표, 회계의 순환과정 기초통계 모집단과 표본 자료의 척도와 형태 기술통계분석 확률, 확률변수와 확률분포 표본분포와 추정 상관분석과 선형회귀분석 변수의 설정 연산자와 복합연산자, 주석 리스트, 튜플, 딕셔너리 실기 파이썬기초 if문과 for문 리스트 컴프리헨션 사용자정의함수, 람다함수 전역변수와 지역변수 데이터 분석 (Fraudit 활용) CSV, Excel 데이터 입력 데이터의 Sorting 데이터의 Filtering 데이터의 Sele.. 2022. 12. 22.
재무빅데이터분석사(FDA 2급) 실기 - python 변수 설정, 변수명 규칙, 변수명 여러개 만들기, python 금액 3자리수 구분 재무빅데이터분석사 FDA 2급 출제범위 이론 데이터베이스 데이터베이스 시스템 관계형 데이터베이스 개요 관계형 키 기초 SQL 기초회계 회계의 정의 회계의 기본가정, 회계등식 회계상 거래, 복식부기의 원리 회계등식, 재무제표의 구성요소 분개, 전기, 시산표의 이해 결산, 정산표, 회계의 순환과정 기초통계 모집단과 표본 자료의 척도와 형태 기술통계분석 확률, 확률변수와 확률분포 표본분포와 추정 상관분석과 선형회귀분석 변수의 설정 연산자와 복합연산자, 주석 리스트, 튜플, 딕셔너리 실기 파이썬기초 if문과 for문 리스트 컴프리헨션 사용자정의함수, 람다함수 전역변수와 지역변수 데이터 분석 (Fraudit 활용) CSV, Excel 데이터 입력 데이터의 Sorting 데이터의 Filtering 데이터의 Sele.. 2022. 12. 22.
재무빅데이터분석사(FDA 2급) 실기 - Fraudit 설치 재무빅데이터분석사 FDA 2급 출제범위 이론 데이터베이스 데이터베이스 시스템 관계형 데이터베이스 개요 관계형 키 기초 SQL 기초회계 회계의 정의 회계의 기본가정, 회계등식 회계상 거래, 복식부기의 원리 회계등식, 재무제표의 구성요소 분개, 전기, 시산표의 이해 결산, 정산표, 회계의 순환과정 기초통계 모집단과 표본 자료의 척도와 형태 기술통계분석 확률, 확률변수와 확률분포 표본분포와 추정 상관분석과 선형회귀분석 변수의 설정 연산자와 복합연산자, 주석 리스트, 튜플, 딕셔너리 실기 파이썬기초 if문과 for문 리스트 컴프리헨션 사용자정의함수, 람다함수 전역변수와 지역변수 데이터 분석 (Fraudit 활용) CSV, Excel 데이터 입력 데이터의 Sorting 데이터의 Filtering 데이터의 Sele.. 2022. 12. 19.
재무빅데이터분석사(FDA 2급) - 확률 재무빅데이터분석사 FDA 2급 출제범위 이론 데이터베이스 데이터베이스 시스템 관계형 데이터베이스 개요 관계형 키 기초 SQL 기초회계 회계의 정의 회계의 기본가정, 회계등식 회계상 거래, 복식부기의 원리 회계등식, 재무제표의 구성요소 분개, 전기, 시산표의 이해 결산, 정산표, 회계의 순환과정 기초통계 모집단과 표본 자료의 척도와 형태 기술통계분석 확률, 확률변수와 확률분포 표본분포와 추정 상관분석과 선형회귀분석 변수의 설정 연산자와 복합연산자, 주석 리스트, 튜플, 딕셔너리 실기 파이썬기초 if문과 for문 리스트 컴프리헨션 사용자정의함수, 람다함수 전역변수와 지역변수 데이터 분석 (Fraudit 활용) CSV, Excel 데이터 입력 데이터의 Sorting 데이터의 Filtering 데이터의 Sele.. 2022. 12. 19.
반응형