본문 바로가기
프로그램

[파이썬] 문제 : 크롤링에서 특정 데이터만 가져오기(네이버 재무정보)

by 오디세이99 2023. 5. 27.
728x90
반응형

(문제)

 아래 재무제표의 데이터중  2023/03 분기 EPS 자료를 가져오려고 하는데 (http://comp.fnguide.com/SVO2/ASP/SVD_Main.asp?pGB=1&gicode=A005930&cID=&MenuYn=Y&ReportGB=&NewMenuID=101&stkGb=701) 
실적 발표 시즌일 경우  최신 분기의 자료가 '2023/03' 경우도 있고 잠정 실적 인 경우 열이름이 
'2023/03(P)'로 되어있거나 추정실적일 경우 '2023/03(E)' 로 되어있는 경우가 있습니다.
이 경우  '2023/03' 자료일 경우만 데이터를 가져오려면 어떻게 파이썬 코드를 작성해야 하는지 
알려주시면 감사하겠습니다. 
2022년12월까지는 가져올 수 있는데
22년3월 데이터의 경우 열이름이 2023/03인 경우 EPS 데이터를 가져오고,
2023/03(P) 나 2023/03(E) 인 경우 데이터를 가져오지 않는 법
 
 
(방법)
import pandas as pd

df = pd.read_html('http://comp.fnguide.com/SVO2/ASP/SVD_Main.asp?pGB=1&gicode=A005930&cID=&MenuYn=Y&ReportGB=&NewMenuID=101&stkGb=701')
df1 = pd.DataFrame(df[10])
for i in range(len(df1.columns)):
    if 'IFRS' not in df1.columns[i][1] and '(E)' not in df1.columns[i][1] and '(P)' not in df1.columns[i][1]:
        print(df1.columns[i][1], '/EPS=',df1[df1.columns[i]][18])

728x90
반응형

댓글