본문 바로가기

파이썬156

[파이썬] bz2 파일 text로 저장 하기 bz2 압축파일을 읽고 Text 파일로 저장합니다. ##################### ## bz2 압축 풀기 ##################### import bz2 # bz2 파일 읽기 with open("kowiki-20220820-pages-articles-multistream1.xml-p1p82407.bz2","rb") as f: data = f.read() decom_data = bz2.decompress(data).decode() print(decom_data[:500]) # 내용 확인 하기 # text 파일로 저장 f = open('wiki_data.txt','w',encoding='UTF-8') f.write(decom_data) f.close() 2022. 8. 22.
[파이썬] 에러('cp949' codec can't encode character '\u2013' in position 176: illegal multibyte sequence) 파일 Open 하여 Write 중 에러가 발생했습니다. f = open('wiki_data.txt','w') f.write(data) f.close() 다음과 같이 에러가 발생했습니다. --------------------------------------------------------------------------- UnicodeEncodeError Traceback (most recent call last) Input In [21], in () 13 f = open('wiki_data2.txt','w') ---> 16 f.write(data) 17 f.close() UnicodeEncodeError: 'cp949' codec can't encode character '\u2013' in positi.. 2022. 8. 22.
[파이썬] nltk에서 에러(Resource punkt not found) nltk package로 작업 시 다음과 같은 코드에서 에러가 발생했습니다. data = data[['article_text']] data['sentences'] = data['article_text'].apply(sent_tokenize) 에러 내용 LookupError: ********************************************************************** Resource punkt not found. Please use the NLTK Downloader to obtain the resource: >>> import nltk >>> nltk.download('punkt') jupyter에서 다음과 같이 했습니다. import nltk nltk.download(.. 2022. 8. 22.
[파이썬/법칙] 콜라츠 추측 재미있는 것이라서 파이썬으로 만들어 봤습니다. [콜라츠 추측(collatz conjecture)] - 1937년 Collatz란 사람에 의해 제기된 추측 규칙> 1. 입력된 수가 짝수라면 2로 나눕니다. 2. 입력된 수가 홀수라면 3을 곱하고 1을 더합니다. 3. 1이 될 때까지 반복 (1->4->2->1 반복) 예> - 수가 13이라면 13, 40, 20, 10, 5, 16, 8, 4, 2, 1 이 1 이 됩니다. - 마지막 1은 홀수여서 1*3+1=4가 되고, 4/2=2가 되고, 2/2=1 로 되어 반복됩니다. 문제> - 반례를 찾지 못함 참고> https://ko.wikipedia.org/wiki/%EC%BD%9C%EB%9D%BC%EC%B8%A0_%EC%B6%94%EC%B8%A1 다음과 같이 간단한.. 2022. 8. 21.
[Tensorflow] 에러 (tensorflow Fail to find the dnn implementation) 에러 내용 2022-08-20 21:35:04.723160: I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:185] None of the MLIR Optimization Passes are enabled (registered 2) Epoch 1/20 2022-08-20 21:35:10.323280: E tensorflow/stream_executor/cuda/cuda_dnn.cc:374] Could not create cudnn handle: CUDNN_STATUS_ALLOC_FAILED 2022-08-20 21:35:10.323540: W tensorflow/core/framework/op_kernel.cc:1692] OP_REQUIRES fa.. 2022. 8. 21.
[파이썬/법칙] 파레토 법칙(80/20법칙) 결과의 80가 원인의 20에서 나온다는 법칙 즉, 토지의 80%를 일부 소유자 20%가 소유하고 있다는 등의 법칙입니다. 정확히 80/20 이 아닌 소수의 원인이 다수의 결과를 가진다는 것이 핵심입니다. 그렇다고 80가 중요하지 않다는 것은 아닙니다. 임의의 데이터로 80/20 법칙을 코딩해 봅니다. import pandas as pd import matplotlib.pyplot as plt from matplotlib.ticker import PercentFormatter df = pd.DataFrame({'구매액': [71, 66, 67, 76, 75, 56, 78, 68, 67, 73]}) df.index = ['A', 'B', 'C', 'D', 'E', 'F','G', 'H', 'I', 'J'] .. 2022. 8. 20.
[파이썬] 주식 종목코드, 종목명 연계 주식 종목을 검색합니다. from pykrx import stock import pandas as pd import matplotlib.pyplot as plt from matplotlib.ticker import PercentFormatter # KOSDAQ 종목 조회 tickers = stock.get_market_ticker_list("20220819", market="KOSPI") tickers 938개의 종목코드가 나옵니다. 그런데 종목코드만 있고 종목명은 없습니다. ['095570', '006840', '027410', '282330', '138930', ..... '005010', '000540', '000547', '000545', '003280'] 1개 종목코드로 종목명을 찾습니다. fr.. 2022. 8. 20.
[파이썬] 윈도우 UI 기초 UI 화면 띄우기 import sys from PyQt5.QtWidgets import QApplication, QWidget class MyApp(QWidget): def __init__(self): super().__init__() self.initUI() def initUI(self): self.setWindowTitle('My Window') # self.setGeometry(300, 300, 300, 200) # 윈도우 크기, 위치 self.move(300, 300) self.resize(400, 200) self.show() if __name__ == '__main__': app = QApplication(sys.argv) ex = MyApp() sys.exit(app.exec_()) ​ ​ .. 2022. 8. 20.
[파이썬] 위키백과 검색 데이터 받기 (크롤링) 위키백과에서 검색한 결과를 받는 코드 입니다. 위키백과 사이트에서 김치를 검색해 보면 아래와 같은 페이지 나옵니다. 이제 파이썬 코드를 보겠습니다. import wikipediaapi # wiki api package keyword = '김치' wiki = wikipediaapi.Wikipedia('ko') #한국 wikipedia 사이트로 접속하도록 셋팅하기 search_page = wiki.page(keyword) if search_page.exists() == False: # 검색 결과가 없으면 print('>>> Page Not Found!!! (' + keyword + ')') else: print('>>> Title : [' + search_page.title + ']') print('>>> .. 2022. 8. 18.
[파이썬] 사인파(Sine wave) 그리기 기본적인 사인파(Sine wave) 그리는 코드 입니다. import numpy as np import matplotlib.pyplot as plt import matplotlib # 신호정보 상수로 정의 SIG_AMPLITUDE = 10 SIG_OFFSET = 0 SIG_PERIOD = 100 NOISE_AMPLITUDE = 3 N_SAMPLES = 5 * SIG_PERIOD INSTRUMENT_RANGE = 9 # 사인 곡선 times = np.arange(N_SAMPLES).astype(float) signal = SIG_AMPLITUDE * np.sin(2 * np.pi * times / SIG_PERIOD) + SIG_OFFSET # plot matplotlib.style.use("ggplot".. 2022. 8. 17.
728x90
반응형