[파이썬] train_test_split의 random_state 옵션
train, test를 분리 시 동일한 결과가 나오게 하느냐 아니냐입니다. random_state에 어떤 수든 동일한 결과를 보이게 됩니다. 다음과 같이 데이터를 만들어서 테스트해보죠. import numpy as np from sklearn.model_selection import train_test_split X = np.arange(20).reshape(10, 2) y = np.arange(10) print(X,'\n\n', y) 일반적으로 test 테이터 20%로 해서 train_test_split를 하면 다음과 같이 나뉩니다. X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) print(X_train,'\n\..
2022. 10. 9.
[파이썬] pandas DataFrame에 Color 적용
pandas DataFrame에 style을 사용해서 color를 적용할 수 있습니다. style.highlight_min()와 style.highlight_max() 를 사용하는 것을 볼 수 있습니다. 1개만 사용할 수 있고, 여러개를 사용 시 계속 붙여서 적용할 수 있습니다. import pandas as pd dict_item = { 'item1': [0, 1, 0, 0], 'item2': [1, 0, 1, 0], 'item3': [1, 0, 0, 1] } df_item = pd.DataFrame(dict_item) df_style = df_item.style.highlight_min(axis=0, color='blue').highlight_max(axis=0, color='red') df_style
2022. 10. 4.
[파이썬] pandas Dataframe을 이미지로 저장
package 설치 pip install dataframe_image 다음과 같이 dataframe을 이미지로 자장 할 수 있습니다. import pandas as pd import dataframe_image as dfi dict_item = { 'item1': [0, 1, 0, 0], 'item2': [1, 0, 1, 0], 'item3': [1, 0, 0, 1] } df_item = pd.DataFrame(dict_item) print(df_item) dfi.export(df_item, 'pandasToimage01.png', max_cols=-1, max_rows=-1)
2022. 10. 4.
[파이썬] 리스트의 첫 요소로 딕셔너리 변환
리스트의 첫 번째 요소를 딕셔너리의 Key로 해서 리스트의 다른 요소들을 딕셔너리의 값 항목으로 만드는 코드 [['a', 12], ['b', 21], ['b', 30], ['a', 50], ['d', 34], ['c', 22]] 를 아래와 같이 만드는 코드 {'a': [12, 50], 'b': [21, 30], 'd': [34], 'c': [22]} data = [['a', 12], ['b', 21], ['b', 30], ['a', 50], ['d', 34], ['c', 22]] def lstToDic(data): dict = {} for k, v in data: dict[k] = dict.get(k, []) + [v] return dict dic = lstToDic(data) dic
2022. 10. 1.