프로그램

[파이썬] 문제 : pandas에서 컬럼 데이터 중복, 조건 출력, 컬럼간 비교

오디세이99 2023. 4. 2. 19:48
728x90
반응형

(문제)

1.각 열(column)에 대한 유니크한 값(unique value)의 수 찾으세요.
출력 예
survived         2
2."embarked"가 "C"인 행들을 출력하세요.
3.이름이 "생존여부"인 열을 추가하고 "alive"가 no라면 0, yes라면 1의 값을 넣으세요.
그리고 "생존여부" 열과 "survivied" 열이 일치하는지 비교하세요. (bool값을 출력)

 

(방법)

import pandas as pd
import seaborn as sns

# import titanic dataset
df=sns.load_dataset("titanic")
df.head(10)

 

1.각 열(column)에 대한 유니크한 값(unique value)의 수 찾으세요.

- 유니크한 값의 종류 수(survived 컬럼은 0, 1 값 2가지를 가짐)

for c_name in df.columns:
    print(c_name, '/', len(df[c_name].unique()))


2."embarked"가 "C"인 행들을 출력하세요.

df.loc[df['embarked'] == "C"]

3.이름이 "생존여부"인 열을 추가하고 "alive"가 no라면 0, yes라면 1의 값을 넣으세요.
그리고 "생존여부" 열과 "survivied" 열이 일치하는지 비교하세요. (bool값을 출력)

df["생존여부"] = 0                               # 생존여부 컬럼을 새로 만듬. 데이터는 일단 모두 0 으로 채움
df.loc[df['alive'] == 'yes', '생존여부'] = 1     # 필요한 데이터먼 1로 변경

생종여부, survived 컬럼의 값이 일치하는지 비교(bool값)

print(df['alive'] == df['생존여부'])

728x90
반응형