머신러닝/pandas
pandas - apply함수
study ticket
2022. 2. 6. 23:10
apply함수
판다스에서는 apply함수로 lambda함수로 데이터를 가공해 dataframe에 값을 추가할수 있게 지원해준다.
다음 타이타닉 데이터로 예시를 들겠다.
def get_category(age):
cat=''
if (age<=-1): cat='unknown'
elif(age<=5):cat='baby'
elif(age<=12):cat='child'
elif(age<=18):cat='teenager'
elif(age<=25):cat='student'
elif(age<=35):cat='young adult'
elif(age<=60):cat='adult'
else: cat='eldery'
return cat
titanic_df['age_cat']=titanic_df['Age'].apply(lambda x:get_category(x))
titanic_df[['Age','age_cat']].head(3)
apply함수의 사용법은 다음과 같다.
dataframe['새로만들특징명']=dataframe['lambda함수 인자로 이용할 특징명'].apply(lambda x : function(x))
lambda함수 인자로 이용할 특징의 값들이 lambda함수의 인자로 들어가 리턴된 값이 새로만들어지는 특징의 데이터가 되는 형식이다.
728x90