머신러닝/pandas

pandas - apply함수

study ticket 2022. 2. 6. 23:10

apply함수

판다스에서는 apply함수로 lambda함수로 데이터를 가공해 dataframe에 값을 추가할수 있게 지원해준다.

다음 타이타닉 데이터로 예시를 들겠다.

def get_category(age):
  cat=''
  if (age<=-1): cat='unknown'
  elif(age<=5):cat='baby'
  elif(age<=12):cat='child'
  elif(age<=18):cat='teenager'
  elif(age<=25):cat='student'
  elif(age<=35):cat='young adult'
  elif(age<=60):cat='adult'
  else: cat='eldery' 

  return cat
titanic_df['age_cat']=titanic_df['Age'].apply(lambda x:get_category(x))
titanic_df[['Age','age_cat']].head(3)

결과이미지

apply함수의 사용법은 다음과 같다.

dataframe['새로만들특징명']=dataframe['lambda함수 인자로 이용할 특징명'].apply(lambda x : function(x))

lambda함수 인자로 이용할 특징의 값들이 lambda함수의 인자로 들어가 리턴된 값이 새로만들어지는 특징의 데이터가 되는 형식이다.

728x90