본문 바로가기

IT.DT/SKN 회고록

SKN AI bootcamp 5기 4주차

실무에서.

#데이터 수집하면
#head()
#info()
#isna().sum() , isna().mean()
#describe(), describe(inculde = 'object'), describe(inculde = 'all')
#피쳐요약 - 리포트 형식으로
#피쳐 요약 리포트
import pandas as pd
dict_summary = {
   
    'Date type': df.dtypes,
    'unique_data': df.nunique(),
    'mean' : df.mean(axis=0, numeric_only=True),
    'max' : df.max(axis=0,numeric_only=True )
}
pd.DataFrame(dict_summary)
 

 

 

이번주에는 머신러닝/딥러닝의 기초가 되는 데이터분석(pandas) 를 익혔다. pandas 라이브러리는 마치 자전거타는 것과 같다. 어려운 건 없고 단지 연습만이 필요할 뿐이다. 그 외로 필요한 것은 결측치를 채우기 위한 도메인 지식이다. 금요일에는 머신러닝 첫 수업에 들어갔다. 이론적인 내용이 어려울 것 같아 미리 읽어두고 가서 수업에 따라갈 수 있었다. 머신러닝 수업이 다 끝나고 데이콘이나 캐글 데이터로 연습해보고 싶다.

'IT.DT > SKN 회고록' 카테고리의 다른 글

SKN AI bootcamp 5기 3주차  (0) 2024.09.19
SKN AI bootcamp 5기 2주차  (4) 2024.09.01
SKN AI bootcamp 5기 1주차  (0) 2024.08.25