실무에서.
#데이터 수집하면
#head()
#info()
#isna().sum() , isna().mean()
#describe(), describe(inculde = 'object'), describe(inculde = 'all')
#피쳐요약 - 리포트 형식으로
#피쳐 요약 리포트
import pandas as pd
dict_summary = {
'Date type': df.dtypes,
'unique_data': df.nunique(),
'mean' : df.mean(axis=0, numeric_only=True),
'max' : df.max(axis=0,numeric_only=True )
}
pd.DataFrame(dict_summary)
이번주에는 머신러닝/딥러닝의 기초가 되는 데이터분석(pandas) 를 익혔다. pandas 라이브러리는 마치 자전거타는 것과 같다. 어려운 건 없고 단지 연습만이 필요할 뿐이다. 그 외로 필요한 것은 결측치를 채우기 위한 도메인 지식이다. 금요일에는 머신러닝 첫 수업에 들어갔다. 이론적인 내용이 어려울 것 같아 미리 읽어두고 가서 수업에 따라갈 수 있었다. 머신러닝 수업이 다 끝나고 데이콘이나 캐글 데이터로 연습해보고 싶다.
'IT.DT > SKN 회고록' 카테고리의 다른 글
SKN AI bootcamp 5기 7주차 (1) | 2024.10.06 |
---|---|
SKN AI bootcamp 5기 6주차 (2) | 2024.10.04 |
SKN AI bootcamp 5기 3주차 (0) | 2024.09.19 |
SKN AI bootcamp 5기 2주차 (4) | 2024.09.01 |
SKN AI bootcamp 5기 1주차 (0) | 2024.08.25 |