전체 글 (58) 썸네일형 리스트형 SKN AI bootcamp 5기 9주차 선형 vs 비선형 문제 선형 문제와 비선형 문제는 머신러닝이나 최적화 문제에서 매우 중요한 구분입니다. 각 문제의 정의와 이를 해결할 수 있는 대표적인 알고리즘을 간단히 정리하겠습니다. 1. **선형 문제(Linear Problem)** - **정의**: 선형 문제는 변수들 사이의 관계가 선형적(직선의 형태)인 문제입니다. 즉, 변수들이 더해지거나 상수와 곱해지는 형태로 결과가 결정됩니다. 선형 문제에서는 입력 변수와 출력 변수 사이의 관계가 선형 방정식으로 표현될 수 있습니다. - **특징**: 선형 문제는 입력 데이터가 특정 패턴(직선 또는 평면) 위에 있는 경우가 많으며, 모델이 매우 간단하고 해석이 쉬운 편입니다. - **대표적인 알고리즘**: 1. **선형 회귀(Li.. SKN AI bootcamp 5기 8주차 파이토치 사용법 요약 파이토치(PyTorch)는 Python 기반의 딥러닝 프레임워크로, 빠르고 유연한 모델 구축을 지원하는 대표적인 딥러닝 라이브러리입니다. PyTorch 사용법을 크게 다섯 단계로 요약할 수 있습니다. ### 1. **PyTorch 설치** **설치 방법**: pip install torch torchvision torchaudio 또는 GPU를 사용하는 경우 CUDA 지원 버전을 설치합니다. pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118### 2. **텐서(Tensor) 다루기** - **텐서 정의**: PyTorch에서 데이.. SKN AI bootcamp 5기 7주차 경사하강법, 순전파, 역전파 개념 정리 1. **경사하강법(Gradient Descent)** - **정의**: 경사하강법은 모델의 손실 함수(loss function)를 최소화하기 위해 사용되는 최적화 알고리즘입니다. - **작동 원리**: - 손실 함수의 기울기(gradient)를 계산하여 기울기가 낮은 방향으로 가중치를 업데이트합니다. - 기울기가 큰 곳은 가중치를 빠르게 변화시키고, 기울기가 작은 곳에서는 변화폭을 줄이며 최적의 가중치에 수렴합니다. - 학습률(learning rate)에 따라 가중치 업데이트의 크기를 조정합니다. - **종류**: - **배치 경사하강법(Batch Gradient Descent)**: 전체 데이터셋을 사용하여.. SKN AI bootcamp 5기 6주차 이번주에는 머신런이 마무리 하고 딥러닝 기초를 공부하였다. 짧은 시간안에 많은 내용을 배워서 머리가 아프다. 그렇지만 짧은 시간안에 많은 내용을 배울 수 있다는건 좋다. 느긋하게 배울 여유가 없다. 그동안 배운 내용을 간단한게 요약하고 딥러닝 공부해야겠다. 선형 회귀 (Linear Regression):목적: 연속형 데이터를 예측할 때 사용되는 알고리즘입니다. 예를 들어 집값, 주식 가격 등과 같은 값을 예측할 때 사용됩니다.개념: 독립 변수와 종속 변수 사이의 직선 관계를 모델링하여 예측합니다. 주어진 데이터에 가장 잘 맞는 직선을 찾아내는 것이 핵심입니다.로지스틱 회귀 (Logistic Regression):목적: 분류 문제에서 사용됩니다. 예를 들어, 이메일이 스팸인지 아닌지, 환자가 질병을 앓고 .. SKN AI bootcamp 5기 5주차 추석연휴가 끼어 있어서 머신러닝과 딥러닝을 미리 예습할 수 있었다. 내용이 점점 어려워지고 수업 내 설명만으로 이해하기 어려워졌기 때문에 적절할 때 연휴를 활용할 수 있게 됏다. 이번주는 배운 내용을 바탕으로 데이콘 머신러닝 대회문제를 해결해 보려고 노력했다. 데이터는 유전자 아미노산 돌연변이,위치정보이다. 바이오 배경지식이 있었기에 데이터를 이해하는데는 문제가 없었다. 다만 어떻게 전처리할지, 온라인에 공개된 DB를 활용하는게 대회의 관건이지 않나 싶다. 하루에 제출은 3번까지 가능하고 첫제출에 142등에 랭크됐다. 이번 대회는 50등안에 드는 걸로 목표로하고 팀원들과 성능을 최대로 올려보려 한다. SKN AI bootcamp 5기 4주차 실무에서.#데이터 수집하면#head()#info()#isna().sum() , isna().mean()#describe(), describe(inculde = 'object'), describe(inculde = 'all')#피쳐요약 - 리포트 형식으로#피쳐 요약 리포트import pandas as pddict_summary = { 'Date type': df.dtypes, 'unique_data': df.nunique(), 'mean' : df.mean(axis=0, numeric_only=True), 'max' : df.max(axis=0,numeric_only=True )}pd.DataFrame(dict_summary) 이번주에는 머신러닝/딥러닝의 기초가 되는 데이터.. SKN AI bootcamp 5기 3주차 3주차에는 처음으로 프로젝트를 해봤다. 프로젝트 주제는 전국 자동차 등록 현황 및 기업별 FAQ 이다.전국 자동차 등록현황을 알기 위해 한국자동차산업협회(KAMA), 한국수입자동차협회(KAIDA) 에서 전국 자동차 등록 현황을 크롤링 하였고, 현대,기아,제네시스,쉐보레 홈페이지에서 FAQ 를 크롤링 하였다. MySQL로 데이터 베이스를 만들고, pymysql,sqlalchemy 를 이용하여 데이터를 적재하였다. 마지막으로 streamlt으로 데이터를 웹상에 시각화 하였다. 데이터를 찾을때 주의했던점은 질문에 답을 할 수 있는 데이터를 찾는 것이었다. 전국 자동차 등록현황을 제시하고 다양한 기준으로 분류, 비교하는 그래프를 추가로 제시 하였다. 파이썬과 기본적인 개발실력이 부족한 상태로 진행해서 이번 .. python Pandas Pandas 호출 In [1]: import numpy as npIn [2]: import pandas as pd Pandas에는 Series, DataFrame 객체가 있다.Series 를 만들 때 index를 안주면 default RangeIndex가 달린다.DataFrame 의 data_range를 이용하면 Numpy array 배열과 datetime 인덱스로 객체를 만들 수 있다.DataFrame에 딕셔너리를 전달하면 key값은 열로 values는 행으로 입력된다.각 열들은 각자의 데이터타입을 갖는다. ( .dtypes)객체이름 점찍고 기다리면 컬럼명이 자동완성으로 뜬다.Viewing dataDataFrame.head() 와 DataFrame.tail() 은 각각 최상단에서 몇행, 최하단에서 몇행.. 이전 1 2 3 4 5 ··· 8 다음