본문 바로가기

IT.DT

(13)
SKN AI bootcamp 5기 4주차 실무에서.#데이터 수집하면#head()#info()#isna().sum() , isna().mean()#describe(), describe(inculde = 'object'), describe(inculde = 'all')#피쳐요약 - 리포트 형식으로#피쳐 요약 리포트import pandas as pddict_summary = {        'Date type': df.dtypes,    'unique_data': df.nunique(),    'mean' : df.mean(axis=0, numeric_only=True),    'max' : df.max(axis=0,numeric_only=True )}pd.DataFrame(dict_summary)   이번주에는 머신러닝/딥러닝의 기초가 되는 데이터..
SKN AI bootcamp 5기 3주차 3주차에는 처음으로 프로젝트를 해봤다. 프로젝트 주제는 전국 자동차 등록 현황 및 기업별 FAQ 이다.전국 자동차 등록현황을 알기 위해 한국자동차산업협회(KAMA), 한국수입자동차협회(KAIDA) 에서 전국 자동차 등록 현황을 크롤링 하였고, 현대,기아,제네시스,쉐보레 홈페이지에서 FAQ 를 크롤링 하였다. MySQL로 데이터 베이스를 만들고, pymysql,sqlalchemy 를 이용하여 데이터를 적재하였다. 마지막으로 streamlt으로 데이터를 웹상에 시각화 하였다. 데이터를 찾을때 주의했던점은 질문에 답을 할 수 있는 데이터를 찾는 것이었다. 전국 자동차 등록현황을 제시하고 다양한 기준으로 분류, 비교하는 그래프를 추가로 제시 하였다.   파이썬과 기본적인 개발실력이 부족한 상태로 진행해서 이번 ..
python Pandas Pandas 호출 In [1]: import numpy as npIn [2]: import pandas as pd Pandas에는 Series, DataFrame 객체가 있다.Series 를 만들 때 index를 안주면 default RangeIndex가 달린다.DataFrame 의 data_range를 이용하면 Numpy array 배열과 datetime 인덱스로 객체를 만들 수 있다.DataFrame에 딕셔너리를 전달하면 key값은 열로 values는 행으로 입력된다.각 열들은 각자의 데이터타입을 갖는다. ( .dtypes)객체이름 점찍고 기다리면 컬럼명이 자동완성으로 뜬다.Viewing dataDataFrame.head() 와 DataFrame.tail() 은 각각 최상단에서 몇행, 최하단에서 몇행..
SKN AI bootcamp 5기 2주차 함수과 return함수는 기본적으로 return 명령어를 사용하지 않으면, None 값을 반환한다. 함수 안에 명시적으로 return이 없으면, 함수의 실행이 끝날 때 자동으로 None이 반환한다. def example_function(): pass # 아무것도 하지 않음 result = example_function() print(result)None #출력값 모듈파이썬의 모듈은 하나의 파이썬 파일(.py)이며, 그 안에는 함수, 클래스, 변수, 심지어 다른 모듈의 import 등 다양한 코드가 포함될 수 있다. 우리가 사용하는 모듈의 기능들은 보통 다음과 같은 형태로 정의된다. random.shuffle([1,2,3,4,5])출력값이 없다? > 셔플 행위자체를 실행. 셔플결과를 보고싶으면 변수에 넣어..
인코딩(Encoding) , UTP-8,16,32 개념 1. 문자 인코딩(Character Encoding)정의: 문자 인코딩은 텍스트 데이터를 컴퓨터가 이해하고 처리할 수 있는 이진수(바이너리) 형태로 변환하는 방법을 의미합니다. 문자 인코딩은 각 문자에 고유한 숫자 코드(코드 포인트)를 할당하고, 이를 바이트 시퀀스로 변환합니다.중요성: 문자 인코딩이 없으면 컴퓨터는 문자 데이터를 처리할 수 없으며, 잘못된 인코딩을 사용하면 글자가 깨지거나 의도한 대로 표시되지 않을 수 있습니다.2. UTF-8정의: UTF-8(8-bit Unicode Transformation Format)은 가변 길이 문자 인코딩 방식으로, Unicode 문자 집합을 인코딩하는 데 사용됩니다. UTF-8은 1바이트에서 4바이트 사이의 길이로 문자들을 인코딩할 수 있습니다.특징:ASCI..
로컬서버(Web Server), 웹서버(Local Server) 개념 로컬 Apache 서버와 웹 서버의 관계는 기본적으로 동일한 개념에서 출발합니다. 차이점은 로컬 서버는 사용자가 자신의 컴퓨터에서 실행하는 서버를 의미하고, 웹 서버는 인터넷 상에서 접근 가능한 서버를 의미한다는 점입니다. 아래에서 그 관계를 자세히 설명해 드리겠습니다.1. 웹 서버(Web Server)정의: 웹 서버는 클라이언트(일반적으로 웹 브라우저)로부터 HTTP 요청을 받아, 해당 요청에 맞는 웹 페이지나 리소스를 제공하는 서버입니다.역할: PHP, HTML, CSS, JavaScript 파일을 처리하고 그 결과를 클라이언트에게 반환합니다. 클라이언트는 이 데이터를 브라우저를 통해 화면에 표시합니다.위치: 웹 서버는 인터넷에 연결된 컴퓨터에서 운영되며, 도메인 이름 또는 IP 주소를 통해 전 세계..
Apache, MySQL, PHP 개념과 상호작용 flow 1. Apache (아파치)개념: Apache는 웹 서버 소프트웨어입니다. 웹 서버는 클라이언트(예: 웹 브라우저)의 요청에 따라 웹 페이지를 제공하는 역할을 합니다. Apache는 인터넷에서 가장 널리 사용되는 웹 서버 중 하나로, HTTP 및 HTTPS 프로토콜을 통해 웹 페이지, 이미지, 비디오 등을 전달합니다.역할: 웹 브라우저가 웹 페이지를 요청하면, Apache는 해당 요청을 처리하고 필요한 파일을 클라이언트에게 전송합니다.관계: Apache는 서버 측에서 웹 페이지를 클라이언트에게 전달하는 역할을 하며, PHP 스크립트를 실행하는 환경을 제공합니다. PHP로 작성된 스크립트를 처리하기 위해 Apache는 PHP 모듈과 연동됩니다.2. MySQL (마이에스큐엘)개념: MySQL은 오픈 소스 관..
MySQL 질의어 오개념 정리 문제의 쿼리 다시 보기SELECT userid, height FROM usertbl WHERE height IN ( SELECT max(height), min(height) FROM usertbl );문제의 원인 이해하기IN 절의 역할:IN 절은 특정 열의 값이 목록에 포함되어 있는지를 확인할 때 사용됩니다.이 목록은 단일 열이어야 하며, 여러 행의 값을 가질 수 있습니다.서브쿼리의 반환값:SELECT max(height), min(height) FROM usertbl 은 두 개의 열 (max(height)와 min(height))과 하나의 행을 반환합니다.예를 들어, max(height)가 200이고 min(height)가 150이라면, 서브쿼리는 다음과 같은 결과를 생성합니다:max(height)mi..