본문 바로가기

전체 글

(46)
비공개
SKN AI bootcamp 5기 4주차 실무에서.#데이터 수집하면#head()#info()#isna().sum() , isna().mean()#describe(), describe(inculde = 'object'), describe(inculde = 'all')#피쳐요약 - 리포트 형식으로#피쳐 요약 리포트import pandas as pddict_summary = {        'Date type': df.dtypes,    'unique_data': df.nunique(),    'mean' : df.mean(axis=0, numeric_only=True),    'max' : df.max(axis=0,numeric_only=True )}pd.DataFrame(dict_summary)   이번주에는 머신러닝/딥러닝의 기초가 되는 데이터..
SKN AI bootcamp 5기 3주차 3주차에는 처음으로 프로젝트를 해봤다. 프로젝트 주제는 전국 자동차 등록 현황 및 기업별 FAQ 이다.전국 자동차 등록현황을 알기 위해 한국자동차산업협회(KAMA), 한국수입자동차협회(KAIDA) 에서 전국 자동차 등록 현황을 크롤링 하였고, 현대,기아,제네시스,쉐보레 홈페이지에서 FAQ 를 크롤링 하였다. MySQL로 데이터 베이스를 만들고, pymysql,sqlalchemy 를 이용하여 데이터를 적재하였다. 마지막으로 streamlt으로 데이터를 웹상에 시각화 하였다. 데이터를 찾을때 주의했던점은 질문에 답을 할 수 있는 데이터를 찾는 것이었다. 전국 자동차 등록현황을 제시하고 다양한 기준으로 분류, 비교하는 그래프를 추가로 제시 하였다.   파이썬과 기본적인 개발실력이 부족한 상태로 진행해서 이번 ..
python Pandas Pandas 호출 In [1]: import numpy as npIn [2]: import pandas as pd Pandas에는 Series, DataFrame 객체가 있다.Series 를 만들 때 index를 안주면 default RangeIndex가 달린다.DataFrame 의 data_range를 이용하면 Numpy array 배열과 datetime 인덱스로 객체를 만들 수 있다.DataFrame에 딕셔너리를 전달하면 key값은 열로 values는 행으로 입력된다.각 열들은 각자의 데이터타입을 갖는다. ( .dtypes)객체이름 점찍고 기다리면 컬럼명이 자동완성으로 뜬다.Viewing dataDataFrame.head() 와 DataFrame.tail() 은 각각 최상단에서 몇행, 최하단에서 몇행..
생명정보개론(bioinformatics) Q. DNA 이중가닥 중 어떤 가닥을 사용하며 각각의 단백질 결과물이 다를텐데 우리 몸은 어떤 가닥을 사용하는지?A. DNA에서 실제로 전사되는 가닥을 템플릿(Template Strand)라고 하며 이 가닥은 mRNA 합성하는 정보가 담겨 있다. 비템플릿 가닥(Non-Template Strand)는 Coding Strand 라고도 한다. 어떤 가닥이 사용되는 지는 고정되어 있다. 템플릿과 비템플릿 가닥은 유전자에 따라 다르다. 정확한 가닥 사용을 보장하기 위해 프로모터 영역과 전사인자 매커니즘을 이용하여 템플릿 가닥을 가려낸다. ORF(Open Reading Frame)Sequencing을 통하여 mRNA의 염기 서열을 추정한 후, 그 중에서 어디에서부터 어디까지가 단백질로 번역되는지 알아야 한다. 번역..
SKN AI bootcamp 5기 2주차 함수과 return함수는 기본적으로 return 명령어를 사용하지 않으면, None 값을 반환한다. 함수 안에 명시적으로 return이 없으면, 함수의 실행이 끝날 때 자동으로 None이 반환한다. def example_function(): pass # 아무것도 하지 않음 result = example_function() print(result)None #출력값 모듈파이썬의 모듈은 하나의 파이썬 파일(.py)이며, 그 안에는 함수, 클래스, 변수, 심지어 다른 모듈의 import 등 다양한 코드가 포함될 수 있다. 우리가 사용하는 모듈의 기능들은 보통 다음과 같은 형태로 정의된다. random.shuffle([1,2,3,4,5])출력값이 없다? > 셔플 행위자체를 실행. 셔플결과를 보고싶으면 변수에 넣어..
인코딩(Encoding) , UTP-8,16,32 개념 1. 문자 인코딩(Character Encoding)정의: 문자 인코딩은 텍스트 데이터를 컴퓨터가 이해하고 처리할 수 있는 이진수(바이너리) 형태로 변환하는 방법을 의미합니다. 문자 인코딩은 각 문자에 고유한 숫자 코드(코드 포인트)를 할당하고, 이를 바이트 시퀀스로 변환합니다.중요성: 문자 인코딩이 없으면 컴퓨터는 문자 데이터를 처리할 수 없으며, 잘못된 인코딩을 사용하면 글자가 깨지거나 의도한 대로 표시되지 않을 수 있습니다.2. UTF-8정의: UTF-8(8-bit Unicode Transformation Format)은 가변 길이 문자 인코딩 방식으로, Unicode 문자 집합을 인코딩하는 데 사용됩니다. UTF-8은 1바이트에서 4바이트 사이의 길이로 문자들을 인코딩할 수 있습니다.특징:ASCI..
로컬서버(Web Server), 웹서버(Local Server) 개념 로컬 Apache 서버와 웹 서버의 관계는 기본적으로 동일한 개념에서 출발합니다. 차이점은 로컬 서버는 사용자가 자신의 컴퓨터에서 실행하는 서버를 의미하고, 웹 서버는 인터넷 상에서 접근 가능한 서버를 의미한다는 점입니다. 아래에서 그 관계를 자세히 설명해 드리겠습니다.1. 웹 서버(Web Server)정의: 웹 서버는 클라이언트(일반적으로 웹 브라우저)로부터 HTTP 요청을 받아, 해당 요청에 맞는 웹 페이지나 리소스를 제공하는 서버입니다.역할: PHP, HTML, CSS, JavaScript 파일을 처리하고 그 결과를 클라이언트에게 반환합니다. 클라이언트는 이 데이터를 브라우저를 통해 화면에 표시합니다.위치: 웹 서버는 인터넷에 연결된 컴퓨터에서 운영되며, 도메인 이름 또는 IP 주소를 통해 전 세계..