일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- np.triu
- fastqc
- bcftools
- 오블완
- NGS
- 대학생주식
- ngs short
- 대학생재테크
- 선형대수
- R
- np.trace
- scRNASeq
- numpy
- Tutorial
- 후기
- 주식투자
- Preprocessing
- scanpy
- single cell rna sequening
- single cell rna sequencing
- 주식
- liver
- np.diagflat
- Python
- 통계학
- bioinformatics
- 대학원
- Next Generation Sequencing
- 티스토리챌린지
- np.flatten
- Today
- Total
목록분류 전체보기 (69)
biotechknowledge

sam file document 는 구글에 sequence alignment map format specification 검색하면 쉽게 찾을 수 있다.sam 파일의 각 열에 대한 설명이다. 10,11은 염기와 퀄리티 점수를 갖고 있으므로 반대로 fastq 파일을 만들 수 있다. FLAG는 SAM/BAM 파일에서 각 read의 alignment(정렬) 상태를 2진수 비트(bit)로 정의하고 십진수로 변환한다. 여러가지 상태인 경우 모두 합산한 값으로 구한다. 합산값은 고유하다. samtools를 이용하면 FLAG로 리드가 어떤 상태와 특성을 갖는지 확인할 수 있다. Samtoolshttps://www.htslib.org/ SamtoolsSamtools Samtools is a suite of program..

FastQChttps://www.bioinformatics.babraham.ac.uk/index.html Babraham BioinformaticsWelcome to Babraham Bioinformatics This is the homepage of the Bioinformatics Group at the Babraham Institute. We provide bioinformatics services to the 30 research groups which form the institute as well as providing an external commercial consultancy serwww.bioinformatics.babraham.ac.ukFastq파일의 read들의 염기와 퀄리티점수를 ..

FASTQ FASTQ 는 sequencing read 를 저장하는 포맷이다. 시퀀싱 플랫폼에서 데이터를 얻으면 binary file로 저장한다. 플랫폼마다 제공하는 소프트웨어를 이용하여 FASTQ로 변환할 수 있다. FASTQ 파일은 헤더(등록번호, spot 번호,장비 등의 메타데이터), 염기, 퀄리티점수로 이루어져 있다. 논문에 출판하기 위해서는 FASTQ 파일을 공공데이터 베이스에 업로드 해야한다. NCBI, EBI, DDBJ 3 기관의 공공데이터베이스가 있고 기관마다 고유의 등록번호 SRR, ERR, DRR을 부여한다. FASTA file은 NGS 이전에 sanger sequencing 파일을 저장하던 형식이다. 제일 처음 @로 시작하는 부분이 헤더로 메타이데이터를 포함하고 2번째줄이 염기정보 제..

NGS 은 기본적으로 DNA 가닥의 염기를 읽는 것을 말한다. 다양한 회사에서 각자의 기술을 바탕으로 플랫폼을 개발하고 있고 현재 시장을 지배하고 있는 방식은 Illumina 의 solexa이다. DNA염기가 합성될 때 형광을 읽는 방식을 사용하는 방식이고 oxford사 처럼 물리적인 방식을 사용하기도 한다. 중요한 점은, 방식의 차이일 뿐 결국 모두 염기를 읽는 것이고 bioinformatics 분석을 위한 데이터 생산을 하는 과정이다. 분석을 하는 사람이라면, 한번쯤 시퀀싱 방법을 이해해두고 회사별로 플랫폼 이름정도만 알아두면 충분하다. Illumina solexa platform 어댑터 2개를 5' 3'에 붙인다. 각각 forward, reverse strand 의 primer 와 MI 가 태깅..

1. 이항분포(Binomial Distribution) 이항분포는 고정된 시행 횟수 동안 특정 사건이 발생하는 횟수를 나타내는 이산 확률분포입니다.이항분포의 n 과 k 에 따른 그래프 모양 변화, y 값은 그 값이 나올 확률을 의미한다.1.1 정의시행: 동일한 조건에서 여러 번 반복되는 실험(예: 동전 던지기).결과: 두 가지 가능성(성공 또는 실패)이 존재.성공 확률: 각 시행에서 성공할 확률은 일정하며 ppp로 표시.시행 횟수: n1.2 예시동전을 10번 던질 때 앞면이 6번 나올 확률.공장에서 불량률이 5%5\%5%일 때, 20개 제품 중 불량품이 2개일 확률.시행 횟수 n가 매우 크고, 성공 확률 p이 매우 작을 때 np -> m 이 되면 이항분포가 포아송 분포로 근사 가능하다. 예를들어, np=..

https://lms.kmooc.kr/course/view.php?id=13669 K-MOOC www.kmooc.krK-mooc 강좌 R을 활용한 통계학 개론을 정리한 내용입니다. 1. 확률변수(Random Variable)정의: 표본공간에서 정의된 함수.표본공간 S의 각 원소(단위사건)에 실수 값을 부여하는 함수.수학적 표현으로는 X:S→R, 즉 X가 표본공간에서 실수 공간으로 매핑되는 함수.흔히 X,Y,Z로 표현.줄여서 r.v 라고도 부름.확률변수가 특정 값을 가질 확률을 체계적으로 정리한 것.2. 확률변수의 종류이산 확률변수(Discrete Random Variable)확률변수 X가 취할 수 있는 값이:유한개 (finite) 또는자연수와 일대일 대응되는 무한개 (countable infinite)..

https://www.inflearn.com/course/%EC%84%A0%ED%98%95%EB%8C%80%EC%88%98%ED%95%99/dashboard 파이썬을 활용한 선형대수학 - NumPy와 SciPy의 활용 강의 | 조범희 (타블렛깎는노인) - 인프런조범희 (타블렛깎는노인) | 이 강좌에서는 파이썬의 SciPy 라이브러리를 활용하여 다양한 행렬계산 관련 문제들을 푸는 방법을 배웁니다.파이썬을 몰라도, 선대개 지식이 얕아도 주어진 문제를www.inflearn.com 지금까지 배운 문법을 종합하면 원하는 행렬을 코딩할 수 있다.b1 = (-1) * np.ones((4,))b2 = 2 * np.ones((5,))b3 = np.ones((4,))A = np.diag(b1, k=-1) + np.dia..

https://www.inflearn.com/course/%EC%84%A0%ED%98%95%EB%8C%80%EC%88%98%ED%95%99/dashboard 파이썬을 활용한 선형대수학 - NumPy와 SciPy의 활용 강의 | 조범희 (타블렛깎는노인) - 인프런조범희 (타블렛깎는노인) | 이 강좌에서는 파이썬의 SciPy 라이브러리를 활용하여 다양한 행렬계산 관련 문제들을 푸는 방법을 배웁니다.파이썬을 몰라도, 선대개 지식이 얕아도 주어진 문제를www.inflearn.com np.hstack() / np.vstack()1D array 의 stack의 경우 hstack과 vstack 의 결과가 다르다. 매개변수를 tuple 형태로 받는다. 1D,2D vector가 혼합되어 있는겨우는 vstack만 가능..