생명정보개론(bioinformatics) - Genebank,SNP 유전자 검색
이 포스트는 K-MOOC 의 생명정보개론 강의를 들으며 정리한 것으로 공부하면서 생겼던 의문점을 함께 정리하였습니다.
Location : X 염색체 q25번 위치에 존재
Exon count : 이 유전자가 전사되고 스플라이싱 과정을 거친 후, 10개의 엑손이 포함된 mRNA가 생성됨.
Annotation release 와 Assembly의 관계
각 Annotation release는 특정 Assembly 버전을 기준으로 유전자의 위치를 설명한다. 예를 들어 Rs_2023_10이라는 주석은 GRCh38.p14 및 T2T-CHM13v2.0을 기준으로 하고 있으며, 이전 주석 데이터(105.20220307)는 GRCh37.p13을 기준으로 한다.
Exon 과 Coding Sequence(CDS) 의 개념
Exon은 유전자의 부분으로, 단백질을 암호화하는 데 사용되는 서열이다. 유전자가 전사되면, 엑손과 인트론 모두 pre-mRNA로 전사되고, 이후 스플리아싱 과정에서 인트론이 제거되고, 엑손만이 결합하여 최종 mRNA를 형성한다.
CDS는 유전자 내에서 엑손에 해당하는 부분 중에서 실제로 단백질을 암호화하는 서열.