'blast'에 해당되는 글 2건
2010. 2. 4. 10:41
이전에 Blast 설치 포스트에 보면 마지막에 Blast search를 간단하게 설명했었다. 오늘은 그 Blast search중 프로그램을 선택하는 부분이 있는데 그 프로그램이 어떤것들이 있는지 알아보겠다.
Blast의 5가지 프로그램
- blastp : 단백질 – 단백질 비교 / 관련성이 먼 것을 찾기 위해 치환행렬 사용
- blastn : 염기 – 염기 비교 / 관련성이 멀지 않으며 아주 점수가 높은 매치에 사용
- blastx : 염기(번역) – 단백질 비교 / 새로운 DNA 서열 및 EST 분석에 응용
- tblastn : 단백질 – 염기(번역) 비교 / DB중 코딩 부위를 찾는데 유용함
- tblastx : 염기(번역) – 염기(번역) 비교 / EST분석에 유용하나 많은 계산을 요함
'ººº::Learning™:: > ::BioInformatics™::' 카테고리의 다른 글
2010. 1. 15. 15:18
BLAST는 서열들 중 유사성을 갖는 부위를 찾는 프로그램으로 서열 데이터베이스에서 nucleotied 또는 proten sequence를 비교하고 매치되는 것들을 찾는다.
대학원 시절 이후로 다시 BLAST를 만지게 될지는 몰랐지만 앞으로 계속 자주 만져야 할거 같아서 처음부터 정리를 해보자 그 첫번째로 설치부터!!
BLAST는 웹사에서 사용할 수 있는 Web BLST와 사용자 컴퓨터 혹은 서버에서 사용 가능한 Local BLAST로 나뉠 수 있다. 그중에서 이번에는 Local BLST설치 및 사용법에 대해 정리해 보자( 사실 Web BLAST는 어찌 설치했는지 기억이 안나서~~ㅋㅋㅋ)
1. BLAST Download & Install
BLAST는 NCBI FTP 사이트에서 다운로드 받을 수 있다. 자신의 컴퓨터 OS 버전에 따라 원하는 BLAST를 다운로드 받는다.(이곳에서는 Linux를 기반으로 설명한다.)
원하는 버전의 BLAST를 다운로드 받았으면 원하는 폴더에 압축을 푼다.
2. Local BLAST를 이용한 Sequence Search
1. 먼저 검색할 서열 데이터베이스가 필요하다. 이는 원하는 서열 데이터베이스를 NCBI혹은 해당 사이트로 부터 다운받자
2. 다운받은 Raw데이터 혹은 Fasta 형식의 데이터를 이용해 BLAST에서 사용가능한 DB Format으로 변경을 하자. 이는 BLAST 검색 속도를 향상기키기 위해 필요한 단계이다.
# /usr/local/BLAST/formatdb -i [Data_path] a T -p [DNA/RNA]
위 명령은 사용자 환경에 따라 달라질 수 있으니 잘 확인하고 만드시길!특히 -p 옵션은 만들어지는 db가 nucleotide냐 protein이냐를 정하는 옵션이다. 이 옵션에 따라 blast program을 실행시킬 수 있다. default는 protein이니 blastn을 사용하기 위해서는 꼭 -p F 로 db를 만들어 주어야 한다.
3. BLAST Search
1. 첫번째로 검색하고자 하는 서열 정보를 Fasta format으로 만들어 준다.
>gi|84040121|gb|ABC49914.1
ACGTTTTTTTTTAAAAGAGAGAGAGAGCCCCCCCCC
2. BLAST를 이용해 검색한다.ACGTTTTTTTTTAAAAGAGAGAGAGAGCCCCCCCCC
# /usr/local/BLAST/blastall -p blastn -d /db_path -i sequence.fasta -o sequence.out
4. 검색된 결과를 확인한다.