'Web BLAST'에 해당되는 글 1건
2010. 1. 15. 15:18
BLAST는 서열들 중 유사성을 갖는 부위를 찾는 프로그램으로 서열 데이터베이스에서 nucleotied 또는 proten sequence를 비교하고 매치되는 것들을 찾는다.
대학원 시절 이후로 다시 BLAST를 만지게 될지는 몰랐지만 앞으로 계속 자주 만져야 할거 같아서 처음부터 정리를 해보자 그 첫번째로 설치부터!!
BLAST는 웹사에서 사용할 수 있는 Web BLST와 사용자 컴퓨터 혹은 서버에서 사용 가능한 Local BLAST로 나뉠 수 있다. 그중에서 이번에는 Local BLST설치 및 사용법에 대해 정리해 보자( 사실 Web BLAST는 어찌 설치했는지 기억이 안나서~~ㅋㅋㅋ)
1. BLAST Download & Install
BLAST는 NCBI FTP 사이트에서 다운로드 받을 수 있다. 자신의 컴퓨터 OS 버전에 따라 원하는 BLAST를 다운로드 받는다.(이곳에서는 Linux를 기반으로 설명한다.)
원하는 버전의 BLAST를 다운로드 받았으면 원하는 폴더에 압축을 푼다.
2. Local BLAST를 이용한 Sequence Search
1. 먼저 검색할 서열 데이터베이스가 필요하다. 이는 원하는 서열 데이터베이스를 NCBI혹은 해당 사이트로 부터 다운받자
2. 다운받은 Raw데이터 혹은 Fasta 형식의 데이터를 이용해 BLAST에서 사용가능한 DB Format으로 변경을 하자. 이는 BLAST 검색 속도를 향상기키기 위해 필요한 단계이다.
# /usr/local/BLAST/formatdb -i [Data_path] a T -p [DNA/RNA]
위 명령은 사용자 환경에 따라 달라질 수 있으니 잘 확인하고 만드시길!특히 -p 옵션은 만들어지는 db가 nucleotide냐 protein이냐를 정하는 옵션이다. 이 옵션에 따라 blast program을 실행시킬 수 있다. default는 protein이니 blastn을 사용하기 위해서는 꼭 -p F 로 db를 만들어 주어야 한다.
3. BLAST Search
1. 첫번째로 검색하고자 하는 서열 정보를 Fasta format으로 만들어 준다.
>gi|84040121|gb|ABC49914.1
ACGTTTTTTTTTAAAAGAGAGAGAGAGCCCCCCCCC
2. BLAST를 이용해 검색한다.ACGTTTTTTTTTAAAAGAGAGAGAGAGCCCCCCCCC
# /usr/local/BLAST/blastall -p blastn -d /db_path -i sequence.fasta -o sequence.out
4. 검색된 결과를 확인한다.