꼭 배워야 할 것: 1. 컴퓨터 기초(linux perl R 또는 python matlab)
2. 생물정보학(시퀀싱 데이터베이스 데이터 형식)에 대한 기본 지식
3. 생물정보학 연구 분야(전체 게놈, 전체 전사체, 전체 엑솜, 포획 표적 영역 시퀀싱)
4. 생물정보학 응용 분야(종양 스크리닝, 산전 진단, 역학, 성격 화학 의학)
분할 및 정복:
1. 컴퓨터 기본 사항, 세 권의 책을 읽고 단계별로 익히는 방법을 배워야 하며 의도적으로 책을 찾을 필요가 없습니다. 일반적으로 Linux는 Brother Bird 개인 요리입니다. Perl은 작은 낙타(Little Camel)를, R은 R in Action을 의미합니다. 그러나 정말로 초보자가 되고 싶다면 각각 5권 이상의 책을 읽어야 합니다. 내 클라우드 디스크에 이 기본 고화질 인쇄 버전이 있습니다. Taobao에 가서 무료 배송으로 수십 위안에 인쇄할 수 있습니다. 백 위안 이상!
2. 생물정보학 및 시퀀싱에 대한 기본 지식 Baidu 라이브러리에서 12세대, 2세대 및 3세대 시퀀서에 대한 기사를 찾아 자세히 읽어보세요. 애니메이션 설명을 다운로드하세요. 주요 주류 시퀀서에 대해 알아보고 먼저 유전학에 대한 Chen Wei의 설명을 살펴보세요. NCBI, ENSEMBL, UCSC 및 기타 학습할 수 있는 데이터베이스(uniprot, IMGT, KEGG, OMIN, TIGR, GO) 바이두 라이브러리도 자체적으로 정보를 검색하지만, 이번에는 공식 웹사이트에 가서 각 페이지를 클릭하고 각 내용을 중국어로 번역하여 철저하게 이해해야 합니다. 이것은 주로 프로젝트 과정에서 천천히 배우거나 수업에 갈 기회가 있으면 읽게 될 것입니다. 그렇지 않으면 주로 sam, vcf, fasta, fastq, bed, gtf, gff, genbank, ensembl을 포함하여 I 즉시 잊어 버렸습니다. , psl 등
3. 생물정보학 연구 분야는 각 분야별로 다양한 소프트웨어가 주로 포함되어 있으며, 일반적으로 일반적으로 사용되는 소프트웨어는 수백 가지에 달하는 것으로 추정됩니다. 5~6년 이상 업계에서는 이를 모두 사용할 가능성이 높습니다. 더욱이 이를 위해서는 소프트웨어 매뉴얼을 읽는 것뿐만 아니라 해당 분야에 대한 연구가 완전히 필요합니다. 주요 전문가의 리뷰.
a) 기본 생물정보학 소프트웨어(blast suite, fastqc, flash, blast, solexaQA, NGS-QC-toolkit, SRA-toolkit, fastx-toolkit)
b) snp- 호출 관련 소프트웨어(bwa, bowtie, samtools, GATK, VarScan.jar, annovar)
c) 게놈 관련 소프트웨어(velvet, SOAPdenovo2,peatmasker,repeatscount,pillar,orthoMCL,inparanoid,clustw,muscle,MAFFT, Quickparanoid, blast2go, RAxML, phyML)
d) 전사체 관련 소프트웨어(trinity, tophat, cuplinks, RseQC, RNAseq, GOseq, MISO, RSEM, khmer, screed, Trimmomatic, transDecoder, broad-tools , picard-tools, htseq, 커프디프, edgeR, DEseq, funnet, davidgo, wewe, kobas, KEGG, Amigo, go)