• 课程安排

    课前预习

    提前预习基因课视频(www.genek.tv)、安装软件

    1. 视频课程:《生物信息入门之 Linux》

    2. 视频课程:《生物信息软件安装》

    3. 视频课程:《测序数据过滤和质控》

    4. 服务器安装:blast、fastp、Soapdenovo

    5. 个人电脑安装:Mega

    第一天

    Linux 基础

    1. 测序原理:illumina、PacBio、Nanopore

    2. 计算机基础:CPU、内存、硬盘、核、进程、并行计算等

    3. Linux 常用命令

    4. 生物信息软件安装:手动安装、自动安装

    第二天

    Linux 下数据分析实操

    1. 高级命令:grep、sort、awk、sed 等

    2. 任务练习:测序数据过滤和质控

    3. 任务练习:基因家族分析

    第三天

    基因组拼接

    1. 基因组Survey:基因组大小、杂合度、重复序列含量评估

    2. 拼接策略制定:二代、三代、Hi-C等

    3. 拼接原理

    4. 拼接软件:SOAPdenovo、canu、pilion 等

    第四天

    基因组注释

    1. 重复序列注释:RepeatMasker

    2. 基因结构注释:使用 BRAKER 训练参数模型

    2. 基因结构注释:使用 Maker 自动化注释

    3. 基因功能注释:eggnog-mapper 结合自主开发流程

    第五天

    比较基因组

    1. 基因家族鉴定:orthofinder、韦恩图

    2. 物种树构建

    3. 共线性分析:MCscanX、共线性图

    4. 基因家族分析:同源基因鉴定、进化树构建、进化树美化
    5. 正选择分析

  • 课程安排

    本次课程需有 Linux 基础,至少需掌握常用的 20 个 Linux 命令。

    不是我做你看,而是带着你纯实战。

    每个学员分配一台服务器,手把手带你搭建生物信息平台、部署分析流程。

    课前预习

    预习基因课视频课程(www.genek.tv)并安装软件

    1. 视频课程:《生物信息入门之 Linux》《生物信息入门之 Python》

    2. 个人电脑安装:MobarXterm(远程登录)、Anaconda(Python开发环境)

    第一天

    服务器搭建

    1. 服务器选购:从 5千 到 50万的服务器配置,戴尔、浪潮的配置清单供参考

    2. 组建 RAID 阵列确保数据安全

    3. 现场演示 Linux 系统安装

    4. 磁盘分区、格式化

    5. 磁盘配额:控制每个用户的空间大小

    6. 服务器网络配置

    7. 远程登录与 SSH 服务服务配置

    8. 管理面板安装:可视化管理服务器

    第二天

    基本功能配置

    1. 基础软件安装

       - R 语言和 R 包的自动化安装

       - Perl 语言和 Perl 模块的自动化安装

       - Python 语言与 Python 模块的自动化安装

    2. Rstudio Server 安装与配置

    3. Blast Server 部署:拥有私有 Blast 网站

    4. Anaconda 安装和配置

    5. 生物信息数据库部署

    6. 常见物种参考基因组下载和管理

    第三天

    分析流程部署

    1. 50款常用生物信息软件安装

       - 基本工具:fastqc、fastp、blast+、Diamond、Bowtie2、muscle、RAxML 等

    2. 基因组分析软件和流程部署
        - 安装 Jellyfish、GCE、ALLPATH-LG、CANU、RepeatMasker、Augustus、Maker、Orthofinder、MCScanX 等软件

       - 部署基因课提供的整套基因组分析流程

    3. 转录组分析软件软件和流程部署

       - 安装 Trinity、Hisat2、StringTie、corset、RSEM、DESeq2、edgeR、ClusterProfiler 等软件

       - 部署基因课提供的整套转录组分析流程
    4. 重测序分析软件安装和流程部署
    - 安装 BWA、samtools、picard、bedtools、vcftools、bcftools、GATK、SNPEff 等软件

       - 部署基因课提供的整套重测序分析流程

    第四天

    Python 基础

    1. Perl、Python、R、C、Java等语言比较

    2. Python 编程环境搭建

    3. 数据类型:数值型、字符型、布尔型

    4. 数据结构:标量、列表、字典

    5. 流程控制:条件控制、循环控制

    6. 输入输出:读取文件内容,输出结果

    第五天

    小程序开发

    1. 统计人类染色体总长、平均长度、GC含量等信息

    2. 读取外部参数

    3. 项目实战:根据基因位置、名称提取基因序列

    4. 项目实战:处理 blast 比对结果

    5. 使用 BioPython 处理不同格式的序列文件

    6. 使用正则表达式匹配和捕获文本内容