中科院遗传与发育生物学研究所生物信息学考博考试要求考生具备扎实的分子生物学、遗传学理论基础和生物信息学技术能力,同时注重科研思维与跨学科整合能力。考生需系统掌握基因组学、转录组学、蛋白质组学等高通量组学数据的分析流程,熟练运用Python/R语言进行生物信息学计算,并具备独立设计实验方案和解读数据的能力。
考试科目主要分为三部分:第一部分为专业基础,涵盖《生物信息学导论》(王前,2020版)、《基因组学》(Lander et al., 2001)和《分子生物学原理》(Alberts et al., 2002),重点考察基因组、转录组装因子预测、单细胞测序数据分析等核心内容。第二部分为技术实践,要求考生基于NCBI、Ensembl等公共数据库完成数据检索与可视化,使用 BEDTools、GATK等工具处理测序数据,并运用机器学习算法(如随机森林、支持向量机)进行生物标志物挖掘。第三部分为科研综合能力,需提交一篇结合发育生物学与计算模型的论文,重点考察对果蝇胚胎发育时序调控网络、斑马鱼干细胞分化机制等前沿研究的理解深度。
参考书目需重点研读《Computational Biology: A Practical Approach》(Sawyer et al., 2020)中单细胞多组学整合章节,以及《Bioinformatics and Computational Biology》(Rustici et al., 2019)中关于微分方程模型在代谢通路分析中的应用案例。建议考生建立知识图谱,将CRISPR/Cas9基因编辑技术原理与RNA-seq数据分析流程、空间转录组学(spATAC-seq)定位方法与三维发育重建算法进行关联记忆。
实验设计部分需掌握PRISMA框架,能独立完成从样本选择(如线虫胚胎不同发育阶段的时空分布)、测序方案优化(Illumina NovaSeq 6000在体染色质 accessibility测序参数设置)到生物信息流程设计(QTL-seq数据降噪采用滑动窗口法)的全流程规划。2023年新增考核点包括:基于AlphaFold2的蛋白质结构预测与晶体学数据验证的交叉验证策略;利用BERT模型进行非编码RNA保守基序的跨物种比较分析。
备考策略建议分三阶段实施:第一阶段(2个月)完成《分子生物学》精读,重点标注表观遗传调控(如DNA甲基化与组蛋白修饰的互作网络)、信号转导通路(如Wnt/β-catenin通路在斑马鱼神经嵴细胞定向分化中的调控节点)等核心概念。第二阶段(1.5个月)进行技术实操训练,通过Bioconductor包完成单细胞RNA-seq数据标准化(Harmony算法)、细胞亚群聚类(Seurat 3.0)及轨迹推断(Monocle3),同时精研《Nature Methods》2022年发表的10x Genomics Visium数据预处理技术。第三阶段(1个月)开展模拟考核,针对2021-2023年已发表的发育生物学顶刊(如Development、Genome Research)中的12篇经典论文进行文献精读,重点解析计算模型(如偏微分方程描述的细胞迁移扩散过程)与实验验证的衔接逻辑。
特别需要注意的是,2024年考试将增加AI辅助研究模块,要求考生使用ChatGPT或Midjourney等工具完成以下任务:基于已公开的果蝇P体细胞图谱,生成三维空间转录组学可视化模型;利用GPT-4进行CRISPR靶点预测的合理性验证。同时需关注发育生物学与合成生物学的交叉领域,如CRISPR-Cas9在调控线虫再生能力中的多组学整合分析。
备考资源推荐:中国大学MOOC《生物信息学高级计算》(北大,2023)、Coursera《Genomic Data Science》(Johns Hopkins,2022)、GitHub开源项目BioPython 3.11标准库文档。建议每日保持3小时专业英语文献阅读(重点期刊:Nucleic Acids Research、Bioinformatics),并参与生物信息学竞赛(如Kaggle生命科学赛道)提升实战能力。考前需完成至少5次全真模拟考试,重点训练数据解读(如从WGBS数据中提取印记域边界)、论文写作(强调创新点提炼)和答辩陈述(突出技术路线可行性)三大核心技能。