生信宝典文章集锦 (20180402)

生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题。但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程序。也许你可以跟着一个测序分析流程完成操作,但不懂得背后的原理,不知道什么参数需要修改,结果可以出来,却把握不住对还是错。

学习生信从来就不是一个简单的事,需要做好持久战的心理准备。

在学习时,我们都希望由浅入深的逐步深入,不断地练习和实践,这就是为什么我们需要一本书,因为书很系统。但生信发展的历史短于计算机编程的历史,如果想要一门程序设计的入门数据,每种语言都可以找到几本。但想要一个囊括生信的书,就有些难了。本身生信跨领域,需要多学科的知识,而其内部又有不少分子,都囊括了太大,包括的少又有些隔靴搔痒的感觉。

我们当时都是零基础下自学Linux,  自学Python,自学R,自学高通量测序;这些学习经历,之前都零星地记录在博客里。现在回头去看几年前自己记录的东西,觉得好简单,而当时却费了很大的力气。这些零星的随手记,当时也只是为了自己看,到现在确实只有自己能看得懂,不便惠及更多的人。

因此我们创建了生信宝典,希望从不同的角度传播知识。这个不同有三点含义,一是形式上的不同,摒弃之前主编们单人作战想写啥就写啥,而是有组织有计划的内容聚合,提供一系列的教程,由入门到提高。二是内容的不同,不去用网上现有教程的通用数据做例子,而是拿实际生物数据,讲述如何解释生信中普遍碰到的问题,讲述如何处理自己的数据。三是立足点不同。在写作时,我们回到了当年,在回忆中用整个阶段的学习去指导当初的那个小白,从那些会了的人觉得微不足道而不会的人又迈不过的坎入手,直击痛点。知识点的收录依据不是是否炫酷,是否难,而是是否必要。如果必要,再简单,也要提及;如果不必要,再炫酷,也暂不纳入。

通过大量的生信例子、关键的注释和浓缩的语句形成下面的一系列学习教程。每一篇内容都不多,可以当做小说阅读,也可以跟着去练,反复几遍,每读一次都会有不同的收获和体会。

系列教程

  • 生物信息之程序

  • 如何优雅的提问

  • 生信宝典视频教程

  • 好色之旅-画图三字经

  • 转录组分析的正确姿势

  • 生信的系列教程

  • 生信的系列书籍

  • 文章用图的修改和排版 (1)

  • 文章用图的修改和排版 (2)

  • 简单强大的在线绘图

  • 简单强大的在线绘图-升级版

  • 论文图表基本规范

  • 学术图表的基本配色方法

  • 英语写作常见错误总结和学习视频

  • 你该知道的杂志分区和影响因子及最新表格下载

  • 你和PPT高手之间,就只差一个iSlide

NGS分析工具评估

  • 39个转录组分析工具,120种组合评估(转录组分析工具哪家强-导读版)

  • 39个转录组分析工具,120种组合评估(转录组分析工具大比拼 (完整翻译版))

  • 无参转录组分析工具评估和流程展示

宏基因组教程

  • 微生物组入门必读+宏基因组实操课程

  • 扩增子图表解读-理解文章思路

  • 扩增子分析流程-把握分析细节

  • 扩增子统计绘图-冲击高分文章

  • 宏基因组分析教程

  • 4500元的微生物组培训资料

ChIP-seq专题

  • ChIP-seq基本分析流程

系列宣传

  • 转录组分析的正确姿势

  • 120分的转录组考题,你能得多少

  • 生物信息作图系列R、Cytoscape及图形排版和Python编程培训研讨班开课了

  • 维密摔倒不可怕,关键时有人搀一把,坚持走下去

  • 生物信息作图系列 - R、网络图及文章图形排版

  • 易生信转录组培训总结和优惠分享

  • 生物信息9天速成班 — 你也可以成为团队不可或缺的人

  • Python没有捷径,但可以加速,零基础九天你也可以会编程

  • 小学生都学Python了,你还不知道怎么开始-资源帖

  • 一个月学会Python的Quora指南和资料放送

  • 扩增子分析基本流程和结果解读

  • 微生物组——扩增子分析专题实战开课啦

  • 如何入门生信Linux

  • 3分和30分文章差距在哪里?

  • 生信必备Linux培训,助您扎好根基

生信生物知识

  • 生物研究中不可缺少的数字概念,多少,多大,多快

文献精读

  • CRISPR-CAS9发展历程小记

  • 一场大病引起的诺贝尔2017年生理学奖角逐

  • Science搞反狗脑 - 人脑和狗脑一样?

  • 一篇压根不存在的文献被引用400次?!揭开” 幽灵文献” 的真面目

  • 基于人工智能的文献检索,导师查找,更聪明

  • GeenMedical:文献查询、筛选、引用排序、相似文献、全文下载、杂志分区、影响因子、结果导出、杂志评述、直接投稿,一站服务

  • YANDEX搜索,不翻墙稳定使用近谷歌搜索

  • Nature我的研究对后人毫无用途:21%的学术论文自发布后从未被引用

  • SCI-HUB镜像,  SSH隧道访问学校内网

  • 为了速成生物学,一位程序员探索了”爆款”基因背后的秘密

  • Nature邀请6位专家为您支招如何写出一流论文?

Linux

  • Linux-总目录

  • Linux-文件和目录

  • Linux-文件操作

  • Linux文件内容操作

  • Linux-环境变量和可执行属性

  • Linux - 管道、标准输入输出

  • Linux - 命令运行监测和软件安装

  • Linux-常见错误和快捷操作

  • Linux-文件列太多,很难识别想要的信息在哪列;别焦急,看这里。

  • Linux-文件排序和FASTA文件操作

  • Linux-应用Docker安装软件

  • Linux服务器数据定期同步和备份方式

  • VIM的强大文本处理方法

  • Linux - Conda软件安装方法

  • 查看服务器配置信息

  • Linux - SED操作,awk的姊妹篇

  • Linux - 常用和不太常用的实用awk命令

  • Bash概论 - Linux系列教程补充篇

  • 一网打进Linux下那些查找命令

CIRCOS系列

  • CIRCOS圈图绘制 - circos安装

  • CIRCOS圈图绘制 - 最简单绘图和解释

  • CIRCOS圈图绘制 - 染色体信息展示和调整

  • CIRCOS增加热图、点图、线图和区块属性

R统计和作图

  • 在R中赞扬下努力工作的你,奖励一份CheatShet

  • 别人的电子书,你的电子书,都在bookdown

  • R语言 - 入门环境Rstudio

  • R语言 - 热图绘制 (heatmap)

  • R语言 - 基础概念和矩阵操作

  • R语言 - 热图简化

  • R语言 - 热图美化

  • R语言 - 线图绘制

  • R语言 - 线图一步法

  • R语言 - 箱线图(小提琴图、抖动图、区域散点图)

  • R语言 - 箱线图一步法

  • R语言 - 火山图

  • R语言 - 富集分析泡泡图 (文末有彩蛋)

  • R语言 - 散点图绘制

  • 一文看懂PCA主成分分析

  • 富集分析DotPlot,可以服

  • R语言 - 韦恩图

  • R语言 - 柱状图

  • R语言 - 图形设置中英字体

  • R语言 - 非参数法生存分析

  • 基因共表达聚类分析和可视化

  • R中1010个热图绘制方法

  • 还在用PCA降维?快学学大牛最爱的t-SNE算法吧, 附Python/R代码

  • 一个函数抓取代谢组学权威数据库HMDB的所有表格数据

  • 文章用图的修改和排版

  • network3D: 交互式桑基图

  • network3D 交互式网络生成

扩增子三步曲

  • 1图表解读-理解文章思路  

  • 2分析流程-把握分析细节  

  • 扩展1:视频教程-夯实分析思路  

  • 扩展2:QIIME2教程-了解分析趋势  

  • 3统计绘图-冲击高分文章  

宏基因组分析专题

  • 1背景知识-Shell入门与本地blast实战

  • 2数据质控fastqc,  Trimmomatic,  MultiQC,  khmer

  • 3组装拼接MEGAHIT和评估quast

  • 4基因注释Prokka

  • 5基于Kmer比较数据集sourmash

  • 6不比对快速估计基因丰度Salmon

  • 7bwa序列比对,  samtools查看,  bedtools丰度统计

  • 8分箱宏基因组binning,  MaxBin,  MetaBin,  VizBin

  • 9组装assembly和分箱bin结果可视化—Anvio

  • 10绘制圈图-Circos安装与使用

  • MetaPhlAn2分析有参宏基因组

NGS基础

  • NGS基础 - FASTQ格式解释和质量评估

  • NGS基础 - 高通量测序原理

  • NGS基础 - 参考基因组和基因注释文件

  • NGS基础 - GTF/GFF文件格式解读和转换

  • 本地安装UCSC基因组浏览器

  • 测序数据可视化 (一)

  • IGV基因组浏览器可视化高通量测序数据

  • 测序文章数据上传找哪里

  • GO、GSEA富集分析一网打进

  • GSEA富集分析 - 界面操作

  • 去东方,最好用的在线GO富集分析工具

  • 生信软件系列 - NCBI使用

癌症数据库

  • UCSC XENA - 集大成者(TCGA, ICGC)

  • ICGC数据库使用

  • TCGA数据库在线使用

Python

  • Python学习 - 可视化变量赋值、循环、程序运行过程

  • Python极简教程 (一)

  • Python教程(二)

  • Python教程(三)

  • Python教程 (四)

  • Python教程(五)

  • Python教程 (六)

  • Pandas,让Python像R一样处理数据,但快

  • Python解析psiBlast输出的JSON文件结果

  • 为啥我的Python这么慢 - 项查找 (二)

  • 为啥我的Python这么慢 (一)

  • Python资源

  • 关于Python中的main和编程模板

  • 莫烦Python机器学习

NGS软件

  • Rfam 12.0+本地使用 (最新版教程)

  • 轻松绘制各种Venn图

  • ETE构建、绘制进化树

  • psRobot:植物小RNA分析系统

  • 生信软件系列 - NCBI使用

  • 去东方,最好用的在线GO富集分析工具

Cytoscape网络图

  • Cytoscape教程1

  • Cytoscape之操作界面介绍

  • 新出炉的Cytoscape视频教程

分子对接

  • 来一场蛋白和小分子的风花雪月

  • 不是原配也可以-对接非原生配体

  • 简单可视化-送你一双发现美的眼睛

  • 你需要知道的那些前奏

生信宝典之傻瓜式

  • 生信宝典之傻瓜式 (一) 如何提取指定位置的基因组序列

  • 生信宝典之傻瓜式 (二) 如何快速查找指定基因的调控网络

  • 生信宝典之傻瓜式 (三) 我的基因在哪里发光 - 如何查找基因在发表研究中的表达

  • 生信宝典之傻瓜式 (四) 蛋白蛋白互作网络在线搜索

  • 生信宝典之傻瓜式 (五) 文献挖掘查找指定基因调控网络

生信人写程序

  • 生信人写程序1. Perl语言模板及配置

  • 生信人写程序2. Editplus添加Perl, Shell, R, markdown模板和语法高亮

小技巧系列

  • 参考文献中杂志名字格式混乱问题一次解决

招聘

  • 易汉博欢迎您加入

精品回顾

画图三字经 生信视频 生信系列教程 心得体会 癌症数据库 

高通量分析 Linux Python 在线画图

(错误矫正基金:如果您在阅读过程中发现文字或命令错误,请留言或加小编微信指出,获取红包或累积奖励。希望大家多监督,反馈。适用于所有原创文章。)