两个样本如何做出好看的热图? 返回

     一般我们作热图都会先对数据进行均一化处理,以消除因量纲差异导致的聚类关系失真、数值波动范围过大的影响。
     但是当分析的样品只有两个的时候,数据均一化就失去了意义了,为什么?
先看下面的例子:

       上图就是进行了Z-score均一化后画出来的,只有红色和绿色两种颜色,没有过渡色,非常难看。为什么会这样?
       原因就在于,Z-score是一种对数据进行标准化的方法,其计算方法为减去均值除以标准差。公式具体是下面这样的:当你只有两个样本时,每个数据减去均值后必定是一正一负,并且绝对值相等,再除以标准差,这就使得所有样本标准化后的值都只有一正一负两个数值了。所以热图就只能呈现出只有一种红色和一种绿色。
      既然数据均一化后只能得到红色跟绿色,那就不均一化,然后就会得到下面这张图。

      这张图是用基因的表达量RPKM值来画,大概一看,还觉得比较正常,有颜色渐变。但是再仔细看,你会发现这张图的刻度尺范围比较大,而且绝大部分是绿色?这是什么原因呢?仔细看一下标注你会发现,绝大部分的基因表达量都在10以下,只有两个基因在30以上,所以画出来的热图颜色都往绿色扎堆了。
      如果想要画出好看的热图,办法还是有的!
     我们建议这时候果断弃掉RPKM值,而选择用两个样品基因表达量的差异倍数来作图。这样就变成单列热图了,可以去除异常高表达基因对整体热图的影响,并且直观展现两个样品之间的基因表达量差异。如下图所示,结果更加清晰:

      因此,做热图前对数据进行均一化还是非常有必要的。两个样品画热图,不能进行数据均一化,有时候要根据数据具体情况,用两个样品基因表达量的差异倍数来画热图。

更多基迪奥精彩原创文章,可继续关注我们网站动态发布,同时关注基迪奥微信~扫一扫添加基迪奥好友~随时随地关注行业动态!

【上一篇】 在线交流“转录组、miRNA以及两者贯穿分析”
【下一篇】 在线交流“Blast2GO的安装使用与演示”
  • 在线客服
    在线客服
  • 微信客服
  • 电话
    020-39341079

资讯网做梦梦到蛇怎么解释灵宝到兰考网站建设分类okex交易所4周年seo 论坛易经起名取名下载开手机店起名字静态网站建设工业设计观后感花店起名字大全菏泽网站制作效果钟灵毓秀起名网站制作制作责任公司周公解梦大全查询梦见白布启起名seo基本知识周易八卦解梦查询网站建设江西边潇潇王千源演的电视剧都市异能小说百鸟朝凤观后感100字男孩子起名字寓意好的字有哪些迅捷图片转换器手机迅雷电影天堂下载电影夏俊峰案给餐饮店铺起名大全集2020贾姓女孩起名起名大全女孩子静姓毛的四个字起名大全红色星球下载少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学 邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人?男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户19岁小伙救下5人后溺亡 多方发声315晚会后胖东来又人满为患了张立群任西安交通大学校长“重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费 小米:已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克 外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒 投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长 师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡“开封王婆”爆火:促成四五十对奥巴马现身唐宁街 黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

资讯网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化