python——sns.distplot y轴数据如何归一化

在Seaborn库的distplot函数中,y轴并不是直接表示数据的频数或概率。distplot默认会绘制直方图(histogram)并且用核密度估计(Kernel Density Estimate,KDE)进行平滑。这时候y轴表示的是核密度估计的值。
如果你想要对y轴进行归一化,你可以设置norm_hist参数为True,它将直方图的面积归一化为1。另外,你可以使用hist_kws参数来传递给hist绘图函数的参数,例如,weights参数用于指定直方图的权重。以下是一个示例:

import seaborn as sns
import matplotlib.pyplot as plt

# 示例数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

# 使用distplot绘制直方图和核密度估计
sns.distplot(data, norm_hist=True, kde=False, hist_kws={'weights': [1/len(data)]*len(data)})

plt.show()

在这个例子中,norm_hist=True确保直方图的面积总和为1,而hist_kws={‘weights’: [1/len(data)]*len(data)}使用权重将直方图的高度归一化。请注意,kde=False禁用了核密度估计,因为在这个例子中我们主要关注直方图的归一化。

我有一列数据,我想画这列数据的概率分布图,可以使用Seaborn库的distplot函数来绘制数据的概率分布图。以下是一个简单的例子:

import seaborn as sns
import matplotlib.pyplot as plt

# 示例数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

# 使用distplot绘制概率分布图
sns.distplot(data, hist=True, kde=True, bins=6, hist_kws={'edgecolor': 'black'})

# 显示图形
plt.show()

在这个例子中,data是你的数据列。hist=True表示显示直方图,kde=True表示显示核密度估计。bins参数用于指定直方图的箱数,可以根据你的数据进行调整。hist_kws={‘edgecolor’: ‘black’}用于设置直方图的边缘颜色。
你可以根据实际需求对这些参数进行调整。这段代码将显示数据的概率分布图,包括直方图和核密度估计。

y轴数据有时候是零点几,有时候是几百,该怎么办
如果你希望在绘制概率分布图时,y轴的数值以概率的形式呈现,而不是原始的频数或密度,你可以使用norm_hist=True参数来将直方图归一化。这样,y轴将表示概率密度而不是原始的频数。
以下是更新后的代码:

import seaborn as sns
import matplotlib.pyplot as plt

# 示例数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

# 使用distplot绘制概率分布图,归一化直方图
sns.distplot(data, hist=True, kde=True, bins=6, hist_kws={'edgecolor': 'black'}, norm_hist=True)

# 显示图形
plt.show()

在这个例子中,norm_hist=True参数确保直方图的面积总和为1,因此y轴表示的是概率密度。这样,不论数据的范围如何,y轴的值都会在0到1之间,表示相对的概率。

fig=sns.distplot(data['motif_rmsd'], hist=True, kde=True, bins=50, hist_kws={'edgecolor':'black'}, norm_hist=True)
plt.ylabel("Density")
plt.show()
hist_fig = fig.get_figure()
hist_fig.savefig('./em_motif_rmsd', dpi = 600)
这是我的代码,但是结果还是y轴的数值很大

如果你的数据的y轴数值仍然较大,即使使用了norm_hist=True参数,可能是由于核密度估计(KDE)的平滑过程引入了较大的值。在这种情况下,你可以考虑绘制纯直方图(不使用KDE)来更好地看到概率分布。以下是修改后的代码:

import seaborn as sns
import matplotlib.pyplot as plt

# 示例数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

# 使用distplot绘制概率分布图,纯直方图,归一化直方图
fig = sns.distplot(data, hist=True, kde=False, bins=50, hist_kws={'edgecolor': 'black'}, norm_hist=True)
plt.ylabel("Density")
plt.show()

# 保存图形
hist_fig = fig.get_figure()
hist_fig.savefig('./em_motif_rmsd', dpi=600)

在这个例子中,我将kde参数设置为False,以便禁用核密度估计,仅显示纯直方图。这样,你应该能够看到y轴的值在0到1之间,表示概率密度。请根据你的数据和需求选择适合的方式。
kde设置为True, y轴数值依旧很大

如果即使在启用norm_hist=True和禁用核密度估计(kde=False)的情况下,y轴仍然显示很大的数值,可能是因为Seaborn默认使用的是高斯核密度估计,可能导致过大的数值。在这种情况下,你可以尝试手动缩放y轴,使其表示概率密度。

以下是一个例子,其中使用y轴数据 * 某个缩放因子来缩放y轴,将其表示为概率密度:

import seaborn as sns
import matplotlib.pyplot as plt

# 示例数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

# 使用distplot绘制概率分布图,启用核密度估计,纯直方图,归一化直方图
fig = sns.distplot(data, hist=True, kde=True, bins=50, hist_kws={'edgecolor': 'black'}, norm_hist=True)

# 缩放y轴,将其表示为概率密度
y_scale_factor = 1 / (max(fig.get_lines()[0].get_ydata()) - min(fig.get_lines()[0].get_ydata()))
plt.gca().set_ylim([0, 1])
plt.gca().set_yticklabels([f'{x * y_scale_factor:.2f}' for x in plt.gca().get_yticks()])

plt.ylabel("Density")
plt.show()

# 保存图形
hist_fig = fig.get_figure()
hist_fig.savefig('./em_motif_rmsd', dpi=600)

在这个例子中,通过计算一个缩放因子,将y轴缩放到0到1之间,并使用set_yticklabels来确保y轴的标签表示概率密度。请根据你的数据和需求进行适当的调整。
怎样将sns.distplot()的纵坐标改成频率形式
在Seaborn中,sns.distplot()函数的y轴默认显示的是核密度估计值。如果你希望将y轴改成频率形式,你可以使用y轴数据 * 某个缩放因子的方式手动进行缩放。以下是一个示例代码:

import seaborn as sns
import matplotlib.pyplot as plt

# 示例数据
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5]

# 使用distplot绘制频率分布图
fig = sns.distplot(data, hist=True, kde=False, bins=6, hist_kws={'edgecolor': 'black'})

# 计算缩放因子,将y轴缩放成频率形式
y_scale_factor = 1 / len(data)
plt.gca().set_ylim([0, 1])
plt.gca().set_yticklabels([f'{x * y_scale_factor:.2%}' for x in plt.gca().get_yticks()])

plt.ylabel("Frequency")
plt.show()

在这个例子中,通过计算一个缩放因子,将y轴缩放到0到1之间,并使用set_yticklabels将y轴标签表示为频率形式(百分比形式)。根据你的具体需求,可以调整代码中的参数。
matplotlib.pyplot 如何画概率分布图
在matplotlib.pyplot中,你可以使用hist函数来绘制概率分布图。以下是一个简单的示例:

import matplotlib.pyplot as plt
import numpy as np

# 示例数据
data = np.random.randn(1000)  # 生成随机正态分布数据

# 绘制概率分布图
plt.hist(data, bins=30, density=True, edgecolor='black')  # density=True 表示将直方图归一化为概率分布
plt.xlabel('Value')
plt.ylabel('Probability Density')
plt.title('Probability Distribution Plot')

plt.show()

在这个例子中,data是你的数据,bins参数表示直方图的箱数,density=True表示将直方图归一化为概率分布。通过这样的设置,y轴将表示概率密度而不是原始的频数。你可以根据实际需求调整bins等参数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/871676.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java | Leetcode Java题解之第355题设计推特

题目&#xff1a; 题解&#xff1a; class Twitter {private class Node {// 哈希表存储关注人的 IdSet<Integer> followee;// 用链表存储 tweetIdLinkedList<Integer> tweet;Node() {followee new HashSet<Integer>();tweet new LinkedList<Integer&g…

多线程并发服务器

多线程并发服务器 服务端 #include <stdio.h> #include <string.h> #include <sys/errno.h> #include <sys/socket.h> #include <arpa/inet.h> #include <unistd.h> #include <stdlib.h> #include <ctype.h> #include <p…

Nofollow不好吗?Follow和Nofollow的区别

Follow和Nofollow的区别 “follow”和“nofollow”是HTML中的两种属性&#xff0c;它们通常用于<a>标签&#xff0c;即超链接。这两种属性对搜索引擎优化&#xff08;SEO&#xff09;有重要的影响。 1.Follow链接&#xff08;Dofollow&#xff09;: 这是默认的链接属性…

带你玩转小程序推广,实现短链接一键跳转

不知道各位有没有想过&#xff0c;短链接直接跳转到微信小程序到底该怎么操作呢&#xff1f;掌握这个小技能&#xff0c;能让你的推广效率大幅提升哦。今天就给大家分享一个全新方法&#xff0c;教你如何从短链接直接跳转到微信小程序&#xff0c;实现高效的一键式跨越。 一、…

如何开发出一款优秀的软件

一段时间以来&#xff0c;笔者都想写一篇关于如何开发一款优秀软件的文章&#xff0c;关于软件的质量&#xff0c;笔者一直很有想法&#xff0c;自2014年从一家很优秀的软件公司出来后&#xff0c;笔者发现很多软件都存在这样&#xff0c;那样的问题&#xff0c;最终相关企业也…

docker连接宿主机redis,提示Connection refused

目录 一、测试环境 二、问题现象 三、问题总结 一、测试环境 centos 7 redis-5.0.14 docker-26.0.1 二、问题现象 服务器重启后docker连接宿主机redis&#xff0c;提示Connection refused Reconnecting, last destination was /172.25.xxx.x:6379 …

[CTF]-Reverse:纯逻辑分析题型综合解析

C语言&#xff1a; 字符串爆破&#xff1a; 例题&#xff08;BUUCTF SimpleRev&#xff09;&#xff1a; 查壳 看ida 这里的中心就是两个字符串和一个计算式子&#xff0c;textkillshadow和str2adsfkndcls&#xff0c;计算式子str2[v2] (v1 - 39 - key[v3 % v5] 97) % 26 …

汽车的UDS诊断02

UDS的不同服务: 1)物理寻址和功能寻址 can总线上往往有多个ECU,诊断设备可以和某个ECU通信,也可以和多个ECU通信,通过物理寻址和功能寻址来解决这个问题,只针对请求报文: 物理寻址:就是诊断仪与ECU之间点对点通信 功能寻址:就是诊断仪与多个ECU之间一对多信 我们的…

Github 2024-08-22 Go开源项目日报 Top10

根据Github Trendings的统计,今日(2024-08-22统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10TypeScript项目1精选Go框架、库和软件列表 创建周期:3700 天开发语言:Go协议类型:MIT LicenseStar数量:127377 个Fork数量:11751 …

【备忘录模式】设计模式系列:掌握状态回溯的艺术(设计详解)

文章目录 备忘录设计模式详解引言1. 设计模式概述2. 备忘录模式的基本概念2.1 备忘录模式的定义2.2 备忘录模式的关键角色 3. 备忘录模式的实现原理3.1 备忘录模式的工作流程3.2 模式的优缺点分析3.3 与其他模式的对比 4. 实际案例分析4.1 游戏状态保存与恢复4.2 文档编辑器撤销…

Eureka原理与实践:构建高效的微服务架构

Eureka原理与实践&#xff1a;构建高效的微服务架构 Eureka的核心原理Eureka Server&#xff1a;服务注册中心Eureka Client&#xff1a;服务提供者与服务消费者 Eureka的实践应用集成Eureka到Spring Cloud项目中创建Eureka Server创建Eureka Client&#xff08;服务提供者&…

VScode 连接远程服务器

1、 2、 3、免密登录 1、本地生成密钥 ssh-keygen2、生成的密钥默认在 C:\Users\***\.ssh\ 中3、将私钥 C:\Users\***\.ssh\id_rsa 添加到上面的配置文件中的 IdentityFile 项内4、将公钥 C:\Users\***\.ssh\id_rsa\id_rsa.pub 拷贝到远程 ~/.ssh/authorized_keys 中 4、远程…

Python | Leetcode Python题解之第354题俄罗斯套娃信封问题

题目&#xff1a; 题解&#xff1a; class Solution:def maxEnvelopes(self, envelopes: List[List[int]]) -> int:if not envelopes:return 0n len(envelopes)envelopes.sort(keylambda x: (x[0], -x[1]))f [1] * nfor i in range(n):for j in range(i):if envelopes[j]…

分享小诗梦404炫酷单页面html5源码

源码介绍 分享小诗梦404炫酷单页面html5源码&#xff0c;小诗梦的一个很炫酷页面&#xff0c;感觉应该符合一些人的感觉&#xff01;可以用来做404页面。 源码下载 分享小诗梦404炫酷单页面html5源码

uniapp-部分文件中文乱码

一、问题 在开发时遇到&#xff0c;部分页面的中文显示乱码&#xff0c;如图 搜索了一下解决方法&#xff0c;这里记录一下 二、问题原因&#xff1a; 页面的编码格式不是 utf-8 造成的 三、解决方法 打开出现乱码页面选择编译器左上角的文件 > 以指定编码重新打开 选择U…

[C++] C++11详解 (一)

标题&#xff1a;[C] C11详解 (一) 水墨不写bug 目录 前言 一、列表初始化 二、STL的初始化列表&#xff08;initializer_list —— Cplusplus.com&#xff09; 三、声明方式&#xff08;auto、decltype、nullptr&#xff09; 1.auto ​编辑 2.decltype 正文开始&#x…

腾讯无界微前端框架介绍

一、无界微前端框架概述 无界微前端框架是由腾讯团队推出的&#xff0c;旨在解决现有微前端方案中存在的问题&#xff0c;如适配成本高、样式隔离困难、运行性能不佳、页面白屏、子应用通信复杂、子应用保活机制缺乏等。 技术实现 无界微前端的核心技术是基于Web Component…

数据导入导出(EasyExcel)框架入门指南

写在前面 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站 文章目录 EasyExcel 框架概述依赖APIExcel 实体类注解写 Excel概念介绍写 Excel 通用参数WriteWorkbookWriteSheetWriteTable 代码…

GD32双路CAN踩坑记录

GD32双路CAN踩坑记录 目录 GD32双路CAN踩坑记录1 问题描述2 原因分析3 解决办法4 CAN配置参考代码 1 问题描述 GD32的CAN1无法进入接收中断&#xff0c;收不到数据。 注&#xff1a;MCU使用的是GD32E50x&#xff0c;其他型号不确定是否一样&#xff0c;本文只以GD32E50x举例说…

Vue项目-三级联动的路由跳转与传参

三级联动组件的路由的跳转与传参 三级联动&#xff0c;用户可以点击的&#xff1a;一级分类、二级分类和三级分类 以商城项目为例&#xff0c;Home模块跳转到Search模块&#xff0c;以及会把用户选中的产品&#xff08;产品名字、产品ID&#xff09;在路由跳转的时候&#xff…