【Matplotlib学习日记】股票涨跌幅与交易量的多维可视化分析
创作时间:
作者:
@小白创作中心
【Matplotlib学习日记】股票涨跌幅与交易量的多维可视化分析
引用
CSDN
1.
https://blog.csdn.net/OAkic/article/details/146225364
一、背景与目标
最近在学习使用Matplotlib进行金融数据的可视化分析,尝试通过一个实际案例理解如何将多个维度的数据(价格涨跌、交易量、开盘-收盘价关系)融合在一张图中。本文基于Matplotlib官方示例代码,解析其实现逻辑,并分享调试过程中的心得体会。
二、代码解析
1. 数据加载与处理
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.cbook as cbook
# 加载Google股票数据
price_data = cbook.get_sample_data('goog.npz')['price_data']
price_data = price_data[-250:] # 取最近250个交易日数据
- 关键点:使用
matplotlib.cbook内置的示例数据,截取最近250天数据,保证分析的时效性。
2. 计算涨跌幅(Delta)
delta1 = np.diff(price_data["adj_close"]) / price_data["adj_close"][:-1]
- 公式:
- 解释:计算每日调整后收盘价的百分比变化,反映股价波动。
3. 定义散点图参数
volume = (15 * price_data["volume"][:-2] / pricec_data["volume"][0])**2 # 点的大小(交易量)
close = price_data["close"][:-2] / price_data["open"][:-2] # 修正后的颜色参数(收盘价/开盘价)
- 问题修复:原始代码中
close的计算有误(实际为close * open),修正为收盘价与开盘价的比率,反映当日价格趋势。
4. 绘制多维散点图
fig, ax = plt.subplots()
ax.scatter(delta1[:-1], delta1[1:], c=close, s=volume, alpha=0.5, cmap='coolwarm')
# 添加标签和样式
ax.set_xlabel(r'$\Delta_i$', fontsize=15)
ax.set_ylabel(r'$\Delta_{i+1}$', fontsize=15)
ax.set_title('Volume and Percent Change (Color: Close/Open Ratio)')
ax.grid(True)
plt.colorbar(ax.collections[0], label='Close/Open Ratio')
fig.tight_layout()
plt.show()
- 参数说明:
c=close:颜色映射为收盘价/开盘价比率(>1为红色,表示当日上涨;<1为蓝色,表示下跌)。s=volume:点的大小反映交易量。alpha=0.5:半透明效果避免重叠遮挡。
三、结果与可视化
1. 输出图表
2. 图表解读
- 横纵轴:相邻两日的涨跌幅(Δ_i 和 Δ_{i+1}),用于分析价格变化的连续性或反转性。
- 点大小:交易量越大,点面积越大。图中右下方的大点表示某日大跌后次日反弹,且伴随高交易量。
- 颜色:红色点(收盘价 > 开盘价)多集中在右上象限,说明上涨日次日继续上涨的概率较高。
四、心得体会
1. 调试中的发现
- 数据对齐陷阱:原始代码中
volume和close使用[:-2]切片,而delta1长度为249(因为np.diff减少1个元素)。最终通过delta1[:-1]和delta1[1:]对齐到248个点,需特别注意数组长度的匹配。 - 颜色映射优化:将
cmap改为coolwarm并添加颜色条,使图表更直观。
2. 多维数据可视化的价值
- 信息密度:通过点位置、大小、颜色三个维度,单图传递了价格趋势、交易量、开盘-收盘关系三种信息。
- 模式识别:观察点的分布,可推测该股票可能存在短期动量效应(连续上涨/下跌)。
3. 改进方向
- 添加趋势线:用
np.polyfit拟合一条回归线,分析Δ_i与Δ_{i+1}的相关性。 - 交互式探索:结合Plotly库生成可交互图表,方便查看每个点的具体数值。
五、完整代码
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.cbook as cbook
# 加载Google股票数据
price_data = cbook.get_sample_data('goog.npz')['price_data']
price_data = price_data[-250:] # 取最近250个交易日数据
delta1 = np.diff(price_data["adj_close"]) / price_data["adj_close"][:-1]
volume = (15 * price_data["volume"][:-2] / pricec_data["volume"][0])**2 # 点的大小(交易量)
close = price_data["close"][:-2] / price_data["open"][:-2] # 修正后的颜色参数(收盘价/开盘价)
fig, ax = plt.subplots()
ax.scatter(delta1[:-1], delta1[1:], c=close, s=volume, alpha=0.5, cmap='coolwarm')
# 添加标签和样式
ax.set_xlabel(r'$\Delta_i$', fontsize=15)
ax.set_ylabel(r'$\Delta_{i+1}$', fontsize=15)
ax.set_title('Volume and Percent Change (Color: Close/Open Ratio)')
ax.grid(True)
plt.colorbar(ax.collections[0], label='Close/Open Ratio')
fig.tight_layout()
plt.show()
热门推荐
怎么向一个公司投简历
从大数据及经络角度理解“桂枝”的6种强大功效!
@PostConstruct注解详细分析,结合案例和使用场景(保姆级教程)
家庭全包装修的预算清单如何解析?
没休完的年假自动清零?必须要员工同意!未休年假按300%工资补偿
素质教育目标的全面解析:培养全面发展个体的教育理念
为什么铝合金外壳螺丝孔攻牙了,还要安装一个牙套?
小米:养生保健的神奇之谷
做汽车销售需要了解哪些知识
刘玉栋——永恒的战神!中国男篮最强大前锋的传奇与荣耀
刘玉栋:CBA十佳运动员,篮球名人堂成员
城镇居民医疗保险和城镇职工保险:购买指南与区别详解
不止清华,更多名校将扩招
探索多元文化对当代艺术设计的影响
再论以用户为中心
NBA 2K25 球员锁定功能使用指南
香港绿色建筑议会:建议建立碳交易平台推动建筑节能改造
中国学者研究:预测肝细胞癌肝移植预后的列线图
洗衣机排水原理与维护技巧:提升使用效率的实用指南
从一个癌细胞变成肿瘤,需要多久?
红薯保存秘籍:一招让红薯越久越甜,一年不烂不发芽
锐龙R5 5500U相当于酷睿i几?内行人不愿说出的真相!
高人指路十句名言
汽车太阳纹抛光处理全攻略:方法、工具选择与注意事项
成年柴犬的饮食需求及注意事项
曼珠沙华的传说是什么?花语有哪些含义?
质检资讯|浙江省消保委开展全麦面包抽检:热量可不低
江西羊肚菌烘干技术提升 助力品质保障与市场发展
江苏如东:小小羊肚菌 撑起“大钱景”
2025年,AI Agent干货资料、论文综述都在这了