【Matplotlib学习日记】股票涨跌幅与交易量的多维可视化分析
创作时间:
作者:
@小白创作中心
【Matplotlib学习日记】股票涨跌幅与交易量的多维可视化分析
引用
CSDN
1.
https://blog.csdn.net/OAkic/article/details/146225364
一、背景与目标
最近在学习使用Matplotlib进行金融数据的可视化分析,尝试通过一个实际案例理解如何将多个维度的数据(价格涨跌、交易量、开盘-收盘价关系)融合在一张图中。本文基于Matplotlib官方示例代码,解析其实现逻辑,并分享调试过程中的心得体会。
二、代码解析
1. 数据加载与处理
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.cbook as cbook
# 加载Google股票数据
price_data = cbook.get_sample_data('goog.npz')['price_data']
price_data = price_data[-250:] # 取最近250个交易日数据
- 关键点:使用
matplotlib.cbook内置的示例数据,截取最近250天数据,保证分析的时效性。
2. 计算涨跌幅(Delta)
delta1 = np.diff(price_data["adj_close"]) / price_data["adj_close"][:-1]
- 公式:
- 解释:计算每日调整后收盘价的百分比变化,反映股价波动。
3. 定义散点图参数
volume = (15 * price_data["volume"][:-2] / pricec_data["volume"][0])**2 # 点的大小(交易量)
close = price_data["close"][:-2] / price_data["open"][:-2] # 修正后的颜色参数(收盘价/开盘价)
- 问题修复:原始代码中
close的计算有误(实际为close * open),修正为收盘价与开盘价的比率,反映当日价格趋势。
4. 绘制多维散点图
fig, ax = plt.subplots()
ax.scatter(delta1[:-1], delta1[1:], c=close, s=volume, alpha=0.5, cmap='coolwarm')
# 添加标签和样式
ax.set_xlabel(r'$\Delta_i$', fontsize=15)
ax.set_ylabel(r'$\Delta_{i+1}$', fontsize=15)
ax.set_title('Volume and Percent Change (Color: Close/Open Ratio)')
ax.grid(True)
plt.colorbar(ax.collections[0], label='Close/Open Ratio')
fig.tight_layout()
plt.show()
- 参数说明:
c=close:颜色映射为收盘价/开盘价比率(>1为红色,表示当日上涨;<1为蓝色,表示下跌)。s=volume:点的大小反映交易量。alpha=0.5:半透明效果避免重叠遮挡。
三、结果与可视化
1. 输出图表
2. 图表解读
- 横纵轴:相邻两日的涨跌幅(Δ_i 和 Δ_{i+1}),用于分析价格变化的连续性或反转性。
- 点大小:交易量越大,点面积越大。图中右下方的大点表示某日大跌后次日反弹,且伴随高交易量。
- 颜色:红色点(收盘价 > 开盘价)多集中在右上象限,说明上涨日次日继续上涨的概率较高。
四、心得体会
1. 调试中的发现
- 数据对齐陷阱:原始代码中
volume和close使用[:-2]切片,而delta1长度为249(因为np.diff减少1个元素)。最终通过delta1[:-1]和delta1[1:]对齐到248个点,需特别注意数组长度的匹配。 - 颜色映射优化:将
cmap改为coolwarm并添加颜色条,使图表更直观。
2. 多维数据可视化的价值
- 信息密度:通过点位置、大小、颜色三个维度,单图传递了价格趋势、交易量、开盘-收盘关系三种信息。
- 模式识别:观察点的分布,可推测该股票可能存在短期动量效应(连续上涨/下跌)。
3. 改进方向
- 添加趋势线:用
np.polyfit拟合一条回归线,分析Δ_i与Δ_{i+1}的相关性。 - 交互式探索:结合Plotly库生成可交互图表,方便查看每个点的具体数值。
五、完整代码
import matplotlib.pyplot as plt
import numpy as np
import matplotlib.cbook as cbook
# 加载Google股票数据
price_data = cbook.get_sample_data('goog.npz')['price_data']
price_data = price_data[-250:] # 取最近250个交易日数据
delta1 = np.diff(price_data["adj_close"]) / price_data["adj_close"][:-1]
volume = (15 * price_data["volume"][:-2] / pricec_data["volume"][0])**2 # 点的大小(交易量)
close = price_data["close"][:-2] / price_data["open"][:-2] # 修正后的颜色参数(收盘价/开盘价)
fig, ax = plt.subplots()
ax.scatter(delta1[:-1], delta1[1:], c=close, s=volume, alpha=0.5, cmap='coolwarm')
# 添加标签和样式
ax.set_xlabel(r'$\Delta_i$', fontsize=15)
ax.set_ylabel(r'$\Delta_{i+1}$', fontsize=15)
ax.set_title('Volume and Percent Change (Color: Close/Open Ratio)')
ax.grid(True)
plt.colorbar(ax.collections[0], label='Close/Open Ratio')
fig.tight_layout()
plt.show()
热门推荐
叶轮类型:选择、特点、应用
家庭网络故障排查指南(快速定位网络问题)
血小板比积偏高的原因及危害
新型围护桩工艺:PC工法组合钢管桩施工工艺详解
三支一扶的政策背景是什么?
重视肝肾亏损:别让身体发出的警报被忽视
小行星黄金储量如何评估?评估结果有何意义?
学者解析骨关节炎领域的研究进展与争议
卧推哑铃标准动作要领
我在海埂大坝,邂逅昆明的浪漫与温柔
守护你的“人体化工厂”:17项肝功能指标全面解析(超详版)
事物的无限可能性:关于人、自然和时间流逝的宫崎骏作品
使用frp实现内网穿透教程
山东第一医科大学第三附属医院
法硕排名:影响未来发展的关键因素
清朝海禁政策的历史沿革
电动车充电智能喷雾降温方案
眼睛奇痒难耐还越揉越严重,眼科专家教你有效应对过敏性结膜炎
今后从萧山机场坐高铁,可以去哪些地方?上海、宁波、绍兴、嘉兴、金华……
右肩疼痛要警惕的三种病症有哪些
蓝绿藻在线分析仪的技术原理与实时监测系统构建
奥迪A6L行驶中能否空档滑行?专家给出权威解答
2024年财运最佳的生肖分析 2024年哪个生肖财运旺盛
变压器如何减少能量损耗
S.A.L.U.T.E 情报报告法在情报行动中的重要性
走向极地大洋 ▏“智”探极地深海
上海交大研究发现:血糖不超过这个数就别太克制,放心好好吃饭睡觉
笔记本电脑内存扩展指南:操作步骤、优势与注意事项详解
Fate系列作品的年代顺序与世界关联图
参苓健脾胃颗粒的功效与作用