资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

港美股数据行情处理实战：从API获取到量化分析

创作时间:

作者:

@小白创作中心

港美股数据行情处理实战：从API获取到量化分析

引用

CSDN

https://blog.csdn.net/2401_89490165/article/details/145778779

本文是一篇关于港美股数据行情处理的实战教程，内容涵盖了数据获取、清洗、存储、指标计算、可视化以及量化交易策略的完整流程。文章结构清晰，每个环节都配有详细的Python代码示例，适合有一定编程基础的读者学习参考。

一、行情数据获取方案

1.1 主流数据接口

扩展学习方向：

# 进阶学习示例：特征工程
from ta import add_all_ta_features
feature_df = add_all_ta_features(hk_clean, 
 open="Open", 
 high="High",
 low="Low",
 close="Close",
 volume="Volume")

Tushare Pro（港股/A股）：需注册获取token，支持高频数据
AkShare（开源解决方案）：无需注册，集成多个数据源
Yahoo Finance API（美股）：免费历史数据接口
专业付费接口：Wind、Bloomberg、LINKSOFT等机构级数据源
LINKSOFT:提供港股、美股、A股多市场数据源

# 使用Tushare获取港股实时数据示例
import tushare as ts
pro = ts.pro_api('YOUR_TOKEN')
hk_data = pro.hk_daily(ts_code='00700.HK', start_date='20230101', end_date='20231231')
# 使用yfinance获取美股数据
import yfinance as yf
aapl = yf.Ticker("AAPL")
us_hist = aapl.history(period="1y")

1.2 数据清洗关键步骤

def clean_finance_data(df):
 # 处理缺失值
 df = df.fillna(method='ffill').dropna()
 # 转换日期格式
 df['trade_date'] = pd.to_datetime(df['trade_date'])
 df.set_index('trade_date', inplace=True)
 # 数据标准化
 df = df[['open', 'high', 'low', 'close', 'vol']]
 df.columns = ['Open', 'High', 'Low', 'Close', 'Volume']
 return df
hk_clean = clean_finance_data(hk_data)

二、行情数据存储方案

2.1 数据库选型建议

数据库类型	适用场景	推荐方案
时序数据库	高频交易数据	InfluxDB
关系型数据库	结构化存储	MySQL
列式存储	大数据分析	HBase

2.2 InfluxDB存储示例

from influxdb import DataFrameClient
client = DataFrameClient(host='localhost', port=8086, username='admin', password='admin')
client.create_database('hk_stocks')
# 写入数据
client.write_points(hk_clean, 'tencent_stock', 
 tag_columns={'market': 'HK'}, 
 protocol='line')

三、核心指标计算

3.1 技术指标计算

# 计算移动平均线
hk_clean['MA5'] = hk_clean['Close'].rolling(window=5).mean()
hk_clean['MA20'] = hk_clean['Close'].rolling(window=20).mean()
# 计算MACD
exp12 = hk_clean['Close'].ewm(span=12, adjust=False).mean()
exp26 = hk_clean['Close'].ewm(span=26, adjust=False).mean()
hk_clean['MACD'] = exp12 - exp26
hk_clean['Signal'] = hk_clean['MACD'].ewm(span=9, adjust=False).mean()

3.2 波动率计算

def calculate_volatility(series, window=30):
 log_returns = np.log(series / series.shift(1))
 return log_returns.rolling(window=window).std() * np.sqrt(252)
hk_clean['Volatility'] = calculate_volatility(hk_clean['Close'])

四、数据可视化实践

4.1 K线图绘制

import mplfinance as mpf
mpf.plot(hk_clean.tail(60), 
 type='candle',
 style='charles',
 title='Tencent Holdings (0700.HK)',
 volume=True,
 mav=(5,20))

4.2 交互式可视化

import plotly.graph_objects as go
fig = go.Figure(data=[go.Candlestick(x=hk_clean.index,
 open=hk_clean['Open'],
 high=hk_clean['High'],
 low=hk_clean['Low'],
 close=hk_clean['Close'])])
fig.update_layout(title='Interactive Stock Chart')
fig.show()

五、量化交易策略示例

5.1 双均线策略实现

hk_clean['Signal'] = 0
hk_clean['Signal'][5:] = np.where(hk_clean['MA5'][5:] > hk_clean['MA20'][5:], 1, 0)
hk_clean['Position'] = hk_clean['Signal'].diff()
# 计算策略回报
hk_clean['Strategy_Return'] = hk_clean['Position'].shift(1) * hk_clean['Close'].pct_change()
hk_clean['Cum_Return'] = (1 + hk_clean['Strategy_Return']).cumprod()

5.2 策略回测结果可视化

import matplotlib.pyplot as plt
plt.figure(figsize=(12,6))
plt.plot(hk_clean['Cum_Return'], label='Strategy')
plt.plot((1 + hk_clean['Close'].pct_change()).cumprod(), label='Buy&Hold')
plt.legend()
plt.title('Strategy Backtesting Result')
plt.show()

六、注意事项及优化方向

数据时区处理：港股（UTC+8）与美股（UTC-5）需统一时区
复权处理：使用
adjust_price()
函数处理分红拆股
实时数据优化：WebSocket实时订阅方案
异常处理：增加重试机制和断点续传

# 带重试机制的API请求
from retrying import retry
@retry(stop_max_attempt_number=3, wait_fixed=2000)
def safe_api_call(api_func, *args, **kwargs):
    try:
        return api_func(*args, **kwargs)
    except Exception as e:
        print(f"API Error: {str(e)}")
        raise