過去のデータから株価を予想できるprophetを Anacondaを使わない Windows 環境にインストールする

2025年1月15日

prophet

pip install convertdate
pip install lunarcalendar
pip install holidays
pip install prophet

prophet · PyPI

サンプル

import os
import yfinance as yf
import pandas as pd
from prophet import Prophet
import matplotlib.pyplot as plt

# 定義
ticker = "NVDA"
file_path = f"{ticker}_stock_data.csv"

def load_and_prepare_data(file_path, ticker):
    # データの取得または読み込み
    if os.path.exists(file_path):
        try:
            df = pd.read_csv(file_path)
            df['ds'] = pd.to_datetime(df['ds'])
            df['y'] = pd.to_numeric(df['y'], errors='coerce')
        except ValueError as e:
            print(f"Error loading CSV file: {e}")
            return fetch_and_save_data(file_path, ticker)
    else:
        df = fetch_and_save_data(file_path, ticker)

    # 欠損値の確認と処理
    df.dropna(inplace=True)
    return df

def fetch_and_save_data(file_path, ticker):
    # 株価データの取得
    stock_data = yf.download(ticker, start="2023-01-01", end="2025-01-01")

    # 株価データフレームの作成
    df = stock_data[['Adj Close']].rename(columns={'Adj Close': 'y'}).reset_index()
    df['ds'] = df['Date']
    df = df.drop(columns=['Date'])

    # データをCSVファイルに保存
    df.to_csv(file_path, index=False)
    # 保存後に再読み込み
    df = pd.read_csv(file_path)
    df['ds'] = pd.to_datetime(df['ds'])
    df['y'] = pd.to_numeric(df['y'], errors='coerce')
    
    return df

# データのロードと準備
df = load_and_prepare_data(file_path, ticker)

# データ型の確認
print(df.dtypes)

# Prophetモデルのパラメータ設定
params = {
    'growth': 'linear',
    'changepoints': None,
    'n_changepoints': 25,
    'changepoint_range': 0.8,
    'yearly_seasonality': 'auto',
    'weekly_seasonality': 'auto',
    'daily_seasonality': 'auto',
    'holidays': None,
    'seasonality_mode': 'additive',
    'seasonality_prior_scale': 10.0,
    'holidays_prior_scale': 10.0,
    'changepoint_prior_scale': 0.05,
    'mcmc_samples': 0,
    'interval_width': 0.80,
    'uncertainty_samples': 1000,
    'stan_backend': None
}

# 3. Prophetモデルの作成
model = Prophet(**params)
model.fit(df)

# 4. 未来のデータフレームを作成して予測
future = model.make_future_dataframe(periods=365, freq='D')
# 土日の予測を除外
future = future[future['ds'].dt.weekday < 5]

forecast = model.predict(future)

# 5. 予測結果の可視化
model.plot(forecast)
plt.show()

# 6. 成分のプロット（トレンドのグラフも含む）
model.plot_components(forecast)
plt.show()

説明

1. インポートと設定

import os
import yfinance as yf
import pandas as pd
from prophet import Prophet
import matplotlib.pyplot as plt

os: ファイル操作を行うための標準ライブラリ。
yfinance: Yahoo Financeから株価データを取得するライブラリ。
pandas: データ操作を行うライブラリ。
Prophet: 時系列予測を行うライブラリ。
matplotlib.pyplot: グラフ描画を行うライブラリ。

2. 定義とデータの取得

ticker = "NVDA"
file_path = f"{ticker}_stock_data.csv"

ticker: 株式のシンボル。ここではNVIDIAを指定。
file_path: データを保存するCSVファイルのパス。

3. データのロードと準備

def load_and_prepare_data(file_path, ticker):
    if os.path.exists(file_path):
        try:
            df = pd.read_csv(file_path)
            df['ds'] = pd.to_datetime(df['ds'])
            df['y'] = pd.to_numeric(df['y'], errors='coerce')
        except ValueError as e:
            print(f"Error loading CSV file: {e}")
            return fetch_and_save_data(file_path, ticker)
    else:
        df = fetch_and_save_data(file_path, ticker)

    df.dropna(inplace=True)
    return df

load_and_prepare_data: データを読み込み、必要なら新しく取得して保存。
df.dropna(inplace=True): 欠損値を除去。

4. データの取得と保存

def fetch_and_save_data(file_path, ticker):
    stock_data = yf.download(ticker, start="2023-01-01", end="2025-01-01")
    df = stock_data[['Adj Close']].rename(columns={'Adj Close': 'y'}).reset_index()
    df['ds'] = df['Date']
    df = df.drop(columns=['Date'])
    df.to_csv(file_path, index=False)
    df = pd.read_csv(file_path)
    df['ds'] = pd.to_datetime(df['ds'])
    df['y'] = pd.to_numeric(df['y'], errors='coerce')
    return df

fetch_and_save_data: yfinanceを使用して株価データを取得し、CSVファイルに保存。

5. モデルのパラメータ設定

params = {
    'growth': 'linear',
    'changepoints': None,
    'n_changepoints': 25,
    'changepoint_range': 0.8,
    'yearly_seasonality': 'auto',
    'weekly_seasonality': 'auto',
    'daily_seasonality': 'auto',
    'holidays': None,
    'seasonality_mode': 'additive',
    'seasonality_prior_scale': 10.0,
    'holidays_prior_scale': 10.0,
    'changepoint_prior_scale': 0.05,
    'mcmc_samples': 0,
    'interval_width': 0.80,
    'uncertainty_samples': 1000,
    'stan_backend': None
}

各パラメーターの意味:

growth: 成長モデル（’linear’ または 'logistic’）。
changepoints: 変化点のリスト。
n_changepoints: 変化点の数。
changepoint_range: データ内の変化点の割合。
yearly_seasonality, weekly_seasonality, daily_seasonality: 季節性の設定。
holidays: 休日データ。
seasonality_mode: 季節性のモード（’additive’ または 'multiplicative’）。
seasonality_prior_scale, holidays_prior_scale, changepoint_prior_scale: 事前分布のスケール。
mcmc_samples: MCMCサンプル数。
interval_width: 予測区間の幅。
uncertainty_samples: 不確実性サンプル数。
stan_backend: Stanバックエンド。

6. モデルの作成とフィッティング

model = Prophet(**params)
model.fit(df)

Prophet(**params): 指定したパラメーターでモデルを作成。
model.fit(df): データフレームを用いてモデルをフィット。

7. 未来のデータフレームの作成と予測

future = model.make_future_dataframe(periods=365, freq='D')
future = future[future['ds'].dt.weekday < 5]
forecast = model.predict(future)

model.make_future_dataframe(periods=365): 365日先までの予測データフレームを作成。
future = future[future['ds'].dt.weekday < 5]: 土日の予測を除外。
model.predict(future): 未来の予測を実行。

8. 予測結果の可視化

model.plot(forecast)
plt.show()

model.plot(forecast): 予測結果をプロット。
plt.show(): グラフを表示。

9. 成分のプロット

model.plot_components(forecast)
plt.show()

model.plot_components(forecast): 予測結果の成分（トレンド、季節性など）をプロット。

Python,株

Posted by eightban

pystanを Anacondaを使わない Windows 環境にインストールする