Привет, я Джонго~
Сегодня я хочу поговорить с вами о「Используйте модель LSTM для прогнозирования временных рядов многофункциональных переменных.」Простой проект для。
ЛСТМ ЛСТМ Концепция., может помочь нам делать более точные прогнозы в различных практических приложениях. Эти приложения включают прогнозирование финансового рынка.、прогноз погоды、Прогноз энергопотребления и т.д.
В этом проекте используется Python и платформа TensorFlow/Keras для реализации модели LSTM для прогнозирования данных временных рядов многофункциональных переменных.
В этом примере,Создайте смоделированный набор данных многофункциональных временных рядов.,и Сохранить как файл CSV以供использовать。你可以использовать以下代码生成一个模拟的данныенабор,затем сохраните какmulti_feature_time_series.csv
документ。
import numpy as np
import pandas as pd
# Установите случайное начальное число, чтобы обеспечить повторяемость.
np.random.seed(42)
# Сгенерируйте смоделированные данные временных рядов
time_steps = 1000
data = {
'temperature': np.random.normal(20, 5, time_steps), # Имитация температурных данных
'humidity': np.random.normal(50, 10, time_steps), # имитировать влажностьданные
'wind_speed': np.random.normal(10, 2, time_steps), # Имитация скорости ветра
'power_consumption': np.random.normal(200, 50, time_steps) # Имитировать энергопотреблениеданные
}
# CreateDataFrame
df = pd.DataFrame(data)
# Сохранить как файл CSV
df.to_csv('multi_feature_time_series.csv', index=False)
print("Набор данных моделирования был сохранен как multi_feature_time_series.csv")
Запустите приведенный выше код набор данных моделирования и сохраните его в виде файла CSV.。
Затем вы можете использовать сгенерированный файл CSV для построения и обучения последующей модели прогнозирования временных рядов LSTM.
Ниже представлена полная реализация кода,включить генерациюданныенабор、Предварительная обработка данные, построение и обучение модели LSTM, а также оценка модели и прогнозирование。
import numpy as np
import pandas as pd
# Установите случайное начальное число, чтобы обеспечить повторяемость.
np.random.seed(42)
# Сгенерируйте смоделированные данные временных рядов
time_steps = 10000
data = {
'temperature': np.random.normal(20, 5, time_steps), # Имитация температурных данных
'humidity': np.random.normal(50, 10, time_steps), # имитировать влажностьданные
'wind_speed': np.random.normal(10, 2, time_steps), # Имитация скорости ветра
'power_consumption': np.random.normal(200, 50, time_steps) # Имитировать энергопотреблениеданные
}
# CreateDataFrame
df = pd.DataFrame(data)
# Сохранить как файл CSV
df.to_csv('multi_feature_time_series.csv', index=False)
print("Набор данных моделирования был сохранен как multi_feature_time_series.csv")
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
# нагрузкаданные
data = pd.read_csv('multi_feature_time_series.csv')
# исследоватьданные
print(data.head())
# Обработка пропущенных значений (если есть)
data = data.dropna()
# нормализацияданные
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(data)
# Создание входных объектов и целевых переменных.
def create_dataset(dataset, time_step=1):
dataX, dataY = [], []
for i in range(len(dataset) - time_step - 1):
a = dataset[i:(i + time_step), :]
dataX.append(a)
dataY.append(dataset[i + time_step, -1]) # Предположим, что целевая переменная — это последний столбец.
return np.array(dataX), np.array(dataY)
time_step = 10
X, y = create_dataset(scaled_data, time_step)
# Разделите данные на обучающий набор и тестовый набор.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Проверьте форму
print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
# Здание LSTMМодель
model = Sequential()
model.add(LSTM(50, return_sequences=True, input_shape=(time_step, X_train.shape[2])))
model.add(LSTM(50, return_sequences=False))
model.add(Dense(25))
model.add(Dense(1))
# Скомпилировать модель
model.compile(optimizer='adam', loss='mean_squared_error')
# Модель обучения
history = model.fit(X_train, y_train, epochs=100, batch_size=64, validation_data=(X_test, y_test), verbose=1)
# Предварительный просмотр тренировочного процесса
plt.plot(history.history['loss'], label='Training Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Model Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.show()
# Модель оценки
train_predict = model.predict(X_train)
test_predict = model.predict(X_test)
# денормализованное прогнозируемое значение
train_predict = scaler.inverse_transform(np.concatenate((np.zeros((train_predict.shape[0], scaled_data.shape[1]-1)), train_predict), axis=1))[:, -1]
test_predict = scaler.inverse_transform(np.concatenate((np.zeros((test_predict.shape[0], scaled_data.shape[1]-1)), test_predict), axis=1))[:, -1]
# денормализованное фактическое значение
y_train_actual = scaler.inverse_transform(np.concatenate((np.zeros((y_train.shape[0], scaled_data.shape[1]-1)), y_train.reshape(-1, 1)), axis=1))[:, -1]
y_test_actual = scaler.inverse_transform(np.concatenate((np.zeros((y_test.shape[0], scaled_data.shape[1]-1)), y_test.reshape(-1, 1)), axis=1))[:, -1]
# Предварительный просмотр результатов прогноза
plt.figure(figsize=(14, 5))
plt.plot(y_test_actual, color='blue', label='Actual Value')
plt.plot(test_predict, color='red', label='Predicted Value')
plt.title('Actual vs Predicted')
plt.xlabel('Time')
plt.ylabel('Value')
plt.legend()
plt.show()
проходить Создайте набор данных моделирования и сохраните его в виде файла CSV.,Мы можем использовать описанные выше шаги для завершения построения и обучения многофункциональной модели прогнозирования переменных временных рядов на основе LSTM. Модель способна эффективно обрабатывать и прогнозировать данные многомерных временных рядов.,И может быть применен к различным практическим сценариям.