Skip to content

Fill Missing Data of Time Series

Các phương pháp để xử lý missing data
Có 2 cách chính:

  • Nếu có dataframe của time series với nhiều variables tương quan với nhau thì dùng multivariate imputation như MICE package của R. Trong python cũng có các packages như miceforest, autoimpute và sklearn (InteractiveImputer).
  • Sử dụng machine learning để forecast cho từng column của dataframe. Phương pháp này không quan tâm đến tương quan của các variables với nhau. Có thể sử dụng forward và backward forecast để cho kết quả tốt nhất. Sử dụng package như fedot. Tuy nhiên sẽ rất tốn thời gian.

Combined forecast

No other pages link to this page.



Created : Aug 18, 2022