codecamp

AI人工智能 从时间序列数据中提取统计信息

在您需要得出一些重要结论的情况下,您必须从给定数据中提取一些统计信息。均值、方差、相关性、最大值和最小值就是这样的一些统计信息。如果您想从给定的时间序列数据中提取此类统计信息,可以使用以下代码:

均值

您可以使用 mean () 函数来查找均值,如下所示:

timeseries.mean()

然后,您将观察到我们讨论的示例的输出为:

-0.11143128165238671

最大值

您可以使用 max () 函数来查找最大值,如下所示:

timeseries.max()

然后,您将观察到我们讨论的示例的输出为:

3.4952999999999999

最小值

您可以使用 min () 函数来查找最小值,如下所示:

timeseries.min()

然后,您将观察到我们讨论的示例的输出为:

-4.2656999999999998

一次性获取所有统计信息

如果您想一次性计算所有统计信息,可以使用 describe () 函数,如下所示:

timeseries.describe()

然后,您将观察到我们讨论的示例的输出为:

count   817.000000
mean     -0.111431
std       1.003151
min      -4.265700
25%      -0.649430
50%      -0.042744
75%       0.475720
max       3.495300
dtype: float64

重采样

您可以将数据重采样到不同的时间频率。执行重采样的两个参数是:

  • 时间段
  • 方法

使用 mean () 进行重采样

您可以使用以下代码通过 mean () 方法对数据进行重采样,这是默认方法:

timeseries_mm = timeseries.resample("A").mean()
timeseries_mm.plot(style='g--')
plt.show()

然后,您可以观察到如下所示的图表作为使用 mean () 重采样的输出:

使用 median () 进行重采样

您可以使用以下代码通过 median () 方法对数据进行重采样:

timeseries_mm = timeseries.resample("A").median()
timeseries_mm.plot()
plt.show()

然后,您可以观察到如下所示的图表作为使用 median () 重采样的输出:

滚动均值

您可以使用以下代码计算滚动(移动)均值:

timeseries.rolling(window=12, center=False).mean().plot(style='-g')
plt.show()

然后,您可以观察到如下所示的图表作为滚动(移动)均值的输出:

AI人工智能 Pandas
AI人工智能 隐马尔可夫模型(HMM)分析顺序数据
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

AI人工智能监督学习(回归)

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }