注意事项:在机器学习的sklearn.preprocessing中当需要对训练和测试数据进行标准化时,使用两个不同的函数
通过去除均值并缩放到单位方差来标准化特征
PS:系统会记录每个输入参数嘚平均数和标准差,以便数据可以还原 |
如果是假的尽量避免复制,而要进行适当的缩放 这并不能保证总是在适当的地方工作;例如,如果数据不是NumPy数组或scipy稀疏的CSR矩阵,仍然可以返回一个副本 如果为真,则在扩展之前将数据居中 这在处理稀疏矩阵时不起作用(并且会引发一个异常),因为将它們居中需要构建一个密集的矩阵在通常情况下,这个矩阵可能太大而无法装入内存 如果为真,则将数据缩放到单位方差(或者等效为单位标准差) |
训练集中每个特征的平均值。 |
“拟合数据然后转换它。” |
未经优化默认实现;当对给定的聚类算法有更好的方法时重写 |
通过定惢和定标来实现标准化 |
把数据缩减到原来的样子 |