0

Numpy奇技淫巧——理解axis

Numpy是整个Python的科学计算的基础,撑起了Python作为机器学习重要语言的整个计算基础,包括Numpy, Scipy, Pandas, Scikit-Learn以及最近兴起的机器学习和深度学习库,包括TensorFlow, Keras等,它们多维数据的表示和使用无不基于Numpy,因此在语法和使用上以及功能上都和Numpy有着很多相似之处,这篇文章介绍Numpy中的非常重要的概念,那就是axis,如果你完全理解了axis,那么操作起多维的数组的时候将得心应手。 Continue Reading

0

Numpy奇技淫巧——抽样

在处理数据的时候,我需要从10000条记录中一次抽样1000条记录,可以用random.sample实现,思路是生成相应的随机索引,然后再去按照索引去抽取数据,代码如下

代码中,index表示从10000条记录中获取随机获取的1000条记录的索引,然后按照索引去获取数据,思路就是那么简单,而且也不会出错。

或者,index的生成也可以采用下面这种方法

0

Numpy奇技淫巧——np.std与matlab的std的区别

[latexpage]

numpy是一款很牛的Python的矩阵计算库,其底层接口调用C与BLAS,计算速度还是非常理想的,numpy奠定了Python的数据分析利器的地位,是Pandas库的基础。

最近学习朴素贝叶斯分类器,对连续型的类型计算其标准差,但是发现了matlabstdnumpynp.std的一些不同。代码如下 Continue Reading