Hi,大家好,我是编程小6,很荣幸遇见你,我把这些年在开发过程中遇到的问题或想法写出来,今天说一说
numpy矩阵加法_python矩阵运算库,希望能够帮助你!!!。
numpy是python中常用的一个矩阵运算库,而且numpy的底层都是采用c实现的,所以执行效率和速度也是很快的,但numpy是利用CPU来进行矩阵运算的,如果遇到大数据的矩阵运算,你会发现numpy真的很慢。那有没有什么办法来加速呢?想到大矩阵的运算肯定会想多使用GPU来计算,就让我们来看看numpy的GPU版本cupy。
操作系统
官方推荐安装环境是在linux操作系统下安装:
其他
pip install cupy
git clone https://github.com/cupy/cupy.git
cd cupy
pip install .
在安装之前需要先确定cuda的版本,以安装对应的版本,否则在后面使用cupy的是会出现一些错误
#查看cuda的版本
nvcc -V
#输出信息
#nvcc: NVIDIA (R) Cuda compiler driver
#Copyright (c) 2005-2017 NVIDIA Corporation
#Built on Fri_Sep__1_21:08:03_CDT_2017
#Cuda compilation tools, release 9.0, V9.0.176
#通过上面的信息,可以看出cuda的版本是9.0
#安装cuda为9.0版本的cupy
pip install cupy-cuda90
下面我们通过一些例子来对比一下numpy和cupy的执行效率,cupy的函数接口和numpy基本上都是一样的
我们定义一个函数来统计numpy和cupy的矩阵运算时间
对比×1024矩阵和1024×1矩阵的点积运算的消耗时间,计算10次统计最终的平均时间
num =
test_dot_time(True,num)
#a time consume 0.18 sec
test_dot_time(False,num)
#a time consume 5.48 sec
通过对比可以发现,cupy要比numpy节省30倍的时间消耗,这里只是展示了一种运算,如果你的矩阵运算越多,矩阵越大使用cupy运算节省的时间会更加明显。
那么是不是以后我们可以使用cupy来替代numpy了呢?这也不一定,我们来看看当num较小时的情况,当num为10的时候会怎么样呢?
num = 10
test_dot_time(True,num,times=10)
# a time consume 0. sec
test_dot_time(False,num,times=10)
#a time consume 0.00 sec
这时候居然numpy要比cupy更快?这是为什么呢?
一方面是因为CPU<->GPU这里有一个数据传输,而且CPU中还有一个cache可以用来计算,这个计算速度要比GPU快,不过这个大小有限大概几十M。这就是为什么小数据CPU要比GPU快的原因。
今天的分享到此就结束了,感谢您的阅读,如果确实帮到您,您可以动动手指转发给其他人。
上一篇
已是最后文章
下一篇
已是最新文章