Scipy快速入门

2023-12-28 19:47 由 NeoNexus 发表于 #后端开发

Scipy快速入门

注意事项

图床在国外，配合美区、日区网络使用更佳，如遇图片加载不出来，考虑换个VPN吧。

监修中敬告

本文处于Preview阶段，不对文章内容负任何责任，如有意见探讨欢迎留言。

联系方式——绿泡泡：NeoNexusX

常量

稀疏矩阵（scipy.sparse）

CSC 压缩稀疏列(csr_matrix()

用于高效的算数，快速列切分。

    # csr
    csr_arr = np.array([0, 0, 1, 0, 0, 0, 0, 1])
    print(f'csc_matrix(csc_arr) is  : \n{csc_matrix(csr_arr)}\n')

结果如下：

csc_matrix(csc_arr) is  : 
  (0, 2)	1
  (0, 7)	1

CSR 压缩稀疏行(csc_matrix())

用于快速行切分，更快的矩阵向量乘积。

    # csc
    csc_arr = np.array([[0],
                        [1],
                        [0],
                        [0],
                        [0],
                        [0],
                        ])
    print(f'csc_matrix(csc_arr) is  : \n{csc_matrix(csc_arr)}\n')

结果如下：

csc_matrix(csc_arr) is  : 
  (1, 0)	1

举一个复杂一点的例子：

    # 获取对应矩阵
    cm_arr = np.array([[1, 0, 6, 0, 7],
                       [0, 2, 0, 0, 0],
                       [0, 0, 3, 0, 0],
                       [0, 0, 0, 4, 0],
                       [0, 0, 0, 0, 5],
                       ])
    print(f'csr_matrix(cm_arr) is  : \n{csr_matrix(cm_arr)}\n')
    print(f'csc_matrix(cm_arr) is  : \n{csc_matrix(cm_arr)}\n')

输出结果：

csr_matrix(cm_arr) is  : 
  (0, 0)	1
  (0, 2)	6
  (0, 4)	7
  (1, 1)	2
  (2, 2)	3
  (3, 3)	4
  (4, 4)	5

csc_matrix(cm_arr) is  : 
  (0, 0)	1
  (1, 1)	2
  (0, 2)	6
  (2, 2)	3
  (3, 3)	4
  (0, 4)	7
  (4, 4)	5

获取非0元素（.data）

代码如下：

    # 获取非0元素
    print(f'csc_matrix(cm_arr).data is  : \n{csc_matrix(cm_arr).data}\n')
    print(f'csr_matrix(cm_arr).data is  : \n{csr_matrix(cm_arr).data}\n')

输出结果：

csc_matrix(cm_arr).data is  : 
[1 2 6 3 4 7 5]

csr_matrix(cm_arr).data is  : 
[1 6 7 2 3 4 5]

获取非0元素个数（.count_nonzero() ）

    # 获取非0元素个数
    print(f'csr_matrix(cm_arr).count_nonzero() is  : \n{csr_matrix(cm_arr).count_nonzero()}\n')
    print(f'csc_matrix(cm_arr).count_nonzero() is  : \n{csc_matrix(cm_arr).count_nonzero()}\n')

输出结果：

csr_matrix(cm_arr).count_nonzero() is  : 
7

csc_matrix(cm_arr).count_nonzero() is  : 
7

删除零元素（.eliminate_zeros()）

注意这是一个方法，你如果用在已经建立好的矩阵是没有效果的：

举个例子：

    # 减少对应矩阵的0数目
    c_m = csc_matrix(cm_arr)
    c_m.eliminate_zeros()
    r_m = csr_matrix(cm_arr)
    r_m.eliminate_zeros()
    print(f'csc_matrix(cm_arr).eliminate_zeros() is  : \n{c_m}\n')
    print(f'csr_matrix(cm_arr).eliminate_zeros() is  : \n{r_m}\n')

可以看到这里的输出和上文的内容并没有发生什么变化：

csc_matrix(cm_arr).eliminate_zeros() is  : 
  (0, 0)	1
  (1, 1)	2
  (0, 2)	6
  (2, 2)	3
  (3, 3)	4
  (0, 4)	7
  (4, 4)	5

csr_matrix(cm_arr).eliminate_zeros() is  : 
  (0, 0)	1
  (0, 2)	6
  (0, 4)	7
  (1, 1)	2
  (2, 2)	3
  (3, 3)	4
  (4, 4)	5

我们再来举个例子：

    row = [0, 0, 0, 1, 1, 1, 2, 2, 2]  # 行指标
    col = [0, 1, 2, 0, 1, 2, 0, 1, 2]  # 列指标
    data = [1, 0, 1, 0, 1, 1, 1, 1, 0]  # 在行指标列指标下的数字
    team = csr_matrix((data, (row, col)), shape=(3, 3))

    print(f'team is : \n{team}\n')
    print(f'team type is : \n{type(team)}\n')
    print(f'team.shape is : \n{team.shape}\n')

    team.eliminate_zeros()
    print(f'team.eliminate_zeros is : \n{team}\n')

输出结果如下；

team is : 
  (0, 0)	1
  (0, 1)	0
  (0, 2)	1
  (1, 0)	0
  (1, 1)	1
  (1, 2)	1
  (2, 0)	1
  (2, 1)	1
  (2, 2)	0

team type is : 
<class 'scipy.sparse._csr.csr_matrix'>

team.shape is : 
(3, 3)

team.eliminate_zeros is : 
  (0, 0)	1
  (0, 2)	1
  (1, 1)	1
  (1, 2)	1
  (2, 0)	1
  (2, 1)	1

可以看到team转化为另一个非稀疏的矩阵类型。

CSC和CSR的转换（.tocsr() / .tocsc()）

这个就很简单了，没什么可说的：

    # csr 2 csc
    print(f'csr_matrix is  : \n{r_m}\n')
    print(f'c_m.tocsr() is  : \n{c_m.tocsr()}\n')

将对应的CSC转化成CSR：

csr_matrix is  : 
  (0, 0)	1
  (0, 2)	6
  (0, 4)	7
  (1, 1)	2
  (2, 2)	3
  (3, 3)	4
  (4, 4)	5

c_m.tocsr() is  : 
  (0, 0)	1
  (0, 2)	6
  (0, 4)	7
  (1, 1)	2
  (2, 2)	3
  (3, 3)	4
  (4, 4)	5

图（CSGraph）

使用邻接矩阵来构建一个图如下：

    # graph part
    # 构建了一个正方形的图

    arr = np.array([
        [0, 2, 0, 4],
        [2, 0, 3, 0],
        [0, 3, 0, 4],
        [4, 0, 4, 0],
    ])
    graph = csr_matrix(arr)
    print(f'graph is  : \n{graph}\n')

示意图如下：

graph LR; A <--2-->B<--3-->C<--4-->D<--4-->A

结果如下：

graph is  : 
  (0, 1)	2
  (0, 3)	4
  (1, 0)	2
  (1, 2)	3
  (2, 1)	3
  (2, 3)	4
  (3, 0)	4
  (3, 2)	4

连通性检测（connected_components(））

    n_components, labels = connected_components(graph, directed=False, connection='weak', return_labels=True)

    print("连通分量数量:", n_components)
    print("节点标签:", labels)

连通性输出结果如下：

连通分量数量: 1
节点标签: [0 0 0 0]

由于这里没有设置节点标签，所以输出全是0.

最短路（Dijkstra()、floyd_warshall() 、bellman_ford() ）

三个函数只需要将图输入进去就可以得到对应的到各个节点的最短路径。

# dijkstra
print(f'dijkstra seq is : \n{dijkstra(graph, indices=0)}\n')

# Floyd warshall
print(f'floyd_warshall matrix is : \n{floyd_warshall(graph)}\n')

# bellman ford
print(f'bellman_ford matrix is : \n{bellman_ford(graph, indices=0)}\n')

结果如下：

dijkstra seq is : 
[0. 2. 5. 1.]

floyd_warshall matrix is : 
[[0. 2. 5. 1.]
 [2. 0. 3. 3.]
 [5. 3. 0. 4.]
 [1. 3. 4. 0.]]

bellman_ford matrix is : 
[0. 2. 5. 1.]

广搜与深搜（depth_first_order（）， breadth_first_order（））

两个函数的作用都是以某个参数为基点返回对应的顺序和对应节点的前驱序列。

举个例子：

    # depth first order
    print(f'depth_first_order seq is : \n{depth_first_order(graph, 0)}\n')

    # breadth first order
    print(f'breadth_first_order seq is : \n{breadth_first_order(graph, 0)}\n')

输出结果：

depth_first_order seq is : 
(array([0, 1, 2, 3]), array([-9999,     0,     1,     2]))

breadth_first_order seq is : 
(array([0, 1, 3, 2]), array([-9999,     0,     1,     0]))

详见：scipy.sparse.csgraph.depth_first_order — SciPy v1.11.4 Manual

matlab数据读取与导出（ io.savemat(）、io.loadmat(））

# matlab part
# 导出matlab 数据 等等
matlab_output = io.savemat('filename.mat', {'data': arr})
print(f'matlab_output is \n {matlab_output} \n')

# 读取 matlab 数据 等等
matlab_intput = io.loadmat('filename.mat')
print(f'matlab_input is \n{matlab_intput}\n')
matlab_intput_data = matlab_intput['data']
print(f'matlab_input \'s data is \n{matlab_intput_data}\n')

输出结果如下：

返回的是字典包含了很多信息，我们可以通过字典的方式来提取内容。

matlab_output is 
 None 

matlab_input is 
{'__header__': b'MATLAB 5.0 MAT-file Platform: nt, Created on: Sun Dec 10 21:40:56 2023', '__version__': '1.0', '__globals__': [], 'data': array([[0, 2, 0, 1],
       [2, 0, 3, 0],
       [0, 3, 0, 4],
       [1, 0, 4, 0]])}

matlab_input 's data is 
[[0 2 0 1]
 [2 0 3 0]
 [0 3 0 4]
 [1 0 4 0]]

数据的外围又被包上了一个数组，我们可以通过如下方式来实现读取，将其变为1维的：

    matlab_intput_without = io.loadmat('filename.mat', squeeze_me=True)
    print(f'matlab_intput_without is \n{matlab_intput_without}\n')
    matlab_intput_data_without = matlab_intput_without['data']
    print(f'matlab_intput_data_without \'s data is \n{matlab_intput_data_without}\n')

输出结果如下：

matlab_intput_without is 
{'__header__': b'MATLAB 5.0 MAT-file Platform: nt, Created on: Sun Dec 10 21:44:24 2023', '__version__': '1.0', '__globals__': [], 'data': array([[0, 2, 0, 1],
       [2, 0, 3, 0],
       [0, 3, 0, 4],
       [1, 0, 4, 0]])}

参考文献

.eliminate_zeros()函数-CSDN博客

热门相关：魔葫万道龙皇孽徒快坑师惊世第一妃：魔帝，宠上身！重生之我的书记人生

C++ Qt开发：SqlTableModel映射组件应用

Qt 是一个跨平台C++图形界面开发库，利用Qt可以快速开发跨平台窗体应用程序，在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置，实现图形化开发极大的方便了开发效率，本章将重点介绍`SqlTableModule`组件的常用方法及灵活运用。在多数情况下我们需要使用SQL的方法来维护数据库，但此方... ...阅读全文

python中的泛型使用TypeVar

1.引入为什么需要TypeVar PEP484的作者希望借助typing模块引入类型提示，不改动语言的其它部分。通过精巧的元编程技术，让类支持[]运算不成问题。但是方括号内的T变量必须在某处定义，否则要大范围改动python解释器才能让泛型支持特殊的[]表示法。鉴于此，我们增加了typing.Ty ...阅读全文

Python random模块（获取随机数）常用方法和使用例子

random.random random.random()用于生成一个0到1的随机符点数: 0 <= n < 1.0 random.uniform random.uniform(a, b)，用于生成一个指定范围内的随机符点数，两个参数其中一个是上限，一个是下限。如果a > b，则生成的随机数n: ...阅读全文

python生成器generator的用法

通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访问前面几个元素，那后面绝大多数元素占用的空间都白白浪费了。所以，如果列表元素可以按照某种算法推算出来，那我们是否可以在循环的过程中不 ...阅读全文

Python中__init_subclass__特殊方法

__init_subclass__ 是 Python 3.6 引入的一个特殊方法，用于在子类被定义时执行一些操作。这个方法允许你在父类中定义一个类方法，当子类继承父类时会自动调用这个方法，你可以在其中进行一些初始化工作。以下是关于 __init_subclass__ 方法的一些重要点：目的： ...阅读全文

支付宝 v3 验签如何实现

上次给大家介绍了支付宝 v3 自签名如何实现，这次顺便再把验签也写一下。为什么要验签说起为什么要验签，如果要详细一点解释的话，可以写很多很多...... 我们就简单一点来解释：验签可以证明接收到的信息是支付宝给我的，不是被人中途拦截篡改数据之后再发给我的。支付宝的通知分为「同步通知」和 ...阅读全文

[手机端RPA]监听闲鱼消息，实现秒回客户，不怕错过任何消息

你好，我是盆子，00年的国企程序员。目前正在探索各种副业，分享互联网一些有意思的东西，微信 pzistart1。文末有总结。前言最近一个月在弄闲鱼无货源的项目，遵循着一机一卡一号的原则，手机从 1 台也变成了 3 台。频繁的切换手机看闲鱼 app，看有没有客户发来咨询，是一件十分很繁琐的事情 ...阅读全文

遇到跨端开发或多项目开发时，遇到的一些问题探讨，后端开发语言如何选择？

最近有同学问我，做后端开发项目时用php，java，c#，go，pathon...哪个好，从最近阿里云、美团服务器崩溃来看，我想给你最直接的回答是，没有完美的，只有适合自己的。 ...阅读全文

C++内存分配详解：栈、堆、静态存储区解析与实例演示

概述：C++内存分配有栈、堆和静态存储区三种方式。栈自动管理，适用于局部变量；堆手动管理，使用new和delete；静态存储区适用于全局变量，具有整个程序生命周期。通过清晰的示例源代码，详细解释了它们的分配方法和使用步骤。 C++的内存分配涉及栈、堆和静态存储区，每种分配方式有其独特的特点。以下是对 ...阅读全文

java进行数据库操作的并发控制的2种方法

本文分享自华为云社区《java进行数据库操作的并发控制》，作者：张俭。在现代应用编码中，从数据库里面find出来，进行一些业务逻辑操作，最后再save回去。即： Person person = personRepo.findById(id); person.setAge(18); personRe ...阅读全文

Scipy快速入门

注意事项

监修中敬告

常量

稀疏矩阵 （scipy.sparse）

CSC 压缩稀疏列(csr_matrix()

CSR 压缩稀疏行(csc_matrix())

获取非0元素（.data）

获取非0元素个数（.count_nonzero() ）

删除零元素（.eliminate_zeros()）

CSC和CSR的转换 （.tocsr() / .tocsc()）

图 （CSGraph）

连通性检测 （connected_components(））

最短路 （Dijkstra()、floyd_warshall() 、bellman_ford() ）

广搜与深搜 （depth_first_order（）， breadth_first_order（））

matlab数据读取与导出（ io.savemat(）、io.loadmat(））

参考文献

稀疏矩阵（scipy.sparse）

CSC和CSR的转换（.tocsr() / .tocsc()）

图（CSGraph）

连通性检测（connected_components(））

最短路（Dijkstra()、floyd_warshall() 、bellman_ford() ）

广搜与深搜（depth_first_order（）， breadth_first_order（））