NumPy 数值计算

SunnyFan大约 16 分钟约 4922 字

NumPy 数值计算

简介

NumPy（Numerical Python）是 Python 科学计算的基础库，提供高性能的多维数组对象和数学运算。它是 Pandas、SciPy、Scikit-learn 等库的底层依赖，是数据科学和机器学习的基石。

NumPy 的核心是 ndarray（N-dimensional array）对象，它在内存中是一块连续的、固定类型的数据区域。与 Python 原生的列表相比，NumPy 数组有以下根本区别：(1) 所有元素必须是同一类型（dtype）；(2) 数据在内存中连续存储；(3) 运算由底层 C/Fortran 代码执行，避免了 Python 解释器的开销。这三点共同构成了 NumPy 高性能的基础。

从工程视角看，NumPy 不仅仅是一个数学库——它定义了一套数组计算的标准接口（__array_ufunc__、__array_function__），几乎所有 Python 科学计算库都遵循这套接口，使得不同库之间的数据可以零拷贝地传递。

特点

1.ndarray — N 维数组对象
2.向量化运算 — 避免 Python 循环
3.广播机制 — 不同形状数组运算
4.线性代数 — 矩阵运算和分解
5.内存映射 — 处理超大规模数组
6.随机数生成 — 独立的高质量随机数引擎

数组基础

创建数组

import numpy as np

# 从列表创建
a = np.array([1, 2, 3, 4, 5])           # 一维数组
b = np.array([[1, 2, 3], [4, 5, 6]])     # 二维数组

# 特殊数组
zeros = np.zeros((3, 4))                  # 全零 3x4
ones = np.ones((2, 3))                    # 全一 2x3
eye = np.eye(3)                           # 单位矩阵 3x3
arange = np.arange(0, 10, 2)             # [0, 2, 4, 6, 8]
linspace = np.linspace(0, 1, 5)          # [0, 0.25, 0.5, 0.75, 1.0]
random = np.random.randn(3, 3)           # 标准正态分布

# 数组属性
print(a.shape)       # (5,)
print(b.ndim)        # 2
print(b.dtype)       # int64
print(b.size)        # 6

深入理解 dtype（数据类型）

dtype 是 NumPy 性能的关键——固定类型使得数组在内存中紧凑排列，CPU 可以高效地进行 SIMD（单指令多数据）操作：

import numpy as np

# 指定 dtype 创建数组
int_arr = np.array([1, 2, 3], dtype=np.int32)
float_arr = np.array([1, 2, 3], dtype=np.float64)
bool_arr = np.array([True, False, True], dtype=np.bool_)

# 查看各类型占用的字节数
print(f"int32: {int_arr.dtype.itemsize} bytes/element")   # 4
print(f"float64: {float_arr.dtype.itemsize} bytes/element") # 8
print(f"bool: {bool_arr.dtype.itemsize} bytes/element")     # 1

# 结构化数组 —— 类似 C 语言的结构体
dt = np.dtype([
    ("name", "U20"),    # 最多20个字符的 Unicode 字符串
    ("age", np.int32),
    ("salary", np.float64)
])
employees = np.array([
    ("Alice", 30, 85000.0),
    ("Bob", 25, 65000.0),
    ("Charlie", 35, 95000.0)
], dtype=dt)

# 按字段名访问
print(employees["name"])     # ['Alice' 'Bob' 'Charlie']
print(employees["salary"].mean())  # 81666.67

# 类型转换
float_from_int = int_arr.astype(np.float64)
print(float_from_int.dtype)  # float64

# 精度控制
small_float = np.array([0.1, 0.2, 0.3], dtype=np.float32)
print(f"float32 精度: {small_float.sum()}")  # 0.6000000238418579 (有误差)
high_prec = np.array([0.1, 0.2, 0.3], dtype=np.float64)
print(f"float64 精度: {high_prec.sum()}")   # 0.6000000000000001 (误差更小)

数组形状操作

import numpy as np

# reshape：改变形状（不改变数据）
a = np.arange(12)
print(a.reshape(3, 4))       # 3行4列
print(a.reshape(2, -1))      # -1 表示自动推断，这里推断为 6
print(a.reshape(3, 2, 2))    # 三维数组

# transpose / T：转置
matrix = np.arange(6).reshape(2, 3)
print(matrix)
# [[0, 1, 2],
#  [3, 4, 5]]
print(matrix.T)  # 3x2

# 多维转置
cube = np.arange(24).reshape(2, 3, 4)
print(cube.transpose(1, 0, 2).shape)  # (3, 2, 4)

# flatten vs ravel
a = np.arange(6).reshape(2, 3)
flat1 = a.flatten()   # 返回副本
flat2 = a.ravel()     # 返回视图（尽可能不复制数据）
flat2[0] = 999
print(a[0, 0])        # 999（ravel 修改影响了原数组）

# newaxis：增加维度
a = np.array([1, 2, 3])
print(a.shape)                # (3,)
print(a[np.newaxis, :].shape) # (1, 3)
print(a[:, np.newaxis].shape) # (3, 1)

# concatenate / stack / vstack / hstack
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

print(np.concatenate([a, b], axis=0))   # 纵向拼接 4x2
print(np.concatenate([a, b], axis=1))   # 横向拼接 2x4
print(np.stack([a, b], axis=0).shape)   # (2, 2, 2)
print(np.vstack([a, b]).shape)           # (4, 2)
print(np.hstack([a, b]).shape)           # (2, 4)

# split：分割数组
arr = np.arange(9)
print(np.split(arr, 3))            # 分成 3 等份
print(np.array_split(arr, 4))      # 不等分（最后一个较短）

数组运算

# 向量化运算（无需循环）
a = np.array([1, 2, 3, 4, 5])
b = np.array([10, 20, 30, 40, 50])

print(a + b)        # [11, 22, 33, 44, 55]
print(a * b)        # [10, 40, 90, 160, 250]
print(a ** 2)       # [1, 4, 9, 16, 25]
print(np.sqrt(a))   # [1., 1.414, 1.732, 2., 2.236]

# 统计运算
data = np.random.randn(1000)
print(f"均值: {data.mean():.4f}")
print(f"标准差: {data.std():.4f}")
print(f"最大值: {data.max():.4f}")
print(f"最小值: {data.min():.4f}")
print(f"求和: {data.sum():.4f}")

# 矩阵运算
A = np.random.randn(3, 3)
B = np.random.randn(3, 3)

C = A @ B                    # 矩阵乘法
C = np.dot(A, B)            # 等价写法
print(A.T)                   # 转置

通用函数（ufunc）

NumPy 的通用函数是对数组逐元素执行操作的函数，它们是向量化运算的核心实现：

import numpy as np

# 算术 ufunc
a = np.array([1, 2, 3, 4, 5])

# 逐元素运算
print(np.add(a, 10))        # [11, 12, 13, 14, 15]
print(np.multiply(a, 3))    # [3, 6, 9, 12, 15]
print(np.power(a, 2))       # [1, 4, 9, 16, 25]

# 三角函数
angles = np.array([0, np.pi/6, np.pi/4, np.pi/3, np.pi/2])
print(np.sin(angles))
print(np.cos(angles))

# 比较运算
a = np.array([1, 5, 3, 8, 2])
b = np.array([2, 4, 3, 7, 5])
print(np.greater(a, b))      # [False, True, False, True, False]
print(np.equal(a, b))        # [False, False, True, False, False]

# 聚合 ufunc —— 指定 axis 进行沿轴运算
matrix = np.arange(12).reshape(3, 4)
print(matrix.sum(axis=0))    # 每列求和 [12, 15, 18, 21]
print(matrix.sum(axis=1))    # 每行求和 [6, 22, 38]
print(matrix.max(axis=0))    # 每列最大值 [8, 9, 10, 11]

# where 条件函数
x = np.array([1, -2, 3, -4, 5])
result = np.where(x > 0, x, 0)   # 正数保留，负数变 0
print(result)  # [1, 0, 3, 0, 5]

# clip 裁剪
data = np.array([1, 5, 10, 15, 20])
clipped = np.clip(data, 3, 12)   # 低于 3 的变 3，高于 12 的变 12
print(clipped)  # [3, 5, 10, 12, 12]

# outer 外积
a = np.array([1, 2, 3])
b = np.array([10, 20, 30])
print(np.outer(a, b))
# [[10, 20, 30],
#  [20, 40, 60],
#  [30, 60, 90]]

索引和切片

# 一维数组索引
a = np.arange(10)  # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
print(a[5])            # 5
print(a[2:7])          # [2, 3, 4, 5, 6]
print(a[::2])          # [0, 2, 4, 6, 8]
print(a[a > 5])        # [6, 7, 8, 9]  布尔索引

# 二维数组索引
matrix = np.arange(12).reshape(3, 4)
# [[ 0,  1,  2,  3],
#  [ 4,  5,  6,  7],
#  [ 8,  9, 10, 11]]

print(matrix[0, 1])           # 1
print(matrix[1, :])           # [4, 5, 6, 7]
print(matrix[:, 2])           # [2, 6, 10]
print(matrix[:2, 1:3])        # [[1, 2], [5, 6]]

# 花式索引
print(matrix[[0, 2], [1, 3]]) # [1, 11]

# 条件替换
data = np.array([1, -2, 3, -4, 5])
data[data < 0] = 0            # 将负数替换为 0
# [1, 0, 3, 0, 5]

高级索引详解

import numpy as np

# 整数数组索引（花式索引）
a = np.arange(10)
indices = np.array([0, 2, 5, 7])
print(a[indices])  # [0, 2, 5, 7]

# 多维花式索引
matrix = np.arange(16).reshape(4, 4)
rows = np.array([0, 2, 3])
cols = np.array([1, 3, 0])
print(matrix[rows, cols])  # [1, 11, 12]

# 布尔索引的组合
data = np.random.randn(100, 3)
mask = (data[:, 0] > 0) & (data[:, 1] < 1)
filtered = data[mask]
print(f"满足条件的行数: {len(filtered)}")

# np.ix_ 构造开放网格
matrix = np.arange(16).reshape(4, 4)
rows = [0, 2]
cols = [1, 3]
print(matrix[np.ix_(rows, cols)])
# [[1, 3],
#  [9, 11]]

# take 和 put
a = np.array([10, 20, 30, 40, 50])
print(np.take(a, [0, 2, 4]))  # [10, 30, 50]

b = np.zeros(10)
np.put(b, [1, 3, 5], [100, 200, 300])
print(b)  # [0, 100, 0, 200, 0, 300, 0, 0, 0, 0]

# searchsorted：在有序数组中查找插入位置
sorted_arr = np.array([1, 3, 5, 7, 9])
print(np.searchsorted(sorted_arr, 4))   # 2 (插入到索引2)
print(np.searchsorted(sorted_arr, [0, 4, 10]))  # [0, 2, 5]

广播机制

不同形状运算

# 广播规则：较小数组自动扩展
a = np.array([[1], [2], [3]])   # shape (3, 1)
b = np.array([10, 20, 30])      # shape (3,)
c = a + b                        # shape (3, 3)
# [[11, 21, 31],
#  [12, 22, 32],
#  [13, 23, 33]]

# 标准化每列
data = np.random.randn(100, 5)   # 100行5列
col_mean = data.mean(axis=0)     # 每列均值 shape (5,)
col_std = data.std(axis=0)       # 每列标准差 shape (5,)
normalized = (data - col_mean) / col_std  # 广播自动扩展

# 实际应用：计算距离
points = np.random.randn(10, 2)   # 10个2D点
center = np.array([0, 0])
distances = np.sqrt(np.sum((points - center) ** 2, axis=1))

广播规则详解

import numpy as np

# 广播的三条规则：
# 1. 如果两个数组的维度数不同，较小数组的形状会在左侧补 1
# 2. 如果两个数组在某个维度上大小不同，大小为 1 的维度会被扩展
# 3. 如果两个数组在某个维度上大小不同且都不为 1，则报错

# 规则 1 示例：维度数不同
a = np.arange(3)              # shape (3,)  -> 视为 (1, 3)
b = np.ones((4, 3))           # shape (4, 3)
print((a + b).shape)           # (4, 3)

# 规则 2 示例：大小为 1 的维度扩展
a = np.arange(3).reshape(1, 3) # shape (1, 3)
b = np.arange(4).reshape(4, 1) # shape (4, 1)
print((a + b).shape)           # (4, 3)

# 规则 3 示例：不兼容的形状
a = np.arange(3)              # shape (3,)
b = np.arange(4)              # shape (4,)
# a + b  # ValueError: operands could not be broadcast together

# 显式使用 expand_dims 控制广播
a = np.arange(3)
b = np.arange(4)
print((a[:, np.newaxis] + b[np.newaxis, :]).shape)  # (3, 4)

# 实际场景：计算所有样本对之间的距离矩阵
samples = np.random.randn(100, 3)  # 100个3D样本
# 方法一：双重循环（慢）
# 方法二：广播（快）
diff = samples[:, np.newaxis, :] - samples[np.newaxis, :, :]
# shape: (100, 1, 3) - (1, 100, 3) -> (100, 100, 3)
dist_matrix = np.sqrt(np.sum(diff ** 2, axis=2))
# shape: (100, 100)
print(f"距离矩阵形状: {dist_matrix.shape}")

线性代数

矩阵操作

# 线性代数运算
A = np.random.randn(3, 3)

# 矩阵分解
eigenvalues, eigenvectors = np.linalg.eig(A)    # 特征值分解
U, S, Vt = np.linalg.svd(A)                      # SVD 分解

# 求解线性方程组 Ax = b
A = np.array([[2, 1], [1, 3]])
b = np.array([5, 7])
x = np.linalg.solve(A, b)
print(f"解: {x}")  # [1.6, 1.8]

# 行列式和逆矩阵
det = np.linalg.det(A)
inv = np.linalg.inv(A)

# 最小二乘（线性回归）
X = np.random.randn(100, 2)
y = 3 * X[:, 0] + 2 * X[:, 1] + np.random.randn(100) * 0.1
X_b = np.column_stack([X, np.ones(100)])  # 添加偏置项
theta = np.linalg.lstsq(X_b, y, rcond=None)[0]
print(f"系数: {theta[:2]}, 截距: {theta[2]}")

深入矩阵分解

import numpy as np

# SVD 分解 —— 降维和推荐系统的核心
A = np.random.randn(5, 3)
U, S, Vt = np.linalg.svd(A, full_matrices=False)
print(f"U shape: {U.shape}")     # (5, 3)
print(f"S shape: {S.shape}")     # (3,)
print(f"Vt shape: {Vt.shape}")   # (3, 3)

# 用 SVD 做低秩近似（截断 SVD）
k = 2  # 保留前 k 个奇异值
A_approx = U[:, :k] @ np.diag(S[:k]) @ Vt[:k, :]
print(f"原始矩阵: {A.shape}")
print(f"低秩近似: {A_approx.shape}")
print(f"近似误差: {np.linalg.norm(A - A_approx):.4f}")

# Cholesky 分解 —— 正定矩阵分解
A = np.array([[4, 2], [2, 3]], dtype=float)
L = np.linalg.cholesky(A)  # A = L @ L.T
print(f"验证: {np.allclose(L @ L.T, A)}")  # True

# QR 分解 —— 最小二乘和特征值算法的基础
A = np.random.randn(4, 3)
Q, R = np.linalg.qr(A)
print(f"Q 正交: {np.allclose(Q.T @ Q, np.eye(3))}")  # True

# 特征值分解
A = np.array([[2, 1], [1, 3]], dtype=float)
eigenvalues, eigenvectors = np.linalg.eig(A)
print(f"特征值: {eigenvalues}")
print(f"特征向量:\n{eigenvectors}")

# 验证 Av = lambda * v
for i in range(len(eigenvalues)):
    v = eigenvectors[:, i]
    lambda_val = eigenvalues[i]
    result = A @ v
    expected = lambda_val * v
    print(f"验证 {i}: {np.allclose(result, expected)}")

文件 I/O 与内存管理

保存和加载数组

import numpy as np

# 创建示例数组
data = np.random.randn(1000, 10)

# 方式一：.npy 格式（单个数组）
np.save("data.npy", data)
loaded = np.load("data.npy")
print(f"保存/加载验证: {np.array_equal(data, loaded)}")

# 方式二：.npz 格式（多个数组）
a = np.array([1, 2, 3])
b = np.array([[4, 5], [6, 7]])
np.savez("multiple.npz", arr_a=a, arr_b=b)
loaded = np.load("multiple.npz")
print(loaded["arr_a"])  # [1, 2, 3]
print(loaded["arr_b"])  # [[4, 5], [6, 7]]

# 方式三：文本格式（可读但效率低）
np.savetxt("data.csv", data[:5], delimiter=",", fmt="%.4f")
loaded_txt = np.loadtxt("data.csv", delimiter=",")
print(f"文本格式形状: {loaded_txt.shape}")

# 方式四：内存映射文件（处理超大数组）
# 不将整个文件读入内存，按需访问
big_array = np.memmap("big_array.dat", dtype="float64",
                       mode="w+", shape=(10000, 10000))
print(f"内存映射数组形状: {big_array.shape}")
print(f"实际内存占用极低，只在访问时加载对应页")
big_array[0, 0] = 42.0  # 只加载这一页到内存
big_array.flush()        # 将修改写回磁盘
del big_array             # 关闭内存映射

随机数生成

现代随机数 API（NumPy 1.17+）

import numpy as np

# 推荐方式：使用 Generator 对象（比旧 API 更快、统计特性更好）
rng = np.random.default_rng(seed=42)

# 基本分布
print(rng.random(5))              # [0, 1) 均匀分布
print(rng.integers(0, 100, 5))   # [0, 100) 随机整数
print(rng.standard_normal(5))    # 标准正态分布
print(rng.normal(loc=10, scale=2, size=5))  # 指定均值和标准差

# 其他常用分布
print(rng.exponential(scale=1.0, size=5))   # 指数分布
print(rng.poisson(lam=5, size=5))            # 泊松分布
print(rng.uniform(low=0, high=10, size=5))   # 均匀分布

# 随机采样
population = np.arange(100)
sample = rng.choice(population, size=10, replace=False)
print(f"不放回抽样: {sample}")

# 随机打乱
arr = np.arange(10)
rng.shuffle(arr)
print(f"打乱后: {arr}")

# 旧 API（仍然可用，但不推荐）
np.random.seed(42)
old_random = np.random.randn(5)

# 为什么推荐新 API：
# 1. 全局状态是线程不安全的，Generator 对象是独立的
# 2. Generator 使用 PCG64 算法，统计特性优于旧版的 MT19937
# 3. 支持更多的分布类型

性能优化

性能对比

import time

size = 1_000_000

# Python 列表
a_list = list(range(size))
b_list = list(range(size))
start = time.time()
c_list = [a + b for a, b in zip(a_list, b_list)]
python_time = time.time() - start

# NumPy 数组
a_np = np.arange(size)
b_np = np.arange(size)
start = time.time()
c_np = a_np + b_np
numpy_time = time.time() - start

print(f"Python: {python_time:.3f}s")
print(f"NumPy:  {numpy_time:.6f}s")
print(f"加速比: {python_time/numpy_time:.0f}x")

避免不必要的拷贝

import numpy as np

# 视图 vs 副本
a = np.arange(10)

# 切片返回视图（共享内存）
b = a[2:5]
b[0] = 999
print(a)  # [0, 1, 999, 3, 4, 5, 6, 7, 8, 9]  原数组被修改！

# fancy indexing 返回副本
c = a[[0, 1, 2]]
c[0] = 888
print(a)  # 不受影响

# 检查是否是视图
print(b.base is a)  # True (b 是 a 的视图)
print(c.base is a)  # False (c 是副本)

# 显式创建副本
d = a.copy()
d[0] = 777
print(a)  # 不受影响

# 使用 np.may_share_memory 检查
print(np.may_share_memory(a, b))  # True
print(np.may_share_memory(a, c))  # False

内存高效技巧

import numpy as np

# 技巧 1：原地操作
a = np.random.randn(1000, 1000)
b = np.random.randn(1000, 1000)

# 非原地：创建新数组
c = a + b        # 分配新内存
# 原地：不创建新数组
np.add(a, b, out=a)  # 结果直接写入 a，节省内存

# 技巧 2：预分配数组
result = np.empty(1000, dtype=np.float64)
for i in range(10):
    chunk = np.random.randn(100)
    result[i*100:(i+1)*100] = chunk  # 填入预分配的数组

# 技巧 3：使用适当的数据类型
# float64 -> float32 节省一半内存
data_f64 = np.random.randn(10000, 1000)
data_f32 = data_f64.astype(np.float32)
print(f"float64: {data_f64.nbytes / 1024 / 1024:.1f} MB")
print(f"float32: {data_f32.nbytes / 1024 / 1024:.1f} MB")

# 技巧 4：利用 np.frombuffer 避免拷贝
import array
py_array = array.array("d", [1.0, 2.0, 3.0])
np_array = np.frombuffer(py_array, dtype=np.float64)
# np_array 和 py_array 共享同一块内存

实用模式

模式一：数据预处理管道

import numpy as np

def preprocess_pipeline(data: np.ndarray) -> np.ndarray:
    """标准化数据预处理管道

    Args:
        data: 输入数据，shape (n_samples, n_features)
    Returns:
        标准化后的数据
    """
    # 1. 去除 NaN 行
    mask = ~np.any(np.isnan(data), axis=1)
    data = data[mask]
    print(f"去除 NaN 后样本数: {len(data)}")

    # 2. 去除异常值（IQR 方法）
    Q1 = np.percentile(data, 25, axis=0)
    Q3 = np.percentile(data, 75, axis=0)
    IQR = Q3 - Q1
    lower = Q1 - 1.5 * IQR
    upper = Q3 + 1.5 * IQR
    mask = np.all((data >= lower) & (data <= upper), axis=1)
    data = data[mask]
    print(f"去除异常值后样本数: {len(data)}")

    # 3. Z-score 标准化
    mean = data.mean(axis=0)
    std = data.std(axis=0)
    std[std == 0] = 1  # 避免除以零
    normalized = (data - mean) / std
    print(f"标准化后均值: {normalized.mean(axis=0)}")
    print(f"标准化后标准差: {normalized.std(axis=0)}")

    return normalized

# 使用示例
data = np.random.randn(1000, 5)
data[::50, 0] = np.nan  # 插入一些 NaN
data[0, 1] = 100.0      # 插入异常值
result = preprocess_pipeline(data)

模式二：特征工程

import numpy as np

def build_features(X: np.ndarray) -> np.ndarray:
    """从原始特征构建扩展特征矩阵

    Args:
        X: 原始特征 shape (n, d)
    Returns:
        扩展特征 shape (n, d + d*(d+1)/2)
    """
    n, d = X.shape
    features = [X]

    # 1. 交叉特征（两两相乘）
    for i in range(d):
        for j in range(i, d):
            features.append((X[:, i] * X[:, j]).reshape(-1, 1))

    # 2. 对数特征
    safe_X = np.abs(X) + 1e-8
    features.append(np.log(safe_X))

    # 3. 多项式特征（二阶）
    features.append((X ** 2))

    return np.hstack(features)

# 示例
X = np.random.randn(100, 3)
X_extended = build_features(X)
print(f"原始特征维度: {X.shape[1]}")
print(f"扩展后特征维度: {X_extended.shape[1]}")

模式三：批量数据处理

import numpy as np

class BatchProcessor:
    """分批处理大型数组的工具类"""

    def __init__(self, data: np.ndarray, batch_size: int = 1024):
        self.data = data
        self.batch_size = batch_size
        self.n = len(data)

    def process(self, func) -> np.ndarray:
        """对数据分批应用函数"""
        results = []
        for start in range(0, self.n, self.batch_size):
            end = min(start + self.batch_size, self.n)
            batch = self.data[start:end]
            result = func(batch)
            if isinstance(result, np.ndarray):
                results.append(result)
            else:
                results.append(np.array(result))
        return np.concatenate(results, axis=0)

# 使用示例
data = np.random.randn(100000, 10)

processor = BatchProcessor(data, batch_size=5000)

# 分批计算 softmax
def softmax(batch):
    exp_batch = np.exp(batch - batch.max(axis=1, keepdims=True))
    return exp_batch / exp_batch.sum(axis=1, keepdims=True)

result = processor.process(softmax)
print(f"处理结果形状: {result.shape}")
print(f"每行概率和: {result.sum(axis=1)[:5]}")  # 应该都是 1.0

优点

1.高性能 — C 语言底层，比 Python 快 100 倍
2.向量化 — 简洁的数学表达式
3.广播 — 自动处理不同形状数组
4.生态基础 — Pandas/SciPy/Sklearn 底层依赖

缺点

1.内存占用 — 固定类型数组，不支持混合类型
2.GPU 不支持 — 需要 CuPy 或 PyTorch
3.学习曲线 — 广播规则需要理解
4.并行计算 — 单线程，大数据考虑 Dask

总结

NumPy 核心：ndarray（N 维数组）+ 向量化运算。创建数组用 np.array/zeros/ones/arange。运算自动向量化，避免 Python 循环。广播机制处理不同形状数组。线性代数用 np.linalg。性能比 Python 原生快 10-100 倍。是 Pandas 和 Scikit-learn 的底层依赖。