范数、距离与相似度

发表于 2024-03-14 分类于网安数基笔记本文字数： 859 阅读时长 ≈ 3 分钟

课程笔记

范数（“长度”）

定义 1：设$||\cdot||$为向量空间$R_{n}$ 的实值函数满足：
$1^o\,$ 非负性: \[ ||x|| \geq 0 \]
其中，$||x||=0 \iff x = 0$
$2^o\,$ 齐次性：
\[\forall k\in R,||kx|| = |k| ||x||\] $3^o\,$ 三角不等式： \[||x+y||\leq ||x|| + ||y||\] 则把$||\cdot||$称为向量范数。
常用的向量范数

$x=(x_{1},x_2,\cdots,x_n)^T$
$1^o\,$ 0-范数:
\[{||x||}_0 = n\] 其中 n 为 x 中非零元素的个数。
$2^o\,$ 1-范数:
\[{||x||}_1 = \sum_{i=1}^n|x_i|\] $3^o\,$ 2-范数: \[||x||_2 = \sqrt{\sum_{i=1}^nx_i^2}\] $4^o\,$ $\infty$-范数:

\[ ||x||_\infty = \max_{1 \leq i \leq n}|x_i| \]

定理 (范数的等价性)

\[ \begin{array}{ccccc} m||\cdot||_{P_2} & \leq & || \cdot ||_{P_{1}} & \leq & M||\cdot||_{P_2} \\ ||x||_\infty & \leq & ||x||_1 & \leq & n||x||_\infty \\ ||x||_\infty & \leq & ||x||_2 & \leq & \sqrt{n}||x||_\infty \end{array} \]

定义 2（矩阵范数) $A = (a_{ij})m*n$
满足定义 1 的三个条件且 $||AB|| \leq ||A||\cdot||B||$ 常用的矩阵范数
1-范数(列) $||A|| = \max_{1 \leq j \leq n}\sum_{i=1}^{m}|a_{ij}|$ $\infty$-范数(行) $||A|| = \max_{1 \leq i \leq m}\sum_{i=1}^n|a_{ij}|$
2-范数(谱) $||A|| = \max|A_TA的本征值|$
F-范数 $||A||_F = (\sum_{j=1}^n\sum_{i=1}^m|a_{ij}^2)^{\frac{1}{2}}$

矩阵常数可由向量范数诱导而得(相容性)

范数诱导的距离

注:距离满足定义 1 的三个条件且满足对称性(A 到 B 的距离等于 B 到 A 的距离)。
定义 3（闵可夫斯基距离）有$x = (x_1,x_2,\cdots,x_n)_T,y=(y_1,y_2,\cdots,y_n)_T$

\[ {\alpha}_P(x,y) = (\sum_{i=1}^n|x_i-y_i|^P)^{\frac{1}{p}} \]

$1^o\,$ P = 2 欧几里得距离
$2^o\,$ P = 1 曼哈顿距离正南正北”导航”距离。 $3^o\,$ $P = \infty$ 切比雪夫距离：
\[\alpha_P(x,y) = \max_{1 \leq i \leq n}|x_i-y_i|\] 老师举了个例子即：国际象棋 king 移动到其他位置的最快路径长度。
如图：
曼哈顿距离为 7，切比雪夫距离为 7。
$4^o\,$ p = 0 汉明重量(即$x_i = y_i$)： \[\alpha_0(x,y) = \sum_{i=1}^n(x_i-y_i)^0\] 3位二进制数

定义(莱文斯坦/字符串距离) 从一个字符串变为另一个字符串的步数。
e.g. $safe -> security$ 使用了 7 步。
定义(推土机距离)从一个概率分布变为另一个概率分布的最快步
定义(堪培拉距离)加权的曼哈顿
\[\alpha_{can}(x,y) = \sum_{i=1}^n\frac{|x_i-y_i|}{|x_i+y_i|}\]

相似度

不是距离，定义 1 的前两个条件。
定义(余弦相似度) $_(x,y) =
定义(皮尔逊相关系数) $x = (x_1,\cdots,x_n)^T,y = (y_1,\cdots,y_n)^T$
\[\rho_{x,y} = \frac{Cov(x,y)}{\sigma_x\sigma_y} = \frac{E[(x-\mu_x)(y-\mu_y)]}{\sigma_x\sigma_y}\] e.g.
Alice 给 Bob 发送序列第一次为$x = (80,85,90,75,95)^T$ ,第二次为$y = (70,75,85,60,90)^T$
计算得到$\mu_x=85,\mu_y = 76,Cov(x,y) = 75,\sigma_x=7.07,\sigma_y=10.68,\rho_{x,y} = 0.997$。
$\rho_{x,y}$接近于 1，说明具有强线性正相关。

定义（斯皮尔曼相关系数）
\[\rho_{x,y} = \frac{\sum_{i=1}^n(R(x_i)-\overline{R(x)})(R(y_i)-\overline{R(y)})}{\sqrt{(\frac{1}{n}\sum_{i=1}^{n}(R(x_i)-\overline{R(x)}))(\frac{1}{n}\sum_{i=1}^n(R(y_i)-\overline{R(y)}))}}\] R 表示位次,简化版如下： \[\rho_{x,y} = 1-\frac{6\cdot\sum_{i=1}^nd_i^2}{n(n^2-1)}\]

定义(杰拉德定理) $X = \{x_1,\cdots,x_n\}, Y = \{y_1,\cdots,y_n\}$ 二进制字符串 \[\rho_j(X,Y) = \frac{|X\cap Y|}{|X\cup Y|}\] 定义(Sorensen-Dice 指数) 文本分类和图像处理 \[\rho_s(X,Y) = \frac{2\cdot |X\cap Y|}{|X|+|Y|}\]