Skip to content

知识点

这里将记录一些在读论文中遇到的一些知识点

向量范数

定义

向量范数是用于度量向量空间中向量"长度"或"大小"的函数,需满足以下条件:

  1. 非负性

    xRn(或 Cn),x0 且 x=0x=0
  2. 齐次性

    cR,xRn,cx=|c|x
  3. 三角不等式

    x,yRn,x+yx+y

常见范数类型

名称数学表示应用场景
L₁范数 (曼哈顿范数)$|\mathbf{x}|1 = \sum^nx_i
L₂范数 (欧几里得范数)|x|2=i=1nxi2欧氏距离计算
L∞范数 (切比雪夫范数)$|\mathbf{x}|_\infty = \max_ix_i
L₀范数|x|0=#{ixi0}稀疏优化

应用场景

机器学习

  • 特征缩放:通过L₂范数归一化处理
  • 正则化
    • L₁范数 → Lasso回归
    • L₂范数 → 岭回归

重要性质

  1. 连续性

    xyxy
  2. 等价性

    m,M>0, s.t. mxαxβMxα

Jaccard距离的定义与计算

Jaccard Similarity Index

Jaccard相似指数用来度量两个集合之间的相似性,它被定义为两个集合交集的元素个数除以并集的元素个数。

J(A,B)=|AB||AB|

Jaccard Distance

Jaccard距离用来度量两个集合之间的差异性,它是Jaccard的相似系数的补集,被定义为1减去Jaccard相似系数。

dJ(A,B)=1J(A,B)=|AB||AB||AB|

即越小相似度越高