XAI.1 | Intro and Interpretable models
0x00A0

What is XAI

XAI: 研究人是否能理解模型如何做出决策
XAI: Whether humans can understand how a model makes decisions

Interpretability vs Explainability

  • Interpretability: 模型本身是否可理解
  • Explainability: 用方法去解释模型

Intrinsic Interpretable Models

内生可解释模型(比较小的、符合人类直觉的模型)

1. Linear Regression 线性回归

模型形式

$$
y = \beta_0 + \beta_1 x_1 + \dots + \beta_d x_d
$$

要点

  • 线性加权模型
  • 每个特征对应一个系数
  • 系数表示特征对输出的影响大小和方向

XAI 角度

  • 系数 = feature importance
  • 系数具有全局一致含义(global interpretation)
  • 特征数量少时可解释
  • 特征过多 → 可解释性下降

2. Logistic Regression 逻辑回归

$$
\hat{p} = \sigma(z) = \frac{1}{1 + e^{-z}}
$$

  • 输出范围:(0, 1)

  • 通常解释为:

    样本属于“正类”的概率

然后再用一个阈值(通常是 0.5):

  • ≥ 0.5 → 判为正类
  • < 0.5 → 判为负类

用途

  • 二分类问题

模型特点

  • 内部仍为线性加权
  • 输出限制在 $[0,1]$ (Sigmoid函数控制输出)

系数含义

  • 系数为正:增加预测为 1 的倾向
  • 系数为负:减少预测为 1 的倾向

XAI 角度

  • 可解释的分类模型
  • 系数表示决策方向与强度

3. Decision Trees 决策树

结构

  • 由条件节点和叶节点组成
  • IF–THEN 规则形式
  • Entropy(熵) 可以表示分类的纯度 -> 大于0表示节点内还有不同类别混在一起

决策方式

  • 从根节点到叶节点形成一条决策路径

XAI 角度

  • 决策路径即解释
  • 符合人类决策逻辑

4. Generalized Linear Models (GLM) 广义线性模型

动机

  • 线性回归可能产生不合理输出

核心思想

  • 保留线性预测结构
  • 通过 link function 修改输出范围

XAI 角度

  • 解释方式与线性模型一致
  • 输出符合现实约束

5. Feature Interaction

问题

  • 线性模型假设特征独立影响输出

解决方式

  • 加入交互项表示联合影响

XAI 角度

  • 表达条件依赖关系
  • 更贴近真实决策机制

6. Generalized Additive Models (GAM)

模型形式
$$
g(E[Y|X]) = \beta_0 + f_1(x_1) + \dots + f_d(x_d)
$$
特点

  • 每个特征允许非线性
  • 特征影响仍然相加

XAI 角度

  • 可视化单个特征影响
  • 在灵活性与可解释性之间折中

7. Decision Rules

形式

  • IF condition THEN prediction

组成

  • 多个条件(AND 连接)
  • 一个预测结果

评价指标

  • Support:规则覆盖比例
  • Accuracy:规则预测正确率

XAI 角度

  • 高度可解释
  • 接近自然语言规则
 BUY ME A CUPPA!
Powered by Hexo & Theme Keep
This site is deployed on
Unique Visitor Page View