What is XAI

XAI: 研究人是否能理解模型如何做出决策
XAI: Whether humans can understand how a model makes decisions

Interpretability vs Explainability

Interpretability: 模型本身是否可理解
Explainability: 用方法去解释模型

Intrinsic Interpretable Models

内生可解释模型(比较小的、符合人类直觉的模型)

1. Linear Regression 线性回归

模型形式

$$
y = \beta_0 + \beta_1 x_1 + \dots + \beta_d x_d
$$

要点

线性加权模型
每个特征对应一个系数
系数表示特征对输出的影响大小和方向

XAI 角度

系数 = feature importance
系数具有全局一致含义（global interpretation）
特征数量少时可解释
特征过多 → 可解释性下降

2. Logistic Regression 逻辑回归

$$
\hat{p} = \sigma(z) = \frac{1}{1 + e^{-z}}
$$

输出范围：(0, 1)
通常解释为：
样本属于“正类”的概率

然后再用一个阈值（通常是 0.5）：

≥ 0.5 → 判为正类
< 0.5 → 判为负类

用途

二分类问题

模型特点

内部仍为线性加权
输出限制在 $[0,1]$ (Sigmoid函数控制输出)

系数含义

系数为正：增加预测为 1 的倾向
系数为负：减少预测为 1 的倾向

XAI 角度

可解释的分类模型
系数表示决策方向与强度

3. Decision Trees 决策树

结构

由条件节点和叶节点组成
IF–THEN 规则形式
Entropy(熵) 可以表示分类的纯度 -> 大于0表示节点内还有不同类别混在一起

决策方式

从根节点到叶节点形成一条决策路径

XAI 角度

决策路径即解释
符合人类决策逻辑

4. Generalized Linear Models (GLM) 广义线性模型

动机

线性回归可能产生不合理输出

核心思想

保留线性预测结构
通过 link function 修改输出范围

XAI 角度

解释方式与线性模型一致
输出符合现实约束

5. Feature Interaction

问题

线性模型假设特征独立影响输出

解决方式

加入交互项表示联合影响

XAI 角度

表达条件依赖关系
更贴近真实决策机制

6. Generalized Additive Models (GAM)

模型形式
$$
g(E[Y|X]) = \beta_0 + f_1(x_1) + \dots + f_d(x_d)
$$
特点

每个特征允许非线性
特征影响仍然相加

XAI 角度

可视化单个特征影响
在灵活性与可解释性之间折中

7. Decision Rules

形式

IF condition THEN prediction

组成

多个条件（AND 连接）
一个预测结果

评价指标

Support：规则覆盖比例
Accuracy：规则预测正确率

XAI 角度

高度可解释
接近自然语言规则