XAI.1 | Intro and Interpretable models
What is XAI
XAI: 研究人是否能理解模型如何做出决策
XAI: Whether humans can understand how a model makes decisions
Interpretability vs Explainability
- Interpretability: 模型本身是否可理解
- Explainability: 用方法去解释模型
Intrinsic Interpretable Models
内生可解释模型(比较小的、符合人类直觉的模型)
1. Linear Regression 线性回归
模型形式
$$
y = \beta_0 + \beta_1 x_1 + \dots + \beta_d x_d
$$
要点
- 线性加权模型
- 每个特征对应一个系数
- 系数表示特征对输出的影响大小和方向
XAI 角度
- 系数 = feature importance
- 系数具有全局一致含义(global interpretation)
- 特征数量少时可解释
- 特征过多 → 可解释性下降
2. Logistic Regression 逻辑回归
$$
\hat{p} = \sigma(z) = \frac{1}{1 + e^{-z}}
$$
输出范围:(0, 1)
通常解释为:
样本属于“正类”的概率
然后再用一个阈值(通常是 0.5):
- ≥ 0.5 → 判为正类
- < 0.5 → 判为负类
用途
- 二分类问题
模型特点
- 内部仍为线性加权
- 输出限制在 $[0,1]$ (Sigmoid函数控制输出)
系数含义
- 系数为正:增加预测为 1 的倾向
- 系数为负:减少预测为 1 的倾向
XAI 角度
- 可解释的分类模型
- 系数表示决策方向与强度
3. Decision Trees 决策树
结构
- 由条件节点和叶节点组成
- IF–THEN 规则形式
- Entropy(熵) 可以表示分类的纯度 -> 大于0表示节点内还有不同类别混在一起
决策方式
- 从根节点到叶节点形成一条决策路径
XAI 角度
- 决策路径即解释
- 符合人类决策逻辑
4. Generalized Linear Models (GLM) 广义线性模型
动机
- 线性回归可能产生不合理输出
核心思想
- 保留线性预测结构
- 通过 link function 修改输出范围
XAI 角度
- 解释方式与线性模型一致
- 输出符合现实约束
5. Feature Interaction
问题
- 线性模型假设特征独立影响输出
解决方式
- 加入交互项表示联合影响
XAI 角度
- 表达条件依赖关系
- 更贴近真实决策机制
6. Generalized Additive Models (GAM)
模型形式
$$
g(E[Y|X]) = \beta_0 + f_1(x_1) + \dots + f_d(x_d)
$$
特点
- 每个特征允许非线性
- 特征影响仍然相加
XAI 角度
- 可视化单个特征影响
- 在灵活性与可解释性之间折中
7. Decision Rules
形式
- IF condition THEN prediction
组成
- 多个条件(AND 连接)
- 一个预测结果
评价指标
- Support:规则覆盖比例
- Accuracy:规则预测正确率
XAI 角度
- 高度可解释
- 接近自然语言规则