深度学习信息论与结构化概率模型（十一）

张

张建站

2026/4/8 16:02:13

10分钟阅读

1. 定位导航本篇是概率与信息论的收官篇，覆盖两大主题：信息论：自信息、香农熵、KL 散度、交叉熵——深度学习损失函数的理论根基结构化概率模型：用图来表达高维联合分布的因子分解——理解 LDA、贝叶斯网络、马尔可夫随机场的基础理解这两块内容后，你就能真正回答："为什么 logistic 回归用交叉熵而不是 MSE？“以及"GPT 和 BERT 处理的本质上是什么样的概率结构？”2. 自信息：单个事件的信息量2.1 直觉"一个不太可能的事件居然发生了"比"一个非常可能的事件发生"传递的信息更多。“今天早上太阳升起”——信息量极少（几乎没必要发送）“今天早上发生日食”——信息量丰富我们希望对"信息量"的定义满足三个性质：非常可能发生的事件信息量小，确定发生的事件信息量为零较不可能发生的事件信息量更大独立事件的信息量应该可加（抛两次硬币正面的信息量 = 抛一次正面的信息量 × 2）

Webi-installers部署指南：如何在自己的服务器上搭建安装平台

Webi-installers部署指南：如何在自己的服务器上搭建安装平台【免费下载链接】webi-installers Primary and community-submitted packages for webinstall.dev 项目地址: https://gitcode.com/gh_mirrors/we/webi-installers GitHub 加速计划（we…...

2026/4/8 16:02:11 阅读更多 →

Python开发者速看：Mojo 2026.3.0正式版已支持CPython 3.12原生ABI，但92%的人仍用错FFI桥接方式！

第一章：Mojo 2026.3.0正式版核心特性与CPython 3.12 ABI原生支持全景解析 Mojo 2026.3.0正式版标志着语言工程与Python生态融合的重大跃迁——首次实现对CPython 3.12 ABI的零抽象层原生兼容，无需FFI桥接或运行时翻译。该版本将Mojo的高性能编译器后端与…...

2026/4/8 16:02:11 阅读更多 →