记录 LLM 在推理上的理论计算公式
Knowledge Distillation in LLM
从知识蒸馏的概念出发,介绍 LLM 中的知识蒸馏
LLM 不同硬件推理速度对比
对比不同硬件下,LLM 的推理速度
MoE中负载均衡Loss实现
发表于
分类于
Note
对比 MoE 中负载均衡 Loss 的实现方式,主要有跨层和非跨层两种实现
LLM的推理加速
LLM 深度的”稀疏性“
LLM 在宽度上的稀疏性可以通过 MoE 这种架构来优化。而深度上也具备稀疏性,故而可以进行裁剪。
用 Cpp 写 PyTorch 的插件
温度可视化
时序数据,使用简单的 HTML 对其进行展示。
Python 自动导入包
在一个文件夹中,有很多个 Python 文件,每个文件都有若干重名函数,需要一一导入。这个时候,可以用 Python 的自动导入包来实现。
树莓派折腾记录
使用树莓派的一些记录