0%

对于两种场景下介绍 LLM 的 推理加速方法

长输入,短输出

长输出但输出 token 有限

阅读全文 »

在一个文件夹中,有很多个 Python 文件,每个文件都有若干重名函数,需要一一导入。这个时候,可以用 Python 的自动导入包来实现。

阅读全文 »