NLP基本知识的介绍及NLTK模块的使用。
杂记
SimHash算法是一种用于计算文档相似度的算法,可以通过计算文本的SimHash值来比较文档间的汉明距离,从而比较文档间的相似度。本文介绍了SimHash算法的基本原理和实现步骤,并介绍了中文分词方法和不同类型的分词算法。同时,还对损失函数、汉明距离、hash函数、频率与频度、互现信息等关键概念进行了详细解释,有助于读者深入了解SimHash算法背后的技术原理。
NLTK阅读笔记Ⅱ
CUDA官方文档笔记
CUDA编程二次入门
本文主要介绍了基本的CUDA程序框架及代码解析,包括如何申请设备指针内存、将数据拷贝到设备上、调用核函数进行计算、线程同步以及将结果拷贝回主机内等。同时也介绍了一些常见问题及解决方案,比如CUDA程序黑屏之后恢复的问题。接 记被CUDA折腾死去活来的那十天 。阅读本文前需要有一部分C语言基础。
NLTK阅读笔记Ⅰ
NLP基本知识的介绍及NLTK模块的使用。
CUDA编程入门
CUDA编程入门,接 记被CUDA折腾死去活来的那十天
记被CUDA折腾死去活来的那十天
谨以此文章纪念大二的一次折腾CUDA环境搭建经历。
拉格朗日乘子法:从函数的求导到不等式约束的求解
本篇文章简单梳理了关于拉格朗日乘子法的相关问题及一些相关概念的介绍。
神经网络笔记Ⅰ
本篇文章只做一个神经网络入门知识的梳理和个人的理解。