0%

SimHash算法是一种用于计算文档相似度的算法,可以通过计算文本的SimHash值来比较文档间的汉明距离,从而比较文档间的相似度。本文介绍了SimHash算法的基本原理和实现步骤,并介绍了中文分词方法和不同类型的分词算法。同时,还对损失函数、汉明距离、hash函数、频率与频度、互现信息等关键概念进行了详细解释,有助于读者深入了解SimHash算法背后的技术原理。

阅读全文 »

本文主要介绍了基本的CUDA程序框架及代码解析,包括如何申请设备指针内存、将数据拷贝到设备上、调用核函数进行计算、线程同步以及将结果拷贝回主机内等。同时也介绍了一些常见问题及解决方案,比如CUDA程序黑屏之后恢复的问题。接 记被CUDA折腾死去活来的那十天 。阅读本文前需要有一部分C语言基础。

阅读全文 »