0%

本文主要介绍了基本的CUDA程序框架及代码解析,包括如何申请设备指针内存、将数据拷贝到设备上、调用核函数进行计算、线程同步以及将结果拷贝回主机内等。同时也介绍了一些常见问题及解决方案,比如CUDA程序黑屏之后恢复的问题。接 记被CUDA折腾死去活来的那十天 。阅读本文前需要有一部分C语言基础。

阅读全文 »

从海量数据中找出不重复的数和出现次数最多的数的解决方案,分别采用了分治法+HashMap和位图法Bitmap两种方法。其中,位图法在大数据量下处理速度更快,内存占用更小。而对于其他类似问题,可以尝试使用分治法加最小堆/最大堆的方式处理。

阅读全文 »