用CUDA实现高效的矩阵运算——从一维到三维向量加法、共享内存矩阵乘法2.0。接 CUDA编程入门。
CUDA编程二次入门
本文主要介绍了基本的CUDA程序框架及代码解析,包括如何申请设备指针内存、将数据拷贝到设备上、调用核函数进行计算、线程同步以及将结果拷贝回主机内等。同时也介绍了一些常见问题及解决方案,比如CUDA程序黑屏之后恢复的问题。接 记被CUDA折腾死去活来的那十天 。阅读本文前需要有一部分C语言基础。
NLTK阅读笔记Ⅰ
NLP基本知识的介绍及NLTK模块的使用。
CUDA编程入门
CUDA编程入门,接 记被CUDA折腾死去活来的那十天
记被CUDA折腾死去活来的那十天
谨以此文章纪念大二的一次折腾CUDA环境搭建经历。
拉格朗日乘子法:从函数的求导到不等式约束的求解
本篇文章简单梳理了关于拉格朗日乘子法的相关问题及一些相关概念的介绍。
神经网络笔记Ⅰ
本篇文章只做一个神经网络入门知识的梳理和个人的理解。
矩阵分解介绍及Python实现(QR、SVD、LU)
本篇文章简单介绍了三种矩阵分解方式并且附上部分分解方式的实现代码。
SQL语句的优化
这篇文章主要介绍了关于SQL语句(主要是Oracle数据库)的优化方案。
海量数据处理问题(HashMap+分治法、位图法)
从海量数据中找出不重复的数和出现次数最多的数的解决方案,分别采用了分治法+HashMap和位图法Bitmap两种方法。其中,位图法在大数据量下处理速度更快,内存占用更小。而对于其他类似问题,可以尝试使用分治法加最小堆/最大堆的方式处理。