码农周刊一周精选分类
作为最初的一批码农周刊的订阅者,不能说经历了其成长,但是确实见证了他的壮大。码农周刊确实从开始第一期的基本上都是精选的满满的干货,至少从我收到的每一期的一周精选看真是如此。但是随着时间的累计,一周精选的总量变得很大,到我写这些话的时候是280期。我就想,可不可以做个分类,让这些有心人分类的有用的资源更加有效率的被运用。
作为一个程序员,尽可能的让机器做事是我们的本能,所以,对于这已经存在280多期(一共有1w多条的精选了)的精选和未来一定会有的更新,我做了如下的工作保证其内容尽量完整以及保持更新:
- 在尝试了好几种方法之后,我决定利用selenium + beautifulsoup做爬虫
- 将所有的爬取下来的标题和url转化为markdown文件
- 利用jieba分词做一个分词,按照频率记录出现频率最高的关键词
- 人工筛选这些关键词,然后人工筛选,按照每个关键词尽量的分类,形成新的markdown分类文件
- 为了更新,我利用了我的树莓派,每隔三天获取最新一期的列表,自动重复上述的一些步骤,只不过目前这个阶段在git push之前我还是得加入一些人工筛选
- c/c++
- Python
- Java
- Go语言
- Rust语言
- 人工智能
- 算法与数据结构
- 面试相关
- 前端
- 微信小程序
- Android
- PDF资料
- 免费资源
- 开源资料
- 爬虫相关
- 游戏开发
- 计算机网络
- 多线程/并发
- 大数据
- 数据库
- 分布式系统
- 容器/虚拟化/k8s
- Restful API
- Linux
- 嵌入式
- 架构
- 设计模式
- 测试相关
- PHP
- 翻译资料
- 演讲实录
持续更新中。。。