资料汇总
Published:
硕士在读期间收集的ML、DL、coding(python、c++、CUDA)、书单、github库等资料。
ML&DL
机器学习与深度学习基础
标题(内容) | links | 备注 |
---|---|---|
吴恩达course | 视频 ; 笔记 | |
台大李宏毅2016 | link | 仅集成学习部分 |
台大李宏毅《机器学习》 | 2021视频; Learning Machine_handbook | |
cs229 | 视频;官网;课程总结 | |
林轩田-机器学习基石 | 课程; 教材分章解析 | |
《机器学习》周志华 | 西瓜书; 南瓜书 | 南瓜书_github |
《统计学习方法》 | book | |
算法理论基础知识应知应会 | github |
深度学习
<深度学习>深度学习> | <花书 book="">花书> | book |
---|---|---|
《神经网络与深度学习》邱锡鹏 | 课程主页 ;上手指南 | |
《动手学深度学习》 | 课程主页;视频;中文教材V2;API | 讨论 |
计算机视觉 | cs231n | 视频课程 ;课程主页;Python Numpy 教程(使用 Jupyter 和 Colab); |
深度学习500问 | github-page | 本书内容取材于编者在日常学习过程中总结的知识点及各大公司常见的笔试、面试题。本书可为高等院校计算机科学、信息科学、人工智能、控制科学与工程、电子科学与技术等领域的研究及教学人员提供参考,也可为相关专业本科生及研究生提供思考方向,还可为深度学习及计算机视觉领域的初、中级研究人员和工程技术人员提供参考,尤其适合需要查漏补缺的应聘者及提供相关岗位的面试官阅读。 |
强化学习
【王树森】深度强化学习(DRL); github | |
---|---|
深度强化学习(董豪 丁子涵) | book |
深度强化学习(王树森张志华著) | book |
编程
Links:
- CS自学指南
- 菜鸟教程 - 学的不仅是技术,更是梦想!
- PY4E - 适合所有人的Python
- Devhints -开发手册(code)
- Road 2 Coding
- 人工智能专家路线图
- 博客- 深度学习
- 微软亚洲研究院
实用技巧:
- VScode 配合git 实现代码管理: vscode操作git简明教程
basics
主题 | 标题(内容) | links | 备注 |
---|---|---|---|
基础技能 | 计算机教育中缺失的一课 The Missing Semester of Your CS Education 中文版 | https://missing-semester-cn.github.io/ | github |
VIM | Learn-Vim(the Smart Way) 中文翻译 | https://github.com/wsdjeg/Learn-Vim_zh_cn | |
A Byte of Vim | https://github.com/swaroopch/byte-of-vim | 有PDF | |
Mermaid | 是一个基于 Javascript 的图表绘制工具,通过解析类 Markdown 的文本语法来实现图表的创建和动态修改。Mermaid 诞生的主要目的是让文档的更新能够及时跟上开发进度。 | https://github.com/mermaid-js/mermaid/blob/develop/README.zh-CN.md |
pytorch 深度学习框架
标题(内容) | links | 备注 |
---|---|---|
python机器学习基础教程 | <O’REILLY系列BOOKS> | book |
20天吃掉pytorch; | ||
pytorch60分钟入门教程; | ||
PyTorch 零基础入门 GAN 模型之基础篇; | ||
<Python深度学习入门:从零构建CNN和RNN> | book | |
讨论 | http://discuss.pytorch.org/ | |
PyTorch 源码解读系列 | OpenMMLab:PyTorch 源码解读系列 | |
微软教程 | https://learn.microsoft.com/en-us/training/paths/pytorch-fundamentals/ | |
Get SH*T Done with PyTorch 基础教程 | https://github.com/curiousily/Getting-Things-Done-with-Pytorch | |
MMdetection | 官方教程 | |
同济子豪_教程 | ||
[模型pipeline]整体构建流程(一); [三个层级的抽象]整体构建流程(二) | ||
[配置])RetinaNet 及配置详解 | Mask R-CNN | |
CNN可视化 | Netron |
CUDA
标题(内容) | links | 备注 |
---|---|---|
CUDA编程入门极简教程 | ||
英伟达官方的CUDA编程教程 | NVIDIA CUDA C++ Programming Guide | |
侧重点在实践方面 | CUDA C++ Best Practices Guide | 英伟达官方的CUDA编程教程,比如如何编程才能最大化利用GPU特性提升性能 |
Professional CUDA C Programming 《CUDA C编程权威指南》 | book | |
numba | https://github.com/ContinuumIO/gtc2017-numba | |
cuda python | https://nvidia.github.io/cuda-python/ | |
blogs | 谭升的博客; 对应github | |
CUDA编程入门极简教程 | ||
《CUDA C Programming Guide》(《CUDA C 编程指南》)导读 | 这是NVIDIA CUDA C++ Programming Guide和《CUDA C编程权威指南》两者的中文解读 | |
CUDA编程入门系列 | ||
CUDA编程系列 |
论文相关
主题 | 内容 | links | 备注 |
---|---|---|---|
深度学习论文精读 | 李沐 | https://github.com/mli/paper-reading | |
GJS | attention is all you need Zero-shot learning contrastive learning Gan | code | |
综述指南 | 文献笔记法(Literature Notes) | 知乎 | |
计算机视觉的高效阅读英文文献方法总结 | 知乎 | ||
How to write a survey paper?如何写一篇survey paper? | AlexanderChen的文章 | ||
How to write a review paper | PDF How to write a review paper.pdf | ||
How to Write a Good Survey | https://assessment.ucmerced.edu/node/111 |
书单
类别 | 备注 | |
---|---|---|
python | <编写高质量代码:改善Python程序的91个建议> | 14年出版 |
c++ | C++ Primer中文版(第5版)》 | |
《Essential C++中文版》 | ||
《高质量程序设计指南》 | ||
《C++ Primer Plus 第6版中文版》 | ||
《easy c++》 | [日] | |
数学 | Choquet-Bruhat Y., DeWitt-Morette C., Dillard-Bleick M. Analysis, manifolds and physics, vol.1. Basics (2ed., Elsevier, 1982)(ISBN 0444860177) |
数据集 : opendatalab ; kaggle ;
name | 占用空间(train/val) | 数量/类别 | 尺寸 | 备注 | |
---|---|---|---|---|---|
ImageNet | 137GB+13GB | 训练集:1,281,167张图片验证集:50,000张图片测试集:100,000张图片 | 224$\times$224 | https://github.com/pytorch/examples/tree/main/imagenet | |
cifar10 | 163 MB | 训练集:50,000张图片+标签 验证集:10,000张图片+标签 | 32$\times$32 | 每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像 10 个类别的RGB 彩色图片:飞机( airplane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。 | |
cifar100 | 161 MB | 训练集:50,000张图片+标签 验证集:10,000张图片+标签 | 32$\times$32 | 它有 100 个类,每个类包含 600 张图像。每个类有 500 个训练图像和 100 个测试图像。CIFAR-100 中的 100 个类分为 20 个超类。每个图像都带有一个“精细”标签(它所属的类)和一个“粗略”标签(它所属的超类) | |
coco | 25 GB(压缩) | 330K图像、80个对象类别、每幅图像有5个标签、25万个关键点。1.5M物体 | 目标检测 Object segmentation Recognition in context Superpixel stuff segmentation 91 stuff categories | 每一行代表一个物体,图片文件名,物体类别,边缘框 | |
Fashion-MNIST | 81MB | 训练集有 60,000 张图像,测试集有 10,000 张图像 | 28$\times$28 | 10 个类别的 70,000 个时尚产品 | |
IP102 | 3.8GB | classification</br>/ detection | IP102 是一个用于目标分类与检测任务的农作物病虫害数据集。 102指102个虫害类别。 它包含了水稻、玉米、小麦、甜菜、苜蓿、葡萄、柑橘 、芒果共8种作物的==75000==多幅图像,这些图像呈现出自然的长尾分布(long-tailed distribution)。此外,为大约==19000==(18983)幅图像添加了用于对象检测的边界框。 | ||
Imagenette | 几百MB | 224x224 | 这是一个 ImageNet 数据集的子集,其中包含 10 个类别,每个类别包含超过 500 个图像。这个数据集较小,但具有较高的分辨率(通常为 像素)。 | ||
Imagewoof | 224x224 | 这也是一个 ImageNet 数据集的子集,其中包含 10 个类别,每个类别包含超过 500 个图像。这个数据集较小,但具有较高的分辨率 |
有趣的链接
主题 | 内容 | links | 备注 |
---|---|---|---|
DIY | 本指南介绍了从头开始构建您自己的 CNC 机床的所有步骤 | https://github.com/maxvfischer/DIY-CNC-machine | |
GitHubDaily | https://github.com/GitHubDaily/GitHubDaily | ||
Zotero 插件下载 | https://zotero-chinese.gitee.io/zotero-plugins/#/ | ||
english-level-up-tips | https://babyyoung.gitbook.io/english-level-up-tips/ |
win10_软件
- Git desktop
- vscode
- pycharm
- winScp
- zotero + 插件
- clash
obsidian- todesk
- termius
- picGo
- 欧陆词典 + 自定义字典
- acrobat
计算机学报 电子学报 电子与信息学报 计算机工程 计算机科学 自动化学报