目录
01_01.开场
00:07:26
02_01.Python环境搭建(Anaconda方式)
00:13:11
02_02.Python入门简介
00:01:04
02_03.变量类型
00:07:32
02_04.List基础结构
00:10:01
02_05.List索引
00:10:03
02_06.循环结构
00:11:54
02_07.判断结构
00:05:42
02_08.字典结构
00:14:23
02_09.文件处理
00:12:28
02_10.函数基础
00:04:27
03_01.Numy库简介
00:02:34
03_02.Array数组
00:11:24
03_03.Array数组操作
00:14:34
03_04.矩阵基本操作
00:15:17
03_05.矩阵的创建与初始化
00:15:46
03_06.常用函数案例演示
00:22:39
03_07.排序与索引
00:09:12
03_08.习题实例
00:22:06
04_01.Pandas库简介
00:01:11
04_02.数据读取与显示
00:06:19
04_03.数据样本行列选取
00:11:02
04_04.数值计算与排序
00:10:47
04_05.数据预处理与透视表
00:17:30
04_06.自定义函数方法
00:12:03
04_07.核心数据结构Series详解
00:20:06
04_08.数据索引变换
00:08:42
05_01.Matplotlib简介
00:00:46
05_02.画出第一个简易折线图
00:17:06
05_03.打造一个完整的折线图
00:20:19
05_04.条形图实战
00:15:37
05_05.直方图与四分图
00:13:59
05_06.基于真实数据集的可视化分析
00:11:59
05_07.可视化图表细节
00:15:12
06_01.回归问题
00:11:45
06_02.线性回归原理推导
00:13:21
06_03.线性回归问题求解
00:20:18
06_04.手写线性回归
00:08:41
06_05.逻辑回归与梯度下降
00:17:00
06_06.梯度下降实例
00:15:13
06_07.分析汽车油耗效率
00:15:09
06_08.使用scikit-learn库建立回归模型
00:14:03
06_09.使用逻辑回归改进模型效果
00:13:13
07_01.模型效果衡量标准
00:20:09
07_02.ROC指标与测试集的价值
00:14:32
07_03.交叉验证
00:15:16
07_04.多类别问题
00:15:52
08_01.K近邻原理
00:12:34
08_02.K近邻算法代码
00:18:44
08_03.K近邻实例
00:36:37
09_01.决策树原理-熵
00:14:32
09_02.决策树实例
00:17:28
09_03.决策树剪枝策略
00:11:56
09_04.使用ID3算法进行特征选择
00:15:07
09_05.构造决策树
00:09:51
09_06.随机森林模型
00:15:26
09_07.随机森林重要性
00:10:16
10_01.线性支持向量机
00:31:21
10_02.支持向量机对偶问题
00:29:55
10_03.核变换解决低维不可分问题
00:19:12
10_04.soft-margin支持向量机
00:11:01
10_05.应用SMO算法求解支持向量机
00:29:30
11_01.贝叶斯原理
00:14:15
11_02.贝叶斯垃圾邮件分类
00:21:12
11_03.贝叶斯拼写检查器
00:09:20
12_01.神经网络结构分析
00:15:37
12_02.神经网络强大的非线性
00:09:35
12_03.深入神经网络细节
00:21:36
12_04.代码实现简易神经网络
00:12:32
12_05.RNN网络结构
00:09:13
12_06.LSTM
00:10:02
13_01.Adaboot-代码1
00:19:37
13_02.Adaboost-代码2
00:14:11
13_03.Adaboots例子
00:09:10
13_04.adaboost原理
00:18:34
14_01.SVD概念
00:10:09
14_02.SVD推荐系统
00:13:32
15_01.聚类算法原理
00:15:08
15_02.实现k-means算法
00:08:38
16_01.简介
00:07:46
16_02.画图
00:11:41
16_03.操作
00:12:32
16_04.预测
00:10:12
17_01.数据简介及面临的挑战
00:10:56
17_02.数据不平衡问题解决方案
00:13:14
17_03.逻辑回归进行分类预测
00:15:27
17_04.使用阈值来衡量预测标准
00:17:05
17_05.使用数据生成策略
00:11:00
18_01.船员数据分析
00:06:10
18_02.数据预处理
00:13:36
18_03.使用回归算法进行预测
00:14:31
18_04.使用随机森林改进模型
00:12:57
18_05.随机森林特征重要性分析
00:10:40
19_01.数据简介与特征课时化展示
00:11:11
19_02.不同特征的分布规则
00:06:33
19_03.决策树模型参数详解
00:11:08
19_04.决策树中参数的选择
00:09:28
19_05.将建立好决策树可视化展示出来
00:08:47
20_01.级联模型原理
00:05:06
20_02.数据预处理与热度图
00:10:26
20_03.二阶段输入特征制作
00:06:36
20_04.使用级联模型进行预测
00:13:29
21_01.数据简介与特征预处理
00:13:35
21_02.员工不同属性指标对结果的影响
00:15:43
21_03.数据预处理
00:12:04
21_04.构建预测模型
00:10:29
21_05.基于聚类模型的分析
00:05:43
22_01.tensorflow框架的安装
00:07:10
22_02.神经网络模型概述
00:12:53
22_03.使用tensorflow设定基本参数
00:09:52
22_04.卷积神经网络模型
00:10:50
22_05.构建完整的神经网络模型
00:14:32
22_06.训练神经网络模型
00:12:34
23_01.PCA原理简介
00:05:34
23_02.数据预处理
00:08:43
23_03.协方差分析
00:10:27
23_04.使用PCA进行降维
00:07:46
24_01.数据简介与故事背景
00:04:12
24_02.基于词频的特征提取
00:10:25
24_03.改进特征选择方法
00:12:26
25_01.数据清洗
00:12:08
25_02.数据预处理
00:10:13
25_03.盈利方法和模型评估
00:13:26
25_04.预测结果
00:12:47
基于Python数据分析与机器学习案例实战教程
公众号
小程序
课程背景基于数据分析与机器学习领域,使用python作为课程的实战语言,随着大数据与人工智能领域日益火爆,数据分析和机器学习建模成了当下最热门的技术,课程旨在帮助同学们快速掌握python数据分析包以及经典机器学习算法并通过对真实数据集分析进行实战演示。
1.课程研发环境
课程基于windows环境进行讲解与代码演示,需要同学们搭建Python环境,推荐根据课时(使用Anaconda搭建python环境)来进行python和其依赖库的安装。
2.内容简介
课程风格通俗易懂,基于真实数据集案例实战。主体课程分成三个大模块(1)python数据分析,(2)机器学习经典算法原理详解,(3)十大经典案例实战。通过python数据科学库numpy,pandas,matplot结合机器学习库scikit-learn完成一些列的机器学习案例。算法课程注重于原理推导与流程解释,结合实例通俗讲解复杂的机器学习算法,并以实战为主,所有课时都结合代码演示。算法与项目相结合,选择经典kaggle项目,从数据预处理开始一步步代码实战带大家快速入门机器学习。旨在帮助同学们快速上手如何使用python库来完整机器学习案例。选择经典案例基于真实数据集,从数据预处理开始到建立机器学习模型以及效果评估,完整的讲解如何使用python及其常用库进行数据的分析和模型的建立。对于每一个面对的挑战,分析解决问题思路以及如何构造合适的模型并且给出合适评估方法。在每一个案例中,同学们可以快速掌握如何使用pandas进行数据的预处理和分析,使用matplotlib进行可视化的展示以及基于scikit-learn库的机器学习模型的建立。
唐宇迪老师,深度学习领域多年一线实践研究专家,计算机博士。主要研究和从事深度学习领域, 计算机视觉,图像识别。精通机器学习,热爱各种开源技术尤其人工智能方向。多年数据领域 培训经验,主要负责机器学习和深度学习的教学工作,在图像识别领域有着丰富经验,实现过包 括人脸识别,物体识别,关键点检测等多种应用的最新算法。课程风格通俗易懂,乐于钻研, 解开每一个问题,把复杂的问题简单表达呈。 |
Python数据分析与机器学习实战:
第一讲:Python数据分析与机器学习实战课程简介
第二讲:Python快速入门
第三讲:Python科学计算库Numpy
第四讲:Python数据分析处理库Pandas
第五讲:Python可视化库Matplotlib
第六讲:回归算法
第七讲:模型评估
第八讲:K近邻算法
第九讲:决策树与随机森林算法
第十讲:支持向量机
第十一讲:贝叶斯算法
第十二讲:神经网络
第十三讲:Adaboost算法
第十四讲:SVD与推荐
第十五讲:聚类算法
第十六讲:案例实战:使用Python库分析处理Kobe Bryan职业生涯数据
第十七讲:案例实战:信用卡欺诈行为检测
第十八讲:案例实战:泰坦尼克号获救预测
第十九讲:案例实战:鸢尾花数据集分析
第二十讲:案例实战:级联结构的机器学习模型
第二十一讲:案例实战:员工离职预测
第二十二讲:案例实战:使用神经网络进行手写字体识别
第二十三讲:案例实战:主成分分析
第二十四讲:案例实战:基于NLP的股价预测
第二十五讲:案例实战:借贷公司数据分析
目标一. 掌握Python数据分析的4个神器(Numpy,Pandas,Matplotlib,Scikit-learn)
目标二. 机器学习经典算法的原理推导和建模流程
目标三. 真实数据集演示如何对数据进行预处理
目标四. 机器学习算法建模与调参技巧
目标五. 完整演示如何对数据进行分析处理与可视化展示
目标六. 经典的kaggle竞赛项目,挑战极限
亮点一、全程实战,十大真实数据集案例实战
亮点二、通俗易懂,幽默风趣的讲解
亮点三、机器学习算法与实战结合
亮点四、python数据分析必备神器讲解
1.课程针对人群
本课程需要有一些编程经验以及基本的数学基础,针对于对数据领域感兴趣的同学们,帮助大家快速上手使用python进行数据分析,结合机器学习算法展开建模与评估。
2.我该怎么学,如何才能学好这门课程,给些建议。
4.1、时间上的安排建议
本课程共25讲,如果您时间上充分,建议以每天2-3讲的进度往前学习。
4.2、学习要求
如果您没有基础,建议还是中规中矩的按照课程进度一点一点仔细观看学习,并一定要把看完的视频中的代码自己手敲一遍,以加深理解和记忆
如果您有基础,可不必按步就搬进行,可以拿你感兴趣的部分去学习,但一定要注意实践,并学会举一反三
4.3、讲师建议
1.动手实践很重要!最好看完视频之后,抛开视频,独立自己去把上课中的案例分析代码写一遍,看自己是否理解,如何遇到问题可以回过头看再看下视频,如果反复,达到真正理解和熟练掌握的目的。
2.对于机器学习算法,如果对数学公式有些困惑可以先从整个流程的角度去理解
3. 建议一般听视频,一般拿个纸和笔,做一些记录和笔记,这是一种非常好的学习习惯。
4. 最后祝您学有所成
课程应用面非常广,可以就职于以下岗位
1.数据分析师
2.机器学习工程师
3.数据挖掘领域
版权所有 © 2020 上海弘学教育科技有限公司 沪ICP备19002840号-3 网站地图