数据科学机器学习-通过真实的心脏病发作分析项目提高您的机器学习和统计技能

MP4 |视频:h264,1280×720 |音频:AAC,44.1 KHz,2声道
语言:英语+中英文字幕(云桥网络 机译) |时长:53节课(7小时23分钟)|大小解压后:2.29 GB


你会学到什么
机器学习描述了使用基于真实世界数据训练的模型进行预测的系统。
机器学习不仅对预测短信或智能手机语音识别有用。
数据科学使用算法来理解原始数据。数据科学和传统数据分析的主要区别在于它侧重于预测。
数据科学包括准备、分析和处理数据。它来自许多科学领域,并且作为一门科学,它通过创造新的算法而进步
数据科学家使用机器学习来发现大量原始数据中的隐藏模式,以揭示实际问题。
Machine Learning Project: Heart Attack Prediction Analysis
项目的第一步
项目中使用的笔记本设计
检查项目主题
识别数据集中的变量
必需的Python库
加载数据集
对数据集的初步分析
检查缺失值
检查唯一值
分隔变量(数字或分类)
检查变量的统计
数字变量(用分布图分析)
类别变量(用饼图分析)
根据分析结果检查缺失数据
数字变量–目标变量(使用FacetGrid进行分析)
类别变量–目标变量(计数图分析)
检查数值变量之间的关系(用配对图分析)
使用新可视化的鲁棒缩放器方法进行特征缩放
用Melt()函数创建一个新的数据帧
数值分类变量(用群体图分析)
数值分类变量(用箱线图分析)
变量之间的关系(热图分析)
删除相关性低的列
可视化离群值
处理异常值
确定数值变量的分布
不对称数据的变换运算
对分类变量应用一种热编码方法
用于机器学习算法的鲁棒定标器方法的特征定标
将数据分为测试集和训练集
逻辑回归
逻辑回归算法的交叉验证
逻辑回归算法的Roc曲线和曲线下面积(AUC)
逻辑回归算法的超参数优化
决策树算法
支持向量机算法
随机森林算法
随机森林算法的超参数优化
项目总结和分享


云桥网络 为三维动画制作,游戏开发员、影视特效师等CG艺术家提供视频教程素材资源!