2.海绵模式
4.3 选择一个有趣的项目或领域
Caret 为 R 语言中的模型包提供一个统一的界面。它还包括了预处理、数据拆分、模型评估的功能,使其成为一个完整的端到端解决方案。
步骤 3:有目的实践
统计学、编程和数学(也可以不需要编程)
Kaggle
在这之前你也许已经学习过机器学习了,但从我和朋友们的经验来看,往往会被各种神秘的符号、公式、大量的教科书和论文整的晕头转向,然后再也不想碰这恼人的玩意了。
A:注重大局,总是问为什么
你可以先看看这些教程,给你的机器学习道路打下知识基础。
1.实践完整的机器学习流程:包括数据收集、清洗、预处理,建立模型,调整参数和模型评估。
维基百科有很多好资源,它有很多常见算法的伪代码。
2.在真实的数据集中练习,逐渐建立哪种模型适合哪种挑战的直觉。
4.机器学习项目
你怎么知道模型是否出现“过拟合”?
深度参与到感兴趣的项目和领域中
恭喜你到达了自学指南的终点
你需要进行降维操作吗?你可以使用什么方法?
这里有一个好消息,如果你已经遵循并完成了所有任务,那么你在应用机器学习上将会比 90% 自称是数据科学家的人更好。
Scikit-learn 和 Sklearn 是通用机器学习中 Python 的黄金标准库,它具有常规算法的实现。
https://elitedatascience.com/learn-python-for-data-science
Elements of Statistical Learning
你可以如何拆分数据集?
老实说这是机器学习最好的部分了。这是一个强大的工具,而一旦你开始理解,很多想法都会主动找上门。
C:继续前进,不要气馁
这是一个合理的问题!
好了,现在到了真正有趣的部分了。到目前为止,我们已经涵盖了前提条件、基本理论和有目的实践。现在我们准备好进入更大的项目。
然而,如果你想把机器学习更灵活的应用于日常工作,学习一些基础理论还是很有好处的,而且你并不需要完全弄懂。下面我们会剧透学习机器学习理论的 5 个理由。
从简单开始,在尝试编写随机森林前,先执行一个决策树。
在进行机器学习工程的时候,想想以下问题:
任务:从以下选项中选择 5 到 10 个数据集。我们建议从 UCI 的机器学习库开始,例如你可以选择 3 个数据集,分别用于回归、分类和聚类。
D:视频比教科书更有效
免责声明:凡本网注明 “来源:XXX(非中国房产新闻网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。