机器学习初学者最常见的5个误区
作者|ZOMI酱
来源|知乎
避开机器学习初学者最常见的5个错误
在这篇文章中,我们将看到学习Machine Learning时最常出现的 5 大错误。我相信每个人都可以入门的时候就很好地使用机器学习算法。希望这篇文章能够帮助大家避开或解决大家学习和实践中的一些错误。尽量避免跳坑。
1、 不要从理论开始入手
传统的机器学习教学是这样的:
努力掌握数学背景知识努力学习机器学习理论努力从头开始实现算法自我感觉不错(一些神奇事情发生)最后开始使用机器学习(我们的终极目标)这种方法非常慢,而且很困难。这是为想要拓展该领域前沿的学者设计的,并不适合只是想要得到结果的实践者。
Trap
如果你在想以下问题,你就掉入了这个坑了:
我需要先完成线性代数的课程;我需要回去先拿个博士学位;我必须先读完教科书。Way out
数学或深奥的算法理论学习能够怎样帮助你实现目标?你多半会停下来。会失败。不会离你的目标更进一步。解决的方法是鼓捣模型。
如果机器学习对市场的有价值的贡献是准确的预测,那么你就学习对问题进行建模并得出准确的预测吧。就从现在开始!
然后努力掌握它,做到非常擅长。
如果你需要,就阅读、窃取、收割别人的理论,但你只需要你的目标所需要的——只要它能帮助你实现更好的价值。
2、不要学习所有的机器学习算法
机器学习是一个非常大的研究领域。它是指计算机学习过程的自动化,与人工智能有很大的交叠。从深奥的学习理论到机器人技术——这个领域的范围非常广。你不可能将它们整个拿下。
Trap
如果你在想下面这些,你就落套了:
我需要学习一个新网站上提到的每一种新技术;首先我需要学习计算机视觉、自然语言处理、语音等等;我需要了解每项技术的每个方面。Way out
选择一个小方向并且保持专注,然后进一步收窄。机器学习中最有价值的领域是预测建模——创建数据的模型以做出预测。
接下来,专注于一种与你最相关或你最感兴趣的预测建模,然后保持专注。也许你是根据技术选择的(比如深度学习),也许你是根据问题类型选择的(比如推荐系统);也许你不确定,只是随便选了一个。不管怎样,努力掌握它或至少做到精通。
接下来才开始进入下一个领域。
3、不要在算法上花费太多时间
机器学习实际上就是算法,而算法实在太多。每一个算法都是一个复杂的系统而且拥有自己的小研究领域和生态系统。可以选择将自己迷失在算法之中,这么做的人被称为学者。
Trap
如果你在说这些,你就已经在陷阱里了:
在我使用它之前我需要知道它的工作原理;我首先需要深入理解超参数;在进行微调时,我需要解释其因果关系。Way out
算法并非结果,它们只是实现结果的方法。事实上,机器学习算法是一种商品。
多实践!不断地换不同的算法,在问题上实验各种各样的算法。对其中一些进行调节,但不要把自己困在这一步。
使用一个系统过程(systematic process)。设计调试实验并将它们的执行和分析自动化。
机器学习的关键是好好利用算法,而应用算法不只是研究算法本身。
我们的目标应该是为每一个项目得出一个结果——一组预测或一个能给出预测的模型。
4、不要从头开始实现所有东西
从头开始实现算法能够教会你很多东西。但有时候需要实现一项技术,因为没有合适的或可用的实现。但是,通常来说,你不一定要也不应该这么自己实现算法。
这样做就跳坑里去了,大部分时候事实是这样的:自己实现的结果很糟糕。
有各种漏洞速度很慢吃内存无法很好地解决边缘情况甚至可能是错的Trap
如果你在做下面这些事,你已经掉入陷阱了:
你在编写载入 CSV 文件的代码(搞什么鬼!?用panda!);你在编写线性回归这种标准算法的代码;在编写用于交叉验证或超参数调整的代码;Way out
别折腾了!
使用一个已被成千上万的开发者所使用过的能够处理所有边缘情况的库,众所周知它是正确的;使用一个经过了高度优化的库,它能充分利用你的硬件的每一个计算周期和你的内存的每一个字节;为你的项目使用一个图形用户界面,从而完全避开代码;每次都自己实现你想要使用的算法是非常缓慢的入门机器学习的方式。如果你是为了学习而实现它们,那么就要对自己诚实:你的实现还不够好,你不能通过这样应用机器学习来带来价值。
5、不要总改变使用的工具
目前有很多的很棒的机器学习工具。事实上,很棒的工具加上数据的可用性和更快的硬件使得机器学习的复兴成为了可能。但你可能陷入这样一个坑中:跳入每个你偶然发现的新工具中。
Trap
如果发现自己符合以下三点那你就陷入了该陷阱中:
使用每个你听到过的新工具发现自己每周或每个月都学习一项新工具或语言学习一个库时半途而废并转向新的库
Way out
有规律的学习和使用新工具,在解决实际问题时融合不同的工具。选择一个主要的大型平台并坚持使用它,那在解决机器学习问题时会更加高效,至少也要足够精通该平台。
这里我推荐 3 个的平台:Weka; Python; R
总结
不要从理论开始入手
不要学习所有的机器学习
不要在算法上花费太多时间不要从头开始实现所有东西不要总改变使用的工具本文不太赞成自己真真正正地从头到尾学习去自己实现一个算法,例如向后传播BP算法,也不赞成从数学底层地角度去理解为什么梯度下降有效、如何操作才能减少梯度发散的等高深莫测的数学问题。对于一个工程上的问题,我们需要的是解决问题、达到目标,实现价值,这是针对工程应用的。
对于个人的能力的提升,是需要去不断地学习、应用、实践再回归学习的一个epoch循环。如果我们不理解推荐系统的协同过滤算法,跟吃瓜的群众一样:“根据历史的数据去匹配一个跟我相似的用户”这样的说法,那么就太吃瓜了。
ABOUT 关于我们 深蓝学院是专注于人工智能的在线教育平台,已有数万名伙伴在深蓝学院平台学习,很多都来自于国内外知名院校,比如清华、北大等。
大家都在看
-
机器狼:巷战利器背后的科技突破与未来畅想】 前两天 【机器狼:巷战利器背后的科技突破与未来畅想】前两天,我在珠海航展现场,人群中偶遇一位老工程师。聊天间得知他已在国防工业战线摸爬滚打三十余载。说起这次展会上的”明星”机器狼,老工程师的眼里闪着光:”的无 ... 机械之最11-21
-
什么最可怕,未来战场机器狼群最可怕!#军事科技 什么最可怕?狼群最可怕。我国自主研究的机器狼来了,直接亮相珠海航展,还是群狼作战。很多人会问未来战争是什么样的?现在可以告诉你是无人装备。我国自主研究的机器狼作战小队现在有 4 个作战平台,它们之间可是 ... 机械之最11-17
-
碾压美军!中国机器狼群亮相珠海航展,武德充沛太残暴! 真的太酷啦!机器狗已经out了,解放军已经用上了“机器狼”,这把直接开启未来无人战争高端局。由中国兵器装备集团研发的机器狼群无人作战系统,首度在珠海航展动态展示,并迅速成为现场的焦点。岛内专家见到后直接 ... 机械之最11-16
-
2000年前人类的第一台计算机:安提基特拉机械之谜 全全探索局。说说历史上最大的谜团——人类发现了本不应该存在的古老计算机!1. 1900 年海绵潜水员在希腊小岛安提凯西拉附近发现了一艘沉船,他在海底发现了一只突出的青铜手,虽严重腐蚀但仍可辨认,他将发现报告给 ... 机械之最11-14
-
机械狼带给咱们的冲击感还没有消失呢 机械狼带给咱们的冲击感还没有消失呢,机械虎就横空出世了!这就像是在说,这台机器可不是你的玩具,它可是一个凶猛的野兽!这不禁让人联想起一些有趣的民间调侃,更让人深思这背后究竟蕴藏着怎样的军事理念?这些“ ... 机械之最11-14
-
当今最复杂的椭圆曲线找到了!29个独立有理点打破18年记录 选自quantamagazine作者:Joseph Howlett机器之心编译机器之心编辑部又是计算机帮了忙。对现代密码学稍有了解的人都必定听过椭圆曲线的赫赫威名,但椭圆曲线本身依然还存在很多悬而未决的问题。今天,量子杂志作者 J ... 机械之最11-12
-
实战版“汪汪队”来了 机器狗将首次亮相中国航展! 总台中国之声记者从兵器工业集团了解到,四条机器狗分队将参加地面装备动态演示环节,四足机器人具备综合打击、侦察探测、运输包装、操作处置等功能,将展示城市作战机动能力。启动、行走、爬坡、下楼……昨天在珠海 ... 机械之最11-09
-
机械硬盘这种“老古董”,怎么在大模型时代还供不应求了? 大家是不是觉得,搞人工智能就得买显卡、买网卡?其实啊,还有个被大家忽略的"主角"——存储设备,特别是咱们常说的硬盘。这不,最近硬盘价格蹭蹭往上涨,搞得大家直呼吃不消。你说硬盘这玩意儿,都快70岁"高龄" ... 机械之最11-08
-
每日数码科普之六十四:键盘什么轴好用?机械键盘轴体选择指南 机械键盘因其独特的手感、耐用性和可定制性,近年来越来越受欢迎。而机械键盘的核心在于“轴体”,它决定了键盘的手感、声音以及使用体验。不同的轴体适合不同的使用场景,因此选择一个适合自己的键盘轴体尤为重要。 ... 机械之最11-07
-
为神舟飞船造一顶“大伞”——走进中国航天科技集团五院508所航天器回收着陆团队 图①:11月4日,神舟十八号载人飞船返回舱在东风着陆场着陆。新华社记者 李志鹏摄图②:神舟飞船回收着陆分系统1200平方米主伞。图③:工作人员为神舟飞船包伞。(除署名外,照片由采访对象提供)11月4日凌晨1时24分 ... 机械之最11-07
相关文章
- 当今最复杂的椭圆曲线找到了!29个独立有理点打破18年记录
- 大国重器背后的“90后” 汪泽:精密机械的操控者 于毫厘之间细雕琢
- 合作共赢创未来——写在第七届中国国际进口博览会开幕之际
- 闫妮机械姬:科技与魅力交织的科幻新象
- 倒背191步枪,解放军公布一窝6只“机器狼”,战斗力到底有多强?
- 实战版“汪汪队”来了 机器狗将首次亮相中国航展!
- 机械行业的发展现状与未来趋势分析
- 机械硬盘这种“老古董”,怎么在大模型时代还供不应求了?
- 每日数码科普之六十四:键盘什么轴好用?机械键盘轴体选择指南
- 娜然仿生机械姬
- 为神舟飞船造一顶“大伞”——走进中国航天科技集团五院508所航天器回收着陆团队
- 机械行业发展前景如何?全面解析与展望
- 机械哪个方向好?
- 我国古代的计时仪之最
- 新车停在机械车位,最担心的事情发生了……
- 给敌人递刀子?中企帮印度建最大最强炼铁高炉,将损害长远利益?
- 美国对中国大学机械工程排名!网友:如梦如幻
- 每日数码科普之五十一:键盘的进化与现代趋势
- 2024年双十一机械键盘入门及选购推荐(含无线键盘、游戏键盘)
- 山东一只“机器狗”火遍全网!确实厉害→
热门阅读
-
天下第一暗器暴雨梨花针,传说中的唐门暗器做出来了 07-13
-
世界十大大型船舶排名,第一能承重六十万吨! 07-13