> Photo by Marius Masalar on Unsplash
数据科学是世界上增长最快的行业之一。
从业务的角度来看,以及寻求成为世界上薪水最高的职业的专业人员,数据科学和人工智能正在成为生活的基本组成部分。
2020年机器学习的定义
重要的是要强调机器学习是一个已经存在了几十年的概念,这就是为什么这里解释的定义就是我们今天在2020年所知道的。
机器学习是人工智能的一个分支,它寻求电子实体进行信息演绎,推理和决策的过程基于同一实体内生成的学习过程,而无需明确的人 输入或确定它。
为此,它使用了多种工具,包括算法,编程语言,统计信息,概率和最近的神经网络。
就机器学习而言,什么是模型?
> Photo by Chris Ried on Unsplash
相当多的数据组可以包含可以从该组数据中提取的大量信息。
如今生成的数据量远远超过了人类拥有的能力,甚至超出了相对自动化的方法来分析数据的能力。即使如今可以完成的手动工作的局限性在于,出现的问题更加复杂。
机器学习使用算法或模型来查找数据中的模式,使用这些模式从该信息中学习的过程称为模型训练。
训练和测试模型后,只要模型相似,就可以根据模型所使用的不同信息进行预测或推论。
机器学习的类型
机器学习有两个主要目标,一个目标是对元素进行适当分类,第二个目标是能够发出有关发生不同可能性的可能性的信息。 (回归)
为此,有四个基本过程:
监督机器学习
> Photo by Mika Baumeister on Unsplash
这种类型的机器学习基于对一组信息进行适当分类,以便能够训练模型和对其进行测试。
这是当前最常见的机器学习类型。
理解此模型的关键是数据具有已知且正确建立的输出,通常必须由人进行分类。
这使模型能够知道可以确定输出的元素。
一个示例是具有一组动物图像,并具有知道猫,狗,鸟等的每种动物或股票市场的未来价格的区别。
无监督机器学习
与监督模型不同,在这种情况下,信息没有分类,没有定义信息最终输出的标签。
在这种情况下,目标是能够找到最合适的模型,以有效地对标识每组信息的元素进行分组。
这种类型的技术通常对分类问题很有用。
这种技术的一个例子是在网站或计算机安全性上对购买者的类型进行分组。
强化学习
> Photo by Science in HD on Unsplash
强化学习主要基于人类及其学习过程中的观察。
它基于对明智选择的奖励或奖励。
实体学会根据获得的奖励数量来达成最佳目标,从而做出最佳决策。
最近的例子是击败国际象棋冠军Go和StarCraft2的人工智能实体。
深度学习
> Photo by Daniel ?berg on Unsplash
它是机器学习中的专业。
他们指的是一组以某种方式试图模仿人脑如何计算信息的技术和算法。
值得一提的是,过程的相似性还很远,但是,就人工智能而言,它已被证明非常有效,因为使用深度神经网络可以进行推理和推理的能力要大得多。
这意味着要执行此类处理,识别的信息量以及处理能力必须非常大。
例如自然语言分析和面部图像识别。
训练和使用模型的通用过程(一般)
· 数据准备
· 模型的构建或现有模型的获取。
· 模型训练。
· 在步骤1,2和3中重复该过程,直到获得所需的结果为止。
· 将模型投入生产。
· 使用模型。
机器学习中常用的框架
· TensorFlow
· PyTorch
· Keras
模型库
由于在时间,硬件和受过培训的专业人员方面,培训可能是一个非常昂贵的过程,因此可以从一些存储库中获取已经针对特定目标进行过培训的模型。
机器学习框架通常都拥有这些存储库,也称为Model Zoos。
(本文翻译自Carlos Villegas的文章《In 2020: What is Machine Learning?》,参考:https://medium.com/dataseries/in-2020-what-is-machine-learning-127c69f97397)
声明:以上内容来源于网络,如有侵权请联系我们(123@shiyan.com)删除! |