机器学习的简介
作者:刘晓龙
来源:《现代经济信息》2017年第13期
摘要:机器学习通过以往数据,运用相关算法,得出可以预测的模型,计算出对应结果。它基于电脑科学、统计学和数学的交互,处在了人工智能与数据科学的核心地位。由于新的机器学习算法和理论的不断出现和发展,以及数据可用性和CPU处理速度的飞速提高,使得机器学习得到了迅猛的发展。机器学习对于当代企业经营是非常重要的,它关系到企业的各行各业。
关键词:机器学习;数据挖掘;算法
中图分类号:TP182 文献识别码:A 文章编号:1001-828X(2017)013-0-01
一、机器学习的应用
机器学习的方法可以应用到许多领域中,包括研究,科技、商业领域等,这些领域的机器学习运用越来越成熟和高效。研究中运用机器学习发现人类不容易发现的规律;科技中运用机器学习提高了科技解决实际生活的能力;商业领域运用机器学习更好的挖掘客户和满足客户。除此之外,机器学习也为其他领域带来不小的突破。机器学习集中解决两个问题:其一,如何让电脑系统利用经验数据提高我们工作效率。其二,如何有效率地
龙源期刊网 http://www.qikan.com.cn
提高机器学习算法的准确率。机器学习对于解决科学和工程中的问题和在各种生活领域的实践问题是重要的。
二、机器学习的发展
过去的二十年机器学习的发展取得了极大的进步。走出了实验室,走向了包括商业领域的广泛运用。在人工智能(AI)中,机器学习被作为一种重要的方法应用到电脑可视化,语音识别,自然语言处理,机器人控制和其他应用中。许多人工智能的开发者开始认识到,对于许多应用场景,训练一个系统去出示输入输出的结果,比人工分析内在机理更容易。机器学习的准确性在很多应用中比人类自己的分析结果要高得多。机器学习的影响已经广泛传播到运用计算机和数据库的行业里,例如,顾客服务,医疗诊断系统,资源分配。在以经验为主的学科,像历史学,医学到人文学科,机器学习也有其用武之地。学习问题可能被定义为当执行某些任务时,通过不断的训练提高解决能力[1]。例如,在学习侦察信用卡诈骗时,我们需要给所有的信用卡交易贴上一个是不是诈骗的标签。测量表现将会由于这个诈骗鉴别分类器被提高,而它的训练是由以前的一系列诈骗案例所构成。
三、机器学习的模型与算法
在不同的现实问题中机器学习算法也依据数据与模型的不同有了很大的差别。概念上机器学习算法被视为在一堆候选算法中选取一种对原始表现拟合最好的程序。机器学习算法的结论好坏差别非常大,很大程度上因为所用到的数据和模型的差别。这里的数据集分为训练集和测试集。它努力从不同的程序中收集最好的算法。许多方法集中在函数取值问题,它们集中研究函数。给定一个输入,就有一个输出。学习问题就是如何找出一个
龙源期刊网 http://www.qikan.com.cn
更精确的函数。通常函数以参数化的形式呈现,而在另一些情况下,函数具体形式不太清楚,它是由一个搜索过程、一个因子分解、一个极大化过程、一个仿真过程等构成。即使函数形式不太清楚,其一般都依赖于参数与自由度,训练找到这些参数的过程往往使得表现测度最优化[2]。
下面是机器学习主流的各种算法, 算法是机器学习的核心,要了解不同算法的难点所在,更要了解不同算法的优势以及应用场合。算法离不开对于数学基础,也与统计学的建模有关系;由于算法的计算难度比较大,更与计算机的计算性能有关,所以算法研究显得非常重要但也比较困难。算法可以说是机器学习的内核,一种好算法的提出,对于机器学习是划时代的贡献。
四、机器学习的商业重要性
这个时代是一个互联网信息爆炸的时代,随着网络的迅速发展和普及,使得信息量极大丰富,由于我们获得海量数据的便捷性,我们可以利用的数据进行分析变得越来越容易,收集的信息门类五花八门。对于各个行业,还能收集与行业、竞争对手、客户和市场有关的信息,能够很好的分析和处理那些对企业有重大价值的信息成为未来企业脱颖而出的关键。根据分析结果找出企业面临的问题和漏洞,更好的管理企业,让企业取得生存发展空间。
可见数据挖掘对于企业的重要性,未来从事机器学习相关岗位的人员将会越来越多,数据挖据不仅在一些大的公司有重要的作用,在小企业里也是不可或缺的。数据在公司经营中提供了非常有价值的商业信息,数据中蕴含了巨大的商业潜力。数据像一个盒
龙源期刊网 http://www.qikan.com.cn
子。不是我们随便看看的就能得到指导性的意见。大数据时代的到来尤其为管理者既带来了机会,又增加了困难。因为他们要面对的是更加庞杂的数据系统,从中找出他们需要的具体规律,这本身不是一件容易的事。所以以后机器学习会越来越走向我们的企业,为企业带来价值。
参考文献:
[1]M.I.Jordan1 and T.M.Mitchell2.MachineL earning: Treads, perspective, prospects ,science,2015.
[2]Hanjw,MiehelineK.数据挖掘概念与技术[M].范明,孟晓峰,译.北京:机械工业出版社,2001.
作者简介:刘晓龙(1992-),男,学历:硕士,单位:天津财经大学,主要从事数据挖掘与经济统计研究。
因篇幅问题不能全部显示,请点此查看更多更全内容