侵权投诉
订阅
纠错
加入自媒体

大数据行业必须掌握的25个大数据术语

2017-07-12 10:26
龙凰
关注

提到大数据可能有些令人生畏。在了解一定基本概念的基础上,掌握其中一些关键术语也是至关重要的。

本文列出了 25 个必须掌握的大数据术语。

算法(Algorithm)

指用于执行数据分析的数学公式或统计过程。那么算法与大数据有什么关系呢?虽然算法是一个通用术语,但大数据分析使得这个词变得更具时代性,更受欢迎。

分析(Analytics)

你的信用卡公司会将附有你全年交易情况的年终报表寄给你。如果具体看在食物,衣服,娱乐等方面花了多少钱呢?那么你就在进行“分析”。你正在从原始数据中获得一些见解,这可以帮助你决定来年的支出。

如果你对朋友、网络或者自己的公司发的推文以及 facebook 帖子进行同样的操作,那我们现在就涉及的就是大数据分析了。它是通过使用大量数据进行推论并得出结论。共有三种不同类型的分析。

1. 描述性分析(Descriptive Analytics)

如果你告诉我,去年你的信用卡消费中 25% 用于食物,35% 用于服装,20% 用于娱乐活动,其他的用于杂物,这就是描述性的分析。当然,你也可以进行更详细的了解。

2. 预测分析(Predictive Analytics)

如果你分析了过去5年的信用卡记录,发现当中有一定的一致性,那么你可以较有把握地预测,明年的情况将与过去几年类似。值得注意的是,这并不是“预测未来”,而是“预测事情发生的可能性”。在大数据预测分析中,数据科学家会使用数据挖掘,机器学习和高级统计过程等先进技术,进行天气,经济等方面的预测。

3.规范分析(Prescriptive Analytics)

还是用信用卡的例子,你可能会想知道哪些消费目标(例如食品、娱乐、服装等)会对你的整体消费产生巨大的影响。规范分析通过包括“行为”(即减少购买食物、衣服或娱乐)和对结果进行分析,从而预测规范相应目标,从而减少你的总开销。将此扩展到大数据,你可以想象管理人员如何通过研究各种行为影响,从而做出数据驱动的决策。

批量处理(Batch processing)

尽管从大型计算机时代开始,批量处理就已经出现了。由于处理大型数据集,批量处理对大数据具有额外的意义。批量数据处理是处理一段时间内收集的大量数据的有效方式。稍后我将介绍的 Hadoop 就是专注于批量数据处理。

大数据行业必须掌握的25个大数据术语

1  2  3  4  下一页>  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

物联网 猎头职位 更多
文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号