文章预览
来源:滴答数据 全文共 10519 个字,建议阅读 12 分钟 1. 基础理论知识 1.1. 数据 数据(Data) ,或称数据资源,是指所有能输入到计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称,是组成信息系统的最基本要素。 1.2. 大数据 大数据(Big Data) 指一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。 大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。大数据技术的不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业
………………………………