数据结构论坛

首页 » 分类 » 分类 » 高频考点专题笔记之大数据专题来啦
TUhjnbcbe - 2024/5/5 14:22:00
北京中科医院是假的吗 http://pf.39.net/bdfyy/jdsb/170125/5212066.html

/用心耕田水到渠成/

高频考点专题笔记田心·专栏

进入「冲刺」阶段,小田心按惯例开启我们的「高频考点专题笔记」专栏。此专栏由去年的「专题重置计划」改进而来,旨在为小伙伴们提供更好的阅读体验。每周四小田心都会以「专题笔记」的形式为大家讲解高频考点,并将持续推送12期。12周后,高频考点知识你将了如指掌。

要注意的是,「专题笔记」专栏是为了让同学们对每个高频考点的知识框架有更清楚的认识,因此,我们会列出知识框架,并对部分较难理解的内容进行简要讲解。如果同学们在阅读时还有不理解的地方,可以参照文末的文献来源,自行查找原文进行精读。

今天,小田心就先为大家带来第五篇笔记——“大数据”专题。

Chapter5.

“大数据”专题

级各大高校真题概览

1.数据素养(清华大学,名词解释,)

2.数据新闻(浙江大学,名词解释,;浙江传媒学院,名词解释,;湖南师范大学,名词解释,)

3.根据材料分析大数据时代隐私保护面临的新媒体及解决办法(浙江传媒学院,材料分析题,,)

4.简述数据新闻的特征(上海大学,简答,)

5.有学者认为数据分析看似客观,但实际上价值判断贯穿了建构到解读的全过程,请谈谈你对数据新闻生产的看法。(安徽大学,论述,)

6.简述大数据时代的传播特征(兰州大学,简答,)

核心知识

本专题知识框架

part.1大数据

一、大数据定义及特征

麦肯锡将大数据(Bigdata)定义为:无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。新闻媒体通过使用一定的运算方法对大数据进行分析,可以深化新闻叙事和对事实作出准确判断,对未来进行预测报道,满足用户的定制信息要求,使得数据可视化和具有交互性。

大数据具有5V的特征,即用Volume、Variety、Value、Velocity、Veracity来概括大数据的特征。

1.数据体量巨大(Volume)

大数据的特征首先就体现为“大”,在先Map3时代,一个小小的MB级别的Map3就可以满足很多人的需求,然而随着时间的推移,存储单位从过去的GB到TB,乃至现在的PB、EB级别。

2.数据类型繁多(Variety)

广泛的数据来源,决定了大数据形式的多样性。任何形式的数据都可以产生作用,目前应用最广泛的就是推荐系统,如淘宝,网易云音乐、今日头条等,这些平台都会通过对用户的日志数据进行分析,从而进一步推荐用户喜欢的东西。日志数据是结构化明显的数据,还有一些数据结构化不明显,例如图片、音频、视频等,这些数据因果关系弱,就需要人工对其进行标注。

3.价值密度低(Value)

这也是大数据的核心特征。现实世界所产生的数据中,有价值的数据所占比例很小。相比于传统的小数据,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。

4.处理速度快(Velocity)

大数据的产生非常迅速,主要通过互联网传输。生活中每个人都离不开互联网,也就是说每天个人每天都在向大数据提供大量的资料。并且这些数据是需要及时处理的,因为花费大量资本去存储作用较小的历史数据是非常不划算的,对于一个平台而言,也许保存的数据只有过去几天或者一个月之内,再远的数据就要及时清理,不然代价太大。基于这种情况,大数据对处理速度有非常严格的要求,服务器中大量的资源都用于处理和计算数据,很多平台都需要做到实时分析。数据无时无刻不在产生,谁的速度更快,谁就有优势。

5.真实度高(Veracity)

数据的准确性和可信赖度高,即数据的质量高。数据本身如果是虚假的,那么它就失去了存在的意义,因为任何通过虚假数据得出的结论都可能是错误的,甚至是相反的。

田心说:上述概念需要记忆,尤其是大数据的五个特征。

二、大数据在新闻领域的应用

1.新闻报道

大数据应用在新闻传播领域最直观的变化就是新闻生产报道的方式发生了变化,可视化新闻、预测性报道等更新了新闻报道的方式。

2.新闻推送

媒体利用大数据技术掌握每位用户的反馈后即可进行点对点的精准推送。如今广告的营销策略就是利用大数据对海量数据进行分析,从而使得广告主可以定向筛选自己的广告投放的对象,针对受众的兴趣进行优化。

3.舆论引导

大数据预测舆情的价值实现,必须建立在对已挖掘出的海量信息,利用数学模型进行科学计算分析的基础之上,其前提是各类相关数据的量化,即一切舆情信息皆可量化。同时,要在

1
查看完整版本: 高频考点专题笔记之大数据专题来啦