001
论
欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟欟
坛
●
曾忠禄
(
澳门理工学院
,
澳门
)
大数据分析
:
方向
、
方法与工具
摘
要
:
[
目的
/
意义
]
大数据分析正成为学术界的热门课题
。
但现有的研究主要集中在大数据的意义和现象上
,
对
大数据分析本身
,
包括分析的方向
、
分析方法等讨论甚少
。
本研究希望部分填补该空白
,
本研究对我国大数据分析的发
展具有重要的参考价值
。
[
方法
/
过程
]
从情报学的角度
,
通过总结国外的论文
、
研究报告和案例
,
结合笔者长期情报分
析的经验
,
总结共识和提出建议
。
[
结果
/
结论
]
大数据分析首先需要确定分析的方向和拟解决的问题
,
然后才能确定需
要的数据和分析范围
。
获得数据常常需要创造性的方法
,
大数据分析是情报分析的一部分
,
需要将大数据分析发现的关
系置于相关背景和宏观环境下解读
。
分析没有统一的分析工具
,
因分析的目标
、
处理的数据量不同而不同
。
关键词
:
大数据分析
;
分析方向
;
分析方法
Abstract
:
[
Purpose
/significance
]
Big
data
analytics
is
becoming
a
hot
topic
in
academia.
However
,
the
existing
researches
focus
on
the
significance
and
phenomenon
of
big
data
and
few
discussions
have
been
made
on
the
direction
of
big
data
analytics
,
a-
nalysis
methods
,
etc.
This
paper
hopes
to
fill
part
of
the
gap.
The
study
has
significant
implication
for
the
development
of
big
data
analytics.
[
Method
/process
]
From
the
perspective
of
information
science
,
the
paper
makes
suggestions
and
comments
by
summari-
zing
the
consensus
in
the
foreign
papers
,
research
reports
and
case
studies
,
with
combination
of
the
author
’
s
analysis
experience
in
competitive
intelligence.
[
Result
/conclusion
]
Big
data
analysis
needs
to
determine
the
problems
to
be
addressed
and
the
direction
of
the
analysis
before
deciding
on
the
data
required
and
the
scope
of
analysis.
Collecting
data
often
requires
creative
approaches.
Big
data
analysis
is
part
of
business
intelligence
analysis.
The
relationship
discovered
by
big
data
analysis
needs
to
be
placed
and
inter-
preted
under
the
specific
background
and
relevant
macro-
environment.
So
far
there
are
no
unified
analysis
tools
,
and
the
tools
de-
pend
on
the
analysis
target
and
amounts
of
data
to
be
processed.
Keywords
:
big
data
analytics
;
analysis
direction
;
analysis
method
最近几年大数据成为学术界的一个热门题目
。
笔者于
年
7
月
18
日在中国期刊全文数据库搜索篇名中有
“
大数据
”
一
词
的
核
心
期
刊
论
文
,
共
有
3239
篇
,
其
中
年及以前
,
仅
77
篇
,
年
26
篇
,
年增长到
359
篇
,
年达到
861
篇
,
年达到
1297
篇
,
年截至
7
月
18
日收录的论文
,
已有
612
篇
。
按百分比计
算
,
有关大数据的论文
,
59%
是
年和
年
7
月发
表的
,
27%
是
年发表的
。
年以前
(
不含
)
发表的仅占
3%
(
见图
1
)
。
这显示
,
大数据研究
,
过去两
年在我国已非常火热
。
但由于研究的时间太短
,
发表的论
文大部分都不是基于充足的知识积累撰写的
。
根据论文的标题和摘要
,
以及重点选读部分论文
,
笔
者发现
,
现有的研究重点主要集中在讨论大数据意义
、
大
数据现象和大数据软件技术方面
。
而有关大数据分析方法
的讨论则较少
。
在标题中有
“
大数据分析
”
短语的文章
有
90
篇
,
但讨论大数据分析方法的论文只有两篇
。
涉及
分析方向
、
数据来源
、
分析方法
、
分析工具的研究都非常
缺乏
。