大数据时代系统工程面临的机遇与挑战
Download
Report
Transcript 大数据时代系统工程面临的机遇与挑战
大数据时代系统工程面临的机遇与挑战
谭跃进
教授
国防科技大学信息系统与管理学院
[email protected]
大数据时代系统工程面临的机遇与挑战
移动大数据在海地大地震应急救援管理决策中的应用;
基于大数据的航天装备的健康管理与寿命预测研究;
湖南永州市公安局利用监控和移动通信数据进行破案;
TCL公司研究院利用电视终端设备收集用户使用信息,
进行新产品开发;
美国棱镜计划对国家安全与反恐维稳情报体系建设的启
示;
网络舆情分析和实时情景态势感知的突发事件应急管理
与决策;
2015年国家自然科学基金委管理学部的重点项目投票
……
主要内容
一、大数据时代系统工程面临的机遇
二、大数据时代系统工程面临的挑战
一、大数据时代系统工程面临的机遇
关于大数据 (big data)
大数据指的是所涉及的资料量规模巨大到无法透过目前
主流软件工具,在合理时间内达到撷取、管理、处理、
并整理成为帮助企业经营决策有更积极目的的资讯。大
数据的4V特点:Volume(大量)、Velocity(高速)
、Variety(多样)、Value(价值密度低)。
大数据已成为互联网信息技术行业的流行词汇,已成为
未来“十三五”和2030年前我国重点发展的十大科技领
域之一。
大数据技术的战略意义不在于掌握庞大的数据信息,而
在于对这些含有价值的数据进行专业化处理,通过“加
工处理”实现数据“增值”。
一、大数据时代系统工程面临的机遇
关于大数据 (big data)
大数据可分为大数据技术、大数据工程、大数据科学和
大数据应用等领域。大数据的来源包括网络日志、RFID
、传感器网络、社会网络、手机呼叫详细记录、社会数
据、互联网文本和文件、互联网搜索索引、天文学、大
气科学、基因组学、生物和其他复杂的、跨学科的科研
、军事侦察、能源、交通、医疗记录、教育、社会管理
、企业组织内部数据、摄影档案馆视频档案、大规模的
电子商务等。
大数据从”结构化”数据发展变化到图片、视频、互动
、三维等大量形态各异的”非结构化”数据,与事件、
社会情绪等诸多不可预测的因素有关,如同控制我们情
绪的右脑。
一、大数据时代系统工程面临的机遇
“The use of big
data
in the development world is in its early days
but it signals a new era in which technology could transform
the way international public sector organisations approach their
work.”
Financial Times, Nov 14, 2013
大数据的应用在现代社会中还处于起步阶段,但他寓示
了一个新时代的到来:即大数据技术将彻底改变公共部门的
管理和运作方式。
金融时报,2013年11月14日
一、大数据时代系统工程面临的机遇
值得注意的是,中国现代化建设中的很多复
杂问题(或系统),如能源、交通、医疗卫生、
科技教育、社会保障、环境保护、城市建设、企
业管理、信息网络管理、社会管理、国防与军队
建设管理等问题,用传统方法很难以解决或成本
太高,而基于大数据(证据)的分析和决策有可
能是解决此类问题的选择。这些问题正是现代化
带来的复杂系统问题,也是系统工程要努力解决
的问题。因此,我们进入“互联网-大数据时代”
的同时,我们也迎来了系统工程时代!
一、大数据时代系统工程面临的机遇
案例一:移动大数据在应急管理中的应用
全球每年约有2.58亿人受到如台风、地震、
洪水、干旱等自然灾害的影响,大部分自然灾害
最直接的后果是导致人口移动和迁徙,社会管理
系统趋于瘫痪,大量救援物资无法及时、准确分
发给灾民。
地海大地震
手机数据辅助定位灾民移动和分布
• MOU & NDA with
Digicel Haiti(地海)
• 约 10亿条通话记录!
• 数据库文件 250GB
• 单个文本文件25GB
震后灾民流动情况分析:人群行为动力学分析
Improved Response to Disasters and Outbreaks by Tracking Population Movements with Mobile Phone Network Data: A PostEarthquake Geospatial Study in Haiti. PLoS Medicine, 2011; 8 (8): e1001083 DOI: 10.1371/journal.pmed.1001083
移动轨迹预测方法
Improved Response to Disasters and Outbreaks by Tracking Population Movements with Mobile Phone Network Data: A PostEarthquake Geospatial Study in Haiti. PLoS Medicine, 2011; 8 (8): e1001083 DOI: 10.1371/journal.pmed.1001083
霍乱感染地区人口流动及风险评估
基于移动数据的传
染病预防与管控
Improved Response to Disasters and Outbreaks by Tracking Population Movements with Mobile Phone Network Data: A PostEarthquake Geospatial Study in Haiti. PLoS Medicine, 2011; 8 (8): e1001083 DOI: 10.1371/journal.pmed.1001083
数据分析报告提交联合国救援组织
FLOWMINDER.ORG
Copyright © 2013 Flowminder.org. For internal use only.
国际媒体关注
Copyright © 2013 Flowminder.org. For internal use only.
一、大数据时代系统工程面临的机遇
案例二:基于大数据的载人航天系统评价与决策分析
天宫一号目标飞行器的控制力矩陀螺(CMG)
性能(退化)数据趋势分析
数据的关联性分析(飞行器姿态数据、空间位置数据、周
边局部温度数据等)
基于数据的故障预测
基于数据的寿命预测
基于数据的故障处理决策支持
利用数据验证拓展人工管理经验。
一、大数据时代系统工程面临的机遇
案例二:基于大数据的载人航天系统评价与决策分析
描述统计量
N
极小值
极大值
均值
标准差
CMG2框架角速度指令
3601
-.0360
.0396
-.001714
.0123763
CMG2框架角度
3601
-169.15649
-150.28747
-162.9417330
6.50066428
CMG2转子转速脉冲数
3601
1424
1425
1424.42
.493
CMG2工作状态
3601
238
238
238.00
.000
CMG2自检状态
3601
12
12
12.00
.000
CMG2转子电机电流
3601
1.82000005
1.91999996
1.8522854966
.02217410613
CMG2+45V电源状态
3601
4.48000002
4.50000000
4.4939794562
.00917535759
CMG2固紧端轴温
3601
2.20000005
2.22000003
2.2060594719
.00919212637
CMG2滑动端轴温
3601
2.24000001
2.25999999
2.2599944360
.00033328671
CMG2+12V电源状态
3601
4.26000023
4.26000023
4.2600002300
0E-11
CMG2转子电机电压
3601
3.94000006
3.96000004
3.9599944860
.00033328671
CMG2+2.5V电源状态
3601
2.48000002
2.50000000
2.4800222360
.00066629563
CMG2框架电机电流
3601
.039999999
.159999996
.08141071850
.024648831419
CMG2框架电机电压
3601
4.21999979
4.21999979
4.2199997900
0E-11
CMG2选通状态
3601
0
0
.00
.000
CMG2粗正弦信号
3601
2.05999994
2.46000004
2.3216051267
.13872510644
CMG2粗余弦信号
3601
1.4
1.6
1.452
.0504
奇异测度sm
3601
.997
3.913
2.57486
1.027585
姿态控制管理状态
3601
204
204
204.00
.000
三轴角动量偏差DHsatx
3601
-4.92
9.12
.0874
3.90774
三轴角动量偏差DHsaty
3601
-7.24
24.24
4.2136
9.46642
三轴角动量偏差DHsatz
3601
-1.16
19.28
6.8585
5.97848
有效的 N (列表状态)
3601
提出了基于数据趋势变化的故障预
测方法和性能退化的寿命预测方法。
一、大数据时代系统工程面临的机遇
这些案例告诉我们,基于大数据我们能够迅速、直
观、理性地对复杂系统或问题进行分析、预测、评估、
决策和实施管理,即“基于数据(或证据)的决策”而
不是靠似是而非的“理论”、基于过多假设的“模型”
的决策或“事后诸葛亮”。
美国前白宫经济委员会主任、哈佛大学教授
Lawrence Summers所认为的,“我们正处在历史的
转折点,200年后的人书写我们这段历史时,他们会发
现我们所处的时代人类思考方式发生了重大的变化,那
就是我们比以往任何时代在更多事情上变得更加理性,
我们更多以数据为依据分析思考问题。”
一、大数据时代系统工程面临的挑战
从方法看挑战:系统工程方法可大致分为
(1)社会调查与统计分析方法(含实证分析方法);
(2)系统分析方法;
(3)预测分析方法;
(4)系统评价方法;
(5)运筹学(最优化)方法(含智能优化);
(6)仿真建模分析方法;
(7)网络建模分析方法(含社会网络计算);
(8)大数据建模分析方法(含数据挖掘、证析)。
一、大数据时代系统工程面临的挑战
从解析建模、仿真建模、大数据建模的发展中,后者
都需要前者。如仿真建模中需要局部的解析建模,仿真结
果分析需要统计分析和系统评价;大数据建模中需要解析
建模,也需要仿真建模,而且是其中的重要组成部分。因
此,如果我们结合中国的管理现实需要和热点问题,把传
统的方法与大数据、云计算、物联网、网络科学、社会网
络、数据挖掘、证析、仿真、社会计算等有机结合起来,
可以得到很多有用的新方法。如大数据、社会网络的统计
分析与预测;物联网环境下数据驱动的在线优化与动态决
策等。
一、大数据时代系统工程面临的机遇
(1)社会调查与统计分析方法
(2)系统分析方法
(3)预测分析方法
(4)系统评价方法
(5)运筹学方法
(6)仿真建模分析方法
(7)网络建模分析方法
(8)大数据建模分析方法
传统方法
结合、创新
新的方法
一、大数据时代系统工程面临的挑战
网络科学( network science)
研究内容:测量网络数据、发现网络性质、建立网络模
型、分析网络行为、设计与控制网络性能。
发展应用:社会网络与大数据分析相结合,为分析复杂
的社会系统提供了有力的工具,在社会学、管理学、经
济、国家安全等领域将得到广泛应用。
网络建模分析方法
测量网络数据
发现网络数据
建立网络模型
分析网络行为
控制网络功能
一、大数据时代系统工程面临的挑战
证析:基于证据的决策(analytics,不同于analysis )
定义:是用数学、运筹学、统计学影响商业决策的一种
方法。“证”是证据的证,这个证据更多强调的是定量
的证据,也就是数据;“析”仍然是分析的析,分析数
据以产生新的影响决策的证据。因此,证析就是指对量
化证据进行分析以影响决策的实践。
背景:证析是学科和时代发展到现阶段的新产物,驱动
力来自业界通过收集和分析数据以从中获得最大化的价
值的努力,业界利用数据指导从产品设计、物流规划到
推广营销的一系列决策。大数据为analytics 提供了技术
基础,数学、运筹学、统计学和计算机科学的发展为
analytics 提供了分析数据的手段。以Analytics为名的
杂志也于2008年正式发行。
一、大数据时代系统工程面临的挑战
证析的研究内容和步骤:
1、需求分析:证析是为解决业务问题、提升业务决策
服务的,所以要分析客户的问题和需求是什么。
2、决策流程分析:企业通过其价值链实现客户价值,
企业为实现价值、获取利润需优化价值链中各个环节的
决策,因此,企业业务流程中的决策流程的决策效果是
证析项目的主要目标。
3、数据管理:从各个来源抽取与搜集数据、建立数据
仓库、管理数据是证析项目的基础和重要组成部分。
4、度量:度量指标决定了证析项目所需要优化的决策
目标。
5、探索性数据分析与数据可视化。
6、提出假设,发现模型、关联与模式。
一、大数据时代系统工程面临的挑战
证析的研究内容和步骤:
7、检验与评价:假设成立与否需要使用数据并利用统
计方法进行检验。
8、形成理论与洞察:利用人的归纳和推理能力,对数
据的产生机理做出猜测,从而形成理论。
9、推理与优化:利用专家系统中的自动推理规则和搜
索优化算法。
10、干预与解决方案设计:包括产生创意、细化创意、
选择方案等。
11、仿真与实验:相关性并不等同于因果性。
12、应用与推广(实施决策)。
13、监控与持续的改进。
一、大数据时代系统工程面临的挑战
实际上,大数据、物联网、云计算、网络科学、社
会网络、数据挖掘、证析、仿真、计算实验等都有很密
切的关系:
1、大数据挖掘、开源情报分析
2、大数据与证析(基于证据的决策)
3、大数据分析与仿真验证
4、大数据分析与云计算
5、大数据与网络科学研究
6、大数据与社会网络分析
7、大数据与计算实验
结论:研究方法的选取大多与研究对象的结构化、关联
性和数据多少有关。总的发展趋势是数据越来越多,问
题越来越非结构化,关系越来越复杂和网络化。
一、大数据时代系统工程面临的挑战
从复杂系统研究看挑战:
关于复杂系统的特性,主要表现为:以非线性为核心,由
此推演出复杂系统的整体性、自主性、关联性、涌现性和
多样性等特性。
大数据时代追求的“不是随机样本,而是全体数据”。全
体数据正好刻画了复杂系统的整体。
小数据时代,万事都要追问个“为什么”,总想弄清事物
之间的微观因果关系。
大数据时代,只要存在的就是合理的,只问“是什么”,
不问“为什么”,对事物之间的关系不一定要求弄清因果
细节,但要求弄清那些宏观上会引起变化的数据之间的关
联关系。因此,在大数据时代,我们追求的“不是因果关
系,而是相关关系”。这里的相关关系正好反映了复杂性
科学中的关联性和非线性特征。
一、大数据时代系统工程面临的挑战
基于多Agent的智能交通系统
交互
实际系统
人工系统
最新应用:手机数据+卫星地图
大数据是最接近映射真实世界的手段
各种大数据背后的复杂系统管理
数据类型一:社会网络抽样数据,管理:网络大数据与社会管理
数据类型二:手机定位与移动通话数据,管理:交通、救援、公安
数据类型三:卫星图像数据,管理:侦察、态势分析、大气科学等
数据类型四:人口数据,管理:人口管理、城镇化建设管理等
数据类型五:在线社会网络数据,管理:舆情、开源情报分析等
数据类型六:教育、市场与医疗数据,管理:医疗、教育管理等
数据类型七:犯罪数据、警局报告数据,管理:团伙犯罪网络分析
数据类型八:物联网数据,管理:信号监测与食品安全管理等
数据类型九:组织结构、经济发展数据,管理:组织演化规律研究
数据类型十:人力资源数据,管理:人力资源结构、更替规律分析
一、大数据时代系统工程面临的挑战
从复杂系统研究看挑战:
因此,大数据技术是复杂性科学的
技术实现,大数据分析方法是复杂系统
规律挖掘与行为预测的有效方法,数据
驱动的复杂系统研究前途广阔。
大数据环境下的社会管理与计算实验
论 坛