Computer Architecture

Download Report

Transcript Computer Architecture

© Frontier Technologies in Computer Science
通识卓越课程
http://en.tjcities.com/index.php/works
计算机科学前沿技术
Frontier Technologies in Computer Science
课程网站:http://en.tjcities.com/index.php/works
联系方式: [email protected]
微博:http://weibo.com/willtongji
© Frontier Technologies in Computer Science
课程内容
•
•
•
•
•
•
•
•
第1章 概述
第2章 计算机硬件的发展
第3章 高性能计算
第4章 现代操作系统
第5章 计算机网络新技术
第6章 可信系统和可信软件
第7章 数据库技术的发展
第8章 数据挖掘及其应用
•
•
•
•
•
•
•
•
第9章 人工智能前沿
第10章 机器学习的研究
第11章 搜索引擎技术
第12章 集体智慧与Web 2.0
第13章 云计算
第14章 物联网技术
第15章 服务科学与服务计算
第16章 智慧地球
© Frontier Technologies in Computer Science
第10章 机器学习的研究
© Frontier Technologies in Computer Science
We believe machine learning will lead to appropriate, partial
automation of every element of scientific method, from hypothesis
generation to model construction to decisive experimentation. Thus,
machine learning has the potential to amplify every aspect of a working
scientist’s progress to understanding. It will also, for better or worse,
endow intelligent computer systems with some of the general analytic
power of scientific thinking.
——Science, 14 September, 2001
© Frontier Technologies in Computer Science
本章内容
• 机器学习的发展
• 机器学习的主要范式
–监督学习与非监督学习
–半监督学习
–主动学习
–统计机器学习
• 机器学习的应用和未来发展
5
© Frontier Technologies in Computer Science
什么是机器学习?
• 学习是人类具有的一种重要智能行为,但究竟什么是学习,
长期以来却众说纷纭。社会学家、逻辑学家和心理学家都各
有其不同的看法。至今,还没有统一的“机器学习”定义,
而且也很难给出一个公认的和准确的定义。
• 可以认为, 机器学习是研究如何使用机器来模拟人类学习活
动的一门学科。稍为严格的提法是:机器学习是一门研究机
器获取新知识和新技能,并识别现有知识的学问。
6
© Frontier Technologies in Computer Science
机器学习与数据挖掘的关系
传统的机器学习研究并不把海量数据作为处理对象,很多技术是为处
理中小规模数据设计的,如果直接把这些技术用于海量数据,效果可能
很差,甚至可能用不起来。因此,数据挖掘界必须对这些技术进行专门
的、非简单的改造。
数据挖掘
数据分析技术
数据管理技术
机器学习
数据库
数据挖掘和机器学习
7
© Frontier Technologies in Computer Science
机器学习的发展史
感知机
统计学习模型
线性适应元
连接主义学习模型
“核方法”机器学习
8
© Frontier Technologies in Computer Science
典型的机器学习范式(Paradigm):
监督、非监督、半监督是三个对等的机器学习的算法类别;
分类、回归、排序学习是三个对等的机器学习问题;
统计学习则归为机器学习的理论范畴。
9
© Frontier Technologies in Computer Science
集成学习
•
集成学习的主要思想是利用多个分类器来解决同一个问题,目的是更有效地提高
学习系统的泛化能力。
•
集成学习通常分为两个步骤:首先,采用单个学习算法对样本分别进行训练;然
后,对单个网络的输出按某种方法进行集成,得到最后的结果。集成网络常用的
方法包括Bagging和Boosting等。
集成学习
10
© Frontier Technologies in Computer Science
流行学习
• 流形学习旨在发现高维数据集分布的内在规律性,其基本思想是:高维观
测空间中的点由少数独立变量的共同作用在观测空间张成一个流形,如果
能有效地展开观测空间卷曲的流形或发现内在的主要变量,就可以对该数
据集进行降维。
11
© Frontier Technologies in Computer Science
机器学习的广泛应用
• 1.日常生活中的机器学习
• 2.网络安全中的机器学习
• 3.生物信息学中的机器学习
• 4.航空航天中的机器学习
• 5.智能交通中的机器学习
• 6.搜索引擎中的机器学习
12
© Frontier Technologies in Computer Science
日常生活中的机器学习
在我们的工作与生活中,这种例子曾出不穷。互联网搜索、在线广告、
机器翻译、手写识别、垃圾邮件过滤等等都是以机器学习为核心技术的。
Kinnect感应系统
Goggles图片搜索
IBM的Watson
13
© Frontier Technologies in Computer Science
网络安全中的机器学习
• 网络安全是计算机的一个热门研究领域,特别是入侵检测方
向,不仅有很多理论成果,还出现了不少实用系统。
14
© Frontier Technologies in Computer Science
生物信息学中的机器学习
在生物信息学这个新兴的交叉学科中,试图利用信息科学技术来研究从
DNA到基因、基因表达、蛋白质、基因电路、细胞、生理表现等一系列环节
上的现象和规律。
15
© Frontier Technologies in Computer Science
航空航天中的机器学习
“勇气”号火星机器人
16
© Frontier Technologies in Computer Science
智能交通中的机器学习
Stanford大学研发的自动驾驶赛车
17
© Frontier Technologies in Computer Science
机器学习的未来发展
• 美国国防部高级研究计划局还说,“CALO的名字源于拉丁文Calonis,
含义是‘战士的助手’”,而且美国先美国国防部高级研究计划局曾在其网
站上放置了如图10.23所示的一幅军官与虚拟参谋人员讨论战局的画面。
因此可以预料,该计划的(部分)成果会直接用于军方。从上述情况来看
,美国已经把对机器学习的研究上升到国家安全的角度来考虑。
18
© Frontier Technologies in Computer Science
推荐阅读
[1] Eric Mjolsness, Dennis DeCoste. Machine Learning for Science:
State of the Art and Future
Prospects. Science, 2001,
293(5537): 2051-2055.
[2] 王珏 周志华等. 机器学习及其应用. 清华大学出版社, 2006.
[3] Tom Mitchell. Machine Learning (英文版). 机械工业出版社, 2003.
问题与讨论
•结合自己的背景,说说机器学习在现实生活中的应用。
•查看NIPS、ICML和COLT最新的会议信息,列举出各研究领域中的热门
方向。
•分析不同机器学习范式的特点和应用场景。
19
© Frontier Technologies in Computer Science
通识卓越课程
http://en.tjcities.com/index.php/works
Thanks!