Transcript Document

高级人工智能
第十六章
互联网智能
Web Intelligence
史忠植
中国科学院计算技术研究所
2015/7/21
高级人工智能
史忠植
1
内容提要
16.1 概述
16.2 语义WEB
16.3 本体知识管理
16.4 WEB挖掘
16.5 搜索引擎
16.6 WEB技术的演化
16.7 集体智能
16.8 人工生命
2015/7/21
高级人工智能
史忠植
2
Web语言层次
Attribution
Explanation
Rules & Inference
Ontologies
Metadata annotations
Standard Syntax
Identity
2015/7/21
史忠植 智能获取
3
KMSphere Layers
Knowledge
Application
Knowledge Distribution
Knowledge organization
Ontology Acquisition
Email
7/21/2015
Document
File
Image
Zhongzhi Shi: Semantic Web Services
Video
Web
4
KMSphere Architecture
7/21/2015
Zhongzhi Shi: Semantic Web Services
5
KMSphere Workflow
OntoSphere
User Interface
Delivery Engine
Query Engine
Agent Grid
Knowledge Spaces
Semantic Spaces
O2OMR
Resource Spaces
O2DMR
7/21/2015
Zhongzhi Shi: Semantic Web Services
6
KMSphere Demo
Create
ontology by
hand
7/21/2015
Zhongzhi Shi: Semantic Web Services
7
KMSphere Demo
Ontology
acquisition
from
databases
7/21/2015
Zhongzhi Shi: Semantic Web Services
8
KMSphere Demo
Ontology
acquisition
from text
7/21/2015
Zhongzhi Shi: Semantic Web Services
9
KMSphere Demo
Edit
ontology
7/21/2015
Zhongzhi Shi: Semantic Web Services
10
KMSphere Demo
Ontology
consistenc
y check
7/21/2015
Zhongzhi Shi: Semantic Web Services
11
KMSphere Demo
RDQL
(RDF
Data
Query
Languag
e)
7/21/2015
Zhongzhi Shi: Semantic Web Services
12
Web挖掘分类
Web挖掘
Web内容挖掘
文本挖掘
多媒体挖掘
Web结构挖掘
URL挖掘
内、外部结构挖掘
Web使用挖掘
一般访问模式
追踪
个性化访问模
式追踪
Web挖掘类
项目
Web内容挖掘
Web结构挖掘
Web日志挖掘
IR方法:无结构数据、半结构数据
Web结构数据
用户访问Web数据
主要数据
自由化文本、HTML标记的超文本
Web文档内及文档
间的超链
Serverlog,
Proxy serverlog,
Client log
表示方法
词集、段落、概念、IR的三种经典模型
图
关系表、图
处理方法
统计、机器学习、自然语言理解
机器学习、专有算
法
统计、机器学习、
关联规则
分类、聚类、模式发现
页面权重
分类聚类
模式发现
Web站点重建,商
业决策
处理数据
类型
主要应用
Web内容挖掘


基于网页内容或其
描述中抽取知识的
过程。
Web内容挖掘主要
包括文本挖掘和多
媒体挖掘两类,其
挖掘对象包括文本
、图像、音频、视
频和其他各种类型
的数据。
日志的预处理
IP Address
Time/Date
Method/URI
Referrer
Agent
202.120.224.4
15:30:01/2-Jan-01
GET Index.htm
http://ok.edu/link.htm
Mozilla/4.0(IE5.0W98)
202.120.224.4
15:30:01/2-Jan-01
GET 1.htm
http://ex.edu/index.htm
Mozilla/4.0(IE5.0W98)
202.120.224.4
15:30:01/2-Jan-01
GET A.htm
http://ex.edu/index.htm
Mozilla/4.0(IE5.0W98)
202.120.224.4
15:33:04/2-Jan-01
GET Index.htm
http://ok.edu/res.php
Mozilla/4.0(IE4.0NT)
202.120.224.4
15:33:04/2-Jan-01
GET 1.htm
http://ex.edu/index.htm
Mozilla/4.0(IE4.0NT)
202.120.224.4
15:33:04/2-Jan-01
GET A.htm
http://ex.edu/index.htm
Mozilla/4.0(IE4.0NT)
202.120.224.4
15:35:11/2-Jan-01
GET C.htm
http://ok.edu/A.htm
Mozilla/4.0(IE5.0W98)
202.120.224.4
15:35:11/2-Jan-01
GET B.htm
http://ex.edu/A.htm
Mozilla/4.0(IE4.0NT)
202.120.224.4
15:37:09/2-Jan-01
GET E.htm
http://ex.edu/C.htm
Mozilla/4.0(IE5.0W98)
Web文本挖掘

Web文本挖掘针对包括Web页面内容、页面结构和用户访问信
息等在内的各种Web数据,应用数据挖掘方法发现有用的知识
帮助人们从大量Web文档集中发现隐藏的模式。
Internet
采集
Web文本
提取
特征库
挖掘
结果
评价
输出
Web文本挖掘的方法




文本概括:从文本(集)中抽取关键信息,用简洁的形式总结文
本(集)的主题内容。例如搜索引擎在向用户返回查询结果时,
通常需要给出文本摘要。
文本分类 :把一些被标记的文本作为训练集,找到文本属性和文
本类别之间的关系模型,然后利用这种关系模型判断新文本的类
别。召回率和精度。
文本聚类:根据文本的不同特征划分为不同的类。
从大量文档中发现一对词语出现模式的关联分析以及特定数据在
未来的情况预测。
Web文本挖掘的应用


搜索引擎领域:利用Web文本挖掘可以更合理地组织搜
索结果:按照页面之间的相似程度分为若干簇。
自然语言理解领域:结合自然语言处理技术和Web文本
挖掘技术。
文本挖掘在垃圾邮件过滤中的应用
训练
email
邮件预处理
自动分词
训练模块
参考
词
典
待分类
email
参考
初级过滤
自动分词
分类向量
库
基于内容的二
次过滤
基于内容的二次过滤模块
初级分类
库
初级分类模块
用户
Web结构挖掘


有用的知识不仅存在于Web页面间的链接结构和Web页
面内部结构,而且也存在于URL中的目录路径结构(页
面之间的目录结构关系)。
Web结构挖掘是指挖掘Web链接结构模式,即通过分析
页面链接的数量和对象,从而建立Web的链接结构模式
。
Web结构挖掘主要方法


HITS算法
PageRank算法
Spider
Log
20M queries/day
SE
Web
Spam
Index
SE
Browser
SE
Freshness
24x7
Quality results
800M pages?
HITS - Kleinberg’s Algorithm


HITS – Hypertext Induced Topic Selection
For each vertex v in a subgraph of interest:




a(v) - the authority of v
h(v) - the hubness of v
A site is very authoritative if it receives many
citations. Citation from important sites weight
more than citations from less-important sites
Hubness shows the importance of a site. A
good hub is a site that links to many
authoritative sites
2005-11-4
"Web Search and Mining" Course @ USTC,
2005
23
Authority and Hubness
权威等级
中心等级
5
2
3
1
1
4
7
a(1) = h(2) + h(3) + h(4)
2005-11-4
6
h(1) = a(5) + a(6) + a(7)
"Web Search and Mining" Course @ USTC,
2005
24
Convergence of Authority and
Hubness
• Recursive dependency:
a(v)  Σ
h(v)  Σ
h(w)
w  pa[v]
a(w)
w  ch[v]
• Using Linear Algebra, we can prove:
a(v) and h(v) converge
2005-11-4
"Web Search and Mining" Course @ USTC,
2005
25
HITS Example
Find a base subgraph:
• Start with a root set R {1, 2, 3, 4}
• {1, 2, 3, 4} - nodes relevant to
the topic
• Expand the root set R to include all
the children and a fixed number of
parents of nodes in R
 A new set S (base subgraph) 
2005-11-4
"Web Search and Mining" Course @ USTC,
2005
26
HITS Example
Hubs and authorities: two n-dimensional a and h
HubsAuthorities(G)
|V|
1 1  [1,…,1]  R
2
3
4
5
6
a 0  h 0 1
t 1
repeat
for each v in V
do a t(v)  Σ
7
8
9
10
11
12
h t(v)  Σ
a t -1(w)
w  pa[v]
a t a /t || a || t
h t h /t || h ||t
t  t+1
until || a t– a t -1|| + || h – t h ||t -1
<ε
return (a t, h )t
2005-11-4
h t -1(w)
w  pa[v]
"Web Search and Mining" Course @ USTC,
2005
27
HITS Example Results
Authority
Hubness
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Authority and hubness weights
2005-11-4
"Web Search and Mining" Course @ USTC,
2005
28
Matrix Denotion of HITS

It is clear that the authority and hubness
values calculated by the aforementioned
algorithm is the left and right singular vector
of the adjacency matrix of the base sub
graph.
2005-11-4
"Web Search and Mining" Course @ USTC,
2005
29
PageRank
•Introduced by Page et al (1998)
The page rank is proportional to its parents’ rank, but
inversely proportional to its parents’ outdegree
PRi  d 
j
PR j
kj
 (1  d )
PRi :the PageRank value of page i
PRj : the PageRank value of page j
kj :number of the pages j refer to
d:a parameter ranging [0,1].
PageRank: Formula
Given page A, and pages T1 through Tn linking
to A, PageRank is defined as:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... +
PR(Tn)/C(Tn))
C(P) is the cardinality (out-degree) of page P
d is the damping (“random URL”) factor
PageRank: Intuition



Calculation is iterative: PRi+1 is based on PRi
Each page distributes its PRi to all pages it
links to. Linkees add up their awarded rank
fragments to find their PRi+1
d is a tunable parameter (usually = 0.85)
encapsulating the “random jump factor”
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
PageRank v.s. HITS - Algorithm
2005-11-4
"Web Search and Mining" Course @ USTC,
2005
33
Web结构挖掘的应用



信息检索
社区识别
网站优化
Ranking for the Search Results



Today’s search engines may return millions
of pages for a certain query
It is definitely not possible for the user to
preview all these results
An appropriate ranking will be very helpful.


2005-11-4
Ranking on relevance
Ranking on importance
"Web Search and Mining" Course @ USTC,
2005
35
传统信息检索排序

A ranking purely on relevance




2005-11-4
Term frequency (tf)
Inverse Document Frequency (idf)
Okapi …
Many other aspects that Dr. Shuming Shi will
mention in the next course.
"Web Search and Mining" Course @ USTC,
2005
36
Limitations of Traditional IR

Text-based ranking function



www.harvard.edu can hardly be recognized as
one of the most authoritative pages for the query
“harvard”, since many other web pages contain
“harvard” more often.
The number of pages with the same relevance is
still too large for the users to preview.
Pages are not sufficiently self-descriptive

2005-11-4
Usually the term “search engine” doesn't appear
on the web pages of search engines.
"Web Search and Mining" Course @ USTC,
2005
37
What’s More for Web Search


In order to solve these problems
 We must leverage other information on the Web
 We must distinguish those pages with the same amount of
relevance
Link Analysis
 The web is not just a collection of pure-text documents


A link from page A to page B may indicate:



2005-11-4
the hyperlinks are also very important!
A is related to B, or
A is recommending, citing, voting for or endorsing B
Links effect the ranking of web pages and thus have commercial
value.
"Web Search and Mining" Course @ USTC,
2005
38
搜索引擎系统结构
Typical Search Engine Architecture
搜索器
用户检索
结果显示
检索器
索引库
39
智能搜索引擎 GHunt
智能搜索引擎GHunt是网
络信息智能获取与处理
系统,支持分布式的网
络信息并行搜索与内容
过滤;采用文本挖掘自
动建立概念语义空间和
事件来龙去脉,提供高
效的基于语义的文本信
息检索、基于内容的图
像检索,以及个性化的
专题信息推送服务。
Zhongzhi Shi, Qing He, Ziyan Jia and Jiayou Li. Intelligence Chinese Document Semantic Indexing
System.
Technology
and Decision Making,Vol.2, No.3,402003:
2015/7/21 International Journal of Information
史忠植
智能获取
407-424.
Web Spider



提出了一种基于智能主体的大规模、
分布式智能信息并行搜索的Spider,
搜集因特网上各种文档信息,实现相
关的网络信息过滤与网址解析,并将
搜集的信息返回给服务器。
DONG Mingkai, SHI Zhongzhi.
Distributed Web Spider Based on
Intelligent Agent. World Wide
Web Technologies in China:
Research, Development, and
Applications, 2002, pp. 148-162
Internet
Facilitator
史忠植 董明楷 蒋运承 张海俊. 语
义Web 的逻辑基础. 中国科学 E 辑
2015/7/21
史忠植 智能获取
信息科学 2004, 34(10): 1123-1138
Spider1 Spider2 Spidern
Data
base
41
Web Spider
用户可以对信息进行多方面个性化定
制,例如:
1.
IP范围:202.96.*.*;或
202.96.100.0-202.98.255.255
2.
网站类型:例如,.com, .edu,
或要求URL中包含sports,或
peopledaily等特征字;
3.
关键词:过滤方式有“包含关键
词”和“不包含关键词”两种;
4.
模式:简单模式、标准模式和网
站模式;
5.
个数: Spider并行运行的个数
;
6.
时间: Spider运行的起始时间
和终止时间;
2015/7/21
7.
周期: Spider更新运行的周期
史忠植 智能获取
42
概念语义空间


通过建立概念语义索引,对网络文本与图像信息进行自组
织,实现了文本和图像基于概念语义的检索。检索结果不
仅提供与查询概念直接相关的文档,还提供这些文档所在
的类别,可进一步择类进行类内检索,提高了检索的准确
率。另一方面提供与查询概念语义相关的概念,从而克服
由于用户检索用词与相关内容文本中使用的概念表述不一
致的问题,实现了基于概念语义的互动式检索,提高了查
全率。
Zhongzhi Shi, Qing He, Ziyan Jia and Jiayou Li. Intelligence
Chinese Document Semantic Indexing System. International
Journal of Information Technology and Decision Making,
Vol.2, No.3, 2003:407-424.
2015/7/21
史忠植 智能获取
43
概念语义空间生成
2015/7/21
史忠植 智能获取
44
概念语义检索结果
2015/7/21
史忠植 智能获取
45
事件查询参数选择
2015/7/21
史忠植 智能获取
46
伊朗地震事件来龙去脉检索
2015/7/21
史忠植 智能获取
47
伊朗地震专题相关图片报道
2015/7/21
史忠植 智能获取
48
神州五号专题相关图片报道
2015/7/21
史忠植 智能获取
49
基于复杂网络的搜索
基于视频分析的搜索
台词搜索
声音搜索
画面搜索
Yebol(耶宝)搜索引擎
2015/7/21
史忠植
智能科学研究进展
52
互联网发展路线图
Spivack 2008
2015/7/21
史忠植
智能科学研究进展
53
Web发展路线图
Spivack 2008
2015/7/21
史忠植
智能科学研究进展
54
Web1.0
Web2.0
Tim O’Reilly - Web 2.0
Web3.0
Web1.0 – Web2.0 – Web3.0
• 文件网
Web1.0: Web of documents
• 人际/社会网
Web2.0: Web of persons
• 数据网
Web3.0: Web of data (semantics)
LOD2010
集体智能案例Wikipedia
Wikipedia is an encyclopedia written
collaboratively by many of its readers. It uses
a special type of website, called a wiki, that
makes collaboration easy.
Lots of people are constantly improving
Wikipedia, making thousands of changes an
hour, all of which are recorded on article
histories and recent changes. Inappropriate
changes are usually removed quickly.
2015/7/21
史忠植
智能科学研究进展
61
“Cloud computing” Created in 4 Sept. 2007
2015/7/21
史忠植
智能科学研究进展
62
Version in 4 Sept. 2008
2015/7/21
史忠植
智能科学研究进展
63
Version in 14 Sept. 2009
2015/7/21
史忠植
智能科学研究进展
64
Wiki Project
维基教
科书
维基百科
维基资源
2015/7/21
维基新闻
史忠植
智能科学研究进展
65
全球心智模型 WWM
2015/7/21
史忠植
智能科学研究进展
66
人工生命
定义1
研究具有自然生命系统行为的人造系统。
2015/7/21
高级人工智能
史忠植
67
人工生命
人工生命是指用计算机和精密机械等
生成或构造表现自然生命系统行为特点的
仿真系统或模型系统。自然生命系统的行
为特点表现为自组织、自修复、自复制的
基本性质,以及形成这些性质的混沌动力
学、环境适应和进化。
在现实世界中,普遍地存在着各类复
杂系统,一般认为,非线性、不稳定性、
不确定性是造成复杂性的根源。复杂事物
只能照它复杂的面貌来理解。
2015/7/21
高级人工智能
史忠植
68
人工生命第一次会议
“人工生命——关于生命系统合成与模拟的跨学科研讨
会”。本次会议于1987年9月在美国新墨西哥的罗斯阿拉莫
斯举行。本次会议的论文集共收录了24篇论文,内容主要
分布在:人工生命研究的理论、生命现象的仿真、细胞自
动机(简称CA)、遗传算法、进化仿真等5个方面,兰顿
发表了题为“人工生命”的开拓性论文,他在文中提出了
人工生命的概念,并讨论了它作为一门新兴的研究领域或
学科存在的意义。兰顿被公认为人工生命研究的创立者。
这次会议标志着人工生命研究领域的诞生。
2015/7/21
高级人工智能
史忠植
69
AI vs. AL
1.
2.
3.
4.
5.
6.
Complex human
functions
Top-down
Global Control
Complex Rules
Preprogrammed
behavior
KnowledgeRepresentation
2015/7/21
1.
2.
3.
4.
5.
6.
高级人工智能
史忠植
Basic natural behavior
Bottom-up
Local Control
Simple Rules
Emergent behavior
Avoid KnowledgeRepresentation &
Planning
70
研究人工生命的原因
 人工生命的研究可使我们更好地理解突发
特征,个体在低级组织中的集合,通过我
们的相互作用,常可产生特征。
 人工生命将会成为研究生物的一个特别有
用的工具。
 对于发展新技术及增强我们控制自然的能
力,人工生命系统是很有潜力的。
 人工生命的另一显著应用是遗传工程。
2015/7/21
高级人工智能
史忠植
71
人工生命的探索

20世纪初,逻辑在算术机械运算中的运用,导致过程
的抽象形式化。

40年代末,50年代初,冯.诺伊曼提出了机器自增长的
可能性理论。以计算机为工具,迎来了信息科学的发
展。

70年代以来,科拉德(Conrad)和他的同事研究人工仿生
系统中的自适应、进化和群体动力学,提出了不断完
善的“人工世界”模型。

80年代,人工神经网络又兴起,出现了许多神经网络
模型和学习算法。与此同时,人工生命的研究也逐渐
兴起。1987年召开了第一届国际人工生命会议。
2015/7/21
高级人工智能
史忠植
72
人工生命的模型
1. 计算机病毒
2. 计算机的进程
3. 生物统计学和个体胎生学
4. 机器人
5. 自催化(autocatalytic)网络
6. 细胞自动机
7. 人工核苷酸
2015/7/21
高级人工智能
史忠植
73
人工生命的研究方法和战略
按照人工生命的组织机构,人工生命的内容大
致可以分成两类:
1) 构成生物体的内部系统,包括脑、神经系
统、内分泌系统、免疫系统、遗传系统、
酶系统、代谢系统等。
2) 在生物体及其群体中表现的外部系统。生
物群体中环境适应系统和遗传进化系统等。
2015/7/21
高级人工智能
史忠植
74
人工生命研究的方法
1) 模型法。
• 根据内部和外部系统所表现的生命行为,
建造信息模型。
2) 工作原理法。
• 生命行为所显示的自律分散和非线性的
行为,它的工作原理是混沌和分形,据
此研究它的机理。
2015/7/21
高级人工智能
史忠植
75
人工生命研究的策略
1) 采用以计算机等信息处理机器为中心的硬件生成生命行为。
•
一种是采用已有的信息处理机器和执行装置,实现具有人工生命
行为的系统。
•
另一种是用生物器件构造生命系统。这些都通称为生物计算机,
是一种向人工生命接近的方法。
2) 用计算机仿真,研究开发显示生命体特征行为的模型软件。简单地说,
神经网络系统和遗传算法等,都是采用信息数学模型,模拟人工生命
的生成。
3) 基于工作原理,利用计算机仿真生成生命体。生命现象的基础是随物
理熵的增大而杂乱无章。生成这种现象的原理是混沌的分形、耗散结
构、协同反应等,采用这些产生生命现象。
4) 通过计算机仿真,分析生命特有的行为生成,建立新的理论。利用上
面3个策略,得到生命行为共同的一般性质,通过概括,建立生命的
基本理论。这种策略形成自组织、超并行处理等理论。
2015/7/21
高级人工智能
史忠植
76
细胞自动机
细胞自动机(CA)是另一种对结构递归应用简单规
则组的例子。在细胞自动机中,被改变的结构是整个
有限自动机格阵。在这种情况下,局部规则组是传递
函数,在格阵中的每个自动机是同构的。所考虑修改
的局部上下文是当时邻近的自动机的状态。
自动机的传递函数构造一种简单的、离散的空间/
时间范围的局部物理成分。要修改的范围里采用局部
物理成分对其结构的“细胞”重复修改。这样,尽管
物理结构本身每次并不发展,但是状态在变化。
2015/7/21
高级人工智能
史忠植
77
细胞自动机
元胞自动机—产生和发展. 四个阶段:
1940s 诞生:Von Neumann 自我复制机.
1960-70s起步:JH.Conway 生命游戏.
1980s 理论研究:S.Wolfram CA分类.
1980-90s 应用:HPP-FHP格子气自动机.
C.Langton N.Packard 人工生命
2015/7/21
高级人工智能
史忠植
78
二维空间中的细胞自动机
记V为细胞状态集,V中有一元素
v0为静止状态,定义f是
V*V*…*V→V的函数, 且满足
f(v0,v0,…,v0)=v0,
则(V,v0,f)称为是m个邻居的细胞自动
机,f 称为该细胞自动机的变换函数。
2015/7/21
高级人工智能
史忠植
79
信号传播的过程
2015/7/21
2 2 2 2 2 2
2 2 2 2 2 2
1 1 0 s 1 1
1 1 1 0 s 1
2 2 2 2 2 2
2 2 2 2 2 2
高级人工智能
史忠植
80
信号复制
2 2 2 2 2 2
2 2 2 2 2 2
2 2 2 2 2 2
1 0 s 1 1 1
1 1 0 s 1 1
1 1 1 0 s 1
2 2 1 2 2 2
2 2 s 2 2 2
2 2 0 2 2 2
* 2 1 2 * *
* 2 1 2 * *
* 2 s 2 * *
* 2 1 2 * *
* 2 1 2 * *
* 2 1 2 * *
时刻T
时刻T+1
时刻T+2
2015/7/21
高级人工智能
史忠植
81
数据路径扩张
2015/7/21
2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2
1 1 0 6 1 1 1 1
1 1 1 0 7 1 1 1
2 2 2 2 6 2 2 2
2 2 2 2 0 2 2 2
* * * 2 0 2 * *
* * * 2 1 2 * *
* * * 2 1 2 * *
* * * 2 1 2 * *
* * * 2 1 2 * *
* * * 2 1 2 * *
高级人工智能
史忠植
82
变换规则表
f(0,1,2,7,6)=1 f(7,0,0,0,2)=3 f(2,0,0,2,3)=7 f(1,0,2,3,2)=6
f(0,1,2,3,2)=1 f(3,0,2,2,1)=0 f(7,0,2,1,2)=0 f(1,0,7,2,2)=3
f(4,0,2,0,2)=2 f(2,0,0,2,4)=0 f(2,0,2,6,2)=4 f(2,0,0,1,4)=2
f(4,0,2,6,2)=2 f(2,0,4,6,2)=4 f(1,2,4,2,6)=4 f(4,1,2,2,2)=0
f(2,0,0,4,2)=0 f(2,0,2,4,2)=0 f(2,0,1,2,4)=2 f(6,0,2,4,2)=4
f(7,0,0,2,1)=0 f(0,1,2,7,2)=4
2015/7/21
高级人工智能
史忠植
83
细胞自动机的概念可由以下方式建立
首先我们有一细胞空间,它组成了N维欧几里德空间,
以及定义于该细胞空间的邻居关系。对于每个细胞空间,由
于邻居关系,必有有限个细胞作为它的邻居。一个细胞自动
机系统(简称“细胞系统”)是这样定义的:该系统对每个细
胞给定有限个状态和一个区分状态(叫“空状态”),及一条
规则。该规则给出每个细胞在时刻T+1时的状态,且该规则
是在时间t时该细胞自身的状态及它的邻居的状态的函数。我
们把一个细胞的所有可能状态连同管理该细胞的状态变换的
规则一起称为一个变换函数。所以一个细胞自动机系统是由
一个细胞空间和定义于该空间上的变换函数所组成。细胞自
动机状态由有限个细胞连同赋于每个细胞的状态所指定,可
理解为其它的细胞都处于空的状态。
2015/7/21
高级人工智能
史忠植
84
形态形成理论
典型的形态形成理论是1968年Lindenmayer提
出的L-系统。L-系统由一组符号串的重写规则组
成,它与乔姆斯基(Chomsky)形式语法有密切关系。
在下面“X→Y”表示结构中当出现X时用字符串Y
代替。因为字符X可以出现在规则的右边和左边,
这组规则可以被递归地应用来重写新的结构。
2015/7/21
高级人工智能
史忠植
85
形态形成理论
规则采用上下文无关,即在特定部分改变时
不考虑上下文中的关系。例如一组规则:
(1)
(2)
(3)
(4)
2015/7/21
A
B
C
D




CB
A
DA
C
高级人工智能
史忠植
86
例子1
当把这组规则用于初始种子结构“A”,就可以得到下面的序
列:
次数
结构
应用规则
0
1
2
3
4
2015/7/21
初始种子
C B
规则1,CB 代替A
D A A
规则3,DA代替C; 规则2,A代替B
C C B C B 规则4,C代替D; 规则1用两次,CB代替A
…
继续进行
A
高级人工智能
史忠植
87
例子2
规则:(1) A →C[B]D
(2) B →A
(3) C → C
(4) D → C(E)A
(5) E → D
当把这组规则用于初始种子结构“A”,就可以得到下面的序
列:
次数
结构
应用规则
0
A
1
C[B]D
2
C[A]C(E)A
3
C[C[B]D]C(D)C[B]D
4 C[C[A]C(E)A]C(C(E)A)C(E)A
2015/7/21
高级人工智能
开始种子
规则 1.
规则 3, 2, 4.
规则 3, 1, 3, 5, 1.
规则 3, 3, 2, 4, 3, 4, 3, 2,3.
史忠植
88
例子3
规则:(1) [{C} → C
在字符串左端的“C”保持“C”
(2) C{C} → C “C”和它左端的“C”保持“C”
(3) *{C} → *
“C”和它左端的“*”变成“*”
(4) {*}C → C
“*”和右端的“C”变成“C”
(5) {*}] → *
在字符串右端的“*”保持“*”
在这些规则下,初始结构“*CCCCCCC”将产生向右传播:
次数
结构
0
1
2
3
4
5
6
2015/7/21
7
*CCCCCCC
C*CCCCCC
CC*CCCCC
CCC*CCCC
CCCC*CCC
CCCCC*CC
CCCCCC*C
CCCCCCC*
高级人工智能
史忠植
89
Thank You!
Questions?!
www.intsci.ac.cn/shizz/
2015/7/21
史忠植 高级人工智能
90