切换控制系统发展简述 - 华南理工大学图书馆

Download Report

Transcript 切换控制系统发展简述 - 华南理工大学图书馆

2012年工科图书馆馆长会议
分析、实践和思考
关于研究型大学图书馆学术
研究特性
于光
哈尔滨工业大学图书馆
2015年4月13日
Contents
1.
2.
3.
4.
2015/4/13
信息社会带来的变化--研究者视角
重新审视研究型大学图书馆
学术研究实践例举
未来研究和服务思考
1.信息社会带来的变化—研究者视角
 网上信息资源数量的大量增加,图书馆已经不再
是获取学术信息的唯一来源。
到馆人数逐年减少,尤其是教师;
图书借阅量下降,数据库下载量增加;
期刊阅览室几乎无人光顾;
 网络信息技术吸引着大量学者
 图书馆传统服务模式受到冲击
 传统图书馆消亡论???
2015/4/13
信息爆炸带来的问题
2015/4/13
图书馆还是研究型大学的“心脏”吗?
(1)对先进文化知识传播和积累的推动作用
参与大学学术活动的全部过程
(2)知识、学术、社会和文化生活中心
(3)免费获取信息的场所
(4)提高素养的场所
(5)支持研究的场所
需要思考的问题:
…..
我们的目前发现系统真的发
现知识了吗?
2015/4/13
2、重新审视研究型大学图书馆
研究型大学的功能和特征
研究型大学图书馆概念
研究型大学图书馆的特征
2015/4/13
研究型大学的功能和特征
 “研究型”大学是美国卡耐基教育基金会
1994年提出的概念。
研究型大学的的品质
 高质量的一定规模的研究生群体——基础
 高水平的教授队伍——保证
 出色的研究成果——优秀标志
8
研究型大学的功能
第一项功能:传授知识 培养人才
第二个功能:创造知识
第三项功能:科技成果转化
第四项功能:学术交流
9
研究型大学的主要特征
科研显著:科学研究是研究型大学的重点。
学术声誉高:学术声誉是大学的生命线。
办学特色突出:是大学生存和发展的成功之道。
学术研究环境优良:拥有良好的实验室、图书馆、
博物馆。
永远培养精英和杰出人才。
10
研究型大学图书馆概念
 研究型大学图书馆应该属于研究型图书馆
 现代化图书馆→科学完整的文献收藏体系→
一流信息咨询服务。
 国家知识创新体系的重要组成部分。
 具有支持学校进行高水平、多学科的科学研究
以及培养高层次研究型人才的能力。
11
研究型大学图书馆的特征
(1)研究性
科学研究是研究型大学
的重要特征,其核心目标就是
在多个学科领域取得优秀的科
研究型大学图书馆应该为科学研究提供
研成果,关注知识创新、成果
高质量的文献信息保障和研究型的服务,研
转化、博硕研究生培养。
究性特征应贯穿于研究型大学图书馆服务过
程的始终。同时,要提高自身的科学研究能
力,从而带动研究性的服务,提高科学研究
服务能力。
12
研究型大学图书馆的特征
(2)学术性
研究型大学的学术性表现在两个层
面:一是正确的学术观念、优良的
学术精神和浓郁的学术气氛;
研究型大学图书馆的灵魂深处要充满学
二是一流的学科建设、学术队伍、
术性,其本身是学术性机构。在进行高水平
教学和人才培养
的图书情报学、文献学、管理学等方面的学
术研究基础上,要将学术性体现在服务的理
念、服务内容、服务方式上,为学术研究提
供良好的服务和一个适宜的环境。
13
研究型大学图书馆的特征
(3)特色化
突出办学特色是研究型大
学的生存和发展的成功之道,
包括办学理念、学科专业、教
大学的特色对图书馆文献资源建设和文
师、课程设置、教学科研等方
献服务体系建设提出特殊要求,即资源的针
面的特色。
对性、可利用性,突出重点学科、尖端学科
的文献资源建设的特点。
建设特色馆藏、提供特色服务是研究型
大学图书馆面临的新任务。
14
研究型大学图书馆的特征
(4)数字化
随着信息技术的发展,数字化网络化获取
信息资源已成为研究型大学教学科研人员的基
本要求和习惯行为。
信息的数字化是实现资源共享、信息获取
的开放式主动服务的关键。
15
研究型大学图书馆的特征
(5)个性化
目前网络化数字化程度越高,
学科专业特色越强。研究型大
图书馆为用户服务、满足用户需求
学用户特点数量大、学科专业
复杂,学术人员高度专业化。
的宗旨是永远不变的,面对研究型大学的
用户群要求图书馆服务个性化程度越来越
高,服务的方式根据学术人员的专业需求
提供针对性的服务。
16
研究型大学图书馆的特征
(6)知识化
研究型大学是以知识的传
播、生产和应用为中心,功
研究型大学对图书馆的依赖不仅仅是查
能包括传授知识、创造知识、
成果转化。
阅与工作有关的文献资料,更主要的是通过
图书馆所提供的信息资源进行知识挖掘,发
现新知识、识别新知识、创造新知识,因此
要求图书馆对信息资源进行知识化的挖掘并
提供知识化的服务。
17
研究型图书馆需要的是:
“大师”——指资深专业馆员或专家式的馆员,
图书馆的灵魂和核心竞争力所在。
“大楼”——指图书馆的信息资源和技术设施
“大气”——指所能提供学术性、研究型服务的
能力、制度以及优雅的学术研究环境
思考的问题:如何培养“大师”?
如何建设“大楼”?
如何实现“大气”?
18
成功的研究型大学图书馆 -“不仅仅提供资料信息,而且能提供教学科
研的思路”
检
索
2015/4/13
分
析
发
现
创
新
3. 学术研究实践例举
某研究主题发展的科学计量评价
我国运筹与管理研究论文计量分析
科技期刊决策分类评价
引文网络研究(文献、专利)
2015/4/13
项目一:研究主题发展的科学计量
评价(NSFC)
研究主题的发展历程演化分析
①研究主题的动态演化分析
②研究分支的生命周期演化分析
研究主题的知识流动特性分析
①研究主题知识输出的计量分析
国家、机构、科研人员和学科之间
②研究主题知识吸收的计量分析
国家、机构、和学科之间
注:为我校研究人员提供报告
2015/4/13
粗糙集研究为例
主题聚类图
2015/4/13
项目二:
中国运筹与管理科学论文的计量评价
中国运筹与管理科学论文的分布
① 作者和机构
② 来源期刊
③ 国际合作分析
 基于引文的国际影响力分析
注:为基金委管理学部一处和校经管学院提供
2015/4/13
国内机构与国外机构合作网络图
2015/4/13
调度
稳定性
供应链管理
优化
库存
中国运筹与管理科学论文关键词共现知识图谱
2015/4/13
项目三:科技期刊决策分类评价
(NSFC及科学计量学联合基金)
 问题起源:由于期刊影响因子重要的评价功能,
引起人们出于自私目的的趋利造假行为。提高期
(1)
刊自引,集中提高这两年内的引文数量。
(2)
 引出问题:自引模式的异常表现。
2015/4/13
Figure 1
Figure 2
2015/4/13
自然的引用和人为操纵的引文分布
1)影响因子操纵行为模式识别
已知有操纵行为
的引文分布数据
特征提取与选择
训练与分类
建立识别模型
未知样本
(待测样本)
判据
(分类结果)
计算机预报
模式识别的判别流程图
Fig. Distinguish process of pattern recognition
2015/4/13
收集待测样本数据
重采样处理,放入到模型中
采用最近邻法实现对期刊自引操纵行为的
数据标准化,加上决策数列
自动识别。将已知的具有操纵行为的期刊的
JCR引文分布数据作为训练样本,提取操纵期
标准化的待测数据放到测试集Test
刊引文分布函数的有效特征值,形成一个原始
矩阵模型,选取k—近邻法作为分类器对样本
训练,得出测试结果并对其分析,然后选取
执行KNN程序,得到识别结果
JCR中未知期刊的引用分布特征值进行自引操
纵行为的识别。
是
正常期刊
2015/4/13
“1”的个数
远多于“2”
否
可疑期刊
2)自引模式分类决策评价
描述期刊自引模式的特征向量,即:
其中,
分
别代表当年总
被引量、当年总自引量、当年被引量、当年自引
量、前两年被引量之和、前两年自引量之和、自
引率。
2015/4/13
分类识别流程图
2015/4/13
3)期刊质量综合评价模型
论文题目:期刊评价的分类决策方法研究,学生:崔永生
2015/4/13
研究重点
特征抽取
建立识别模型
决策分类方法应用
建立识别系统
研究成果:
•The self-cited rate of scientific journals and the manipulation of their impact
factors, 2007,73(3): 321-330(SCI、SSCI)
•Reliability-Based Citation Impact Factor and the Manipulation of Impact Factor,
Scientometrics. 2010,Volume 83(1): 259-269 (SCI、SSCI )
•An Automatic Recognition Method of Journal Impact Factor Manipulation,
Journal of Information Science,2011 37(3) 235-245 (SCI、SSCI 、EI)
•Evaluation method of decision tree classification of journal self-citation patterns
2015/4/13
项目四:引文网络相关研究
 现代科学知识体系已构成了一个巨大的
复杂网络
 显著特征是各种交叉学科的出现打破了
学科之间的界限
在科学研究中实现创新越来越难
本研究目的用信息计量学、科学计量
学研究成果为学校学科发展策略制定提
供科学依据。
项目来源:国家自然科学基金(在研)
2015/4/13
研究内容
(1)学科之间的知识信息传播规律研究
(2)引文网络上的引文模式分析
(3)高被引文献的特征提取及预测建模
(4)关于专利引文网络研究
2015/4/13
(1) 学科之间的知识信息传播规律研究
利用文献引用和被引用过程的数学模型
和信息传播过程模型,以SCI-JCR中学科期刊
群的引用和被引用年代分布数据为样本,定
量研究学科交叉发展状态,研究数个学科的
动态发展过程和与其他学科之间的相互作用
的关系。
2015/4/13
 学科与其相关互引网络的演化规律定量研究
 学科发展动力的定量分析
 学科间知识传递的时滞效应研究
该部分的研究将建立学科之间知识传播过程
的定量描述方法,可以探明学科之间的亲缘关系
和结构,得到学科交叉、融合的发展趋势,从而
对新兴学科和交叉学科的出现进行预测,为我校
学科发展规划和科技发展管理策略的制定提供科
学依据。
2015/4/13
以纳米学科为例
从引用环境的动态演化分析学科的知识吸
收模式
2015/4/13
发现之一
在纳米学科与核心学科的相互作用关系中
,存在着较强的对称性。在知识传播的强
度指标上,纳米学科的知识主要来源于物
理、化学和材料三个核心学科,其知识也
主要的输出到了这三个学科中,且知识吸
收和输出的强度表现出了相似的动态演变
特性,物理学科与纳米学科的相互影响强
度随时间推移在逐渐下降,而材料和化学
在持续上升。
2015/4/13
学科发展状态的案例研究
数个优秀学科或研究团队在一定时间序列
上的科研成果和影响力演化过程分析
弱势学科或研究团队的一定时间序列上的
科研成果和影响力演化过程分析
对比分析提出如何打破各学科发展瓶颈的
方法和制定切实有效的学科发展规划的建
议
2015/4/13
研究方法
 引文网络的可视化分析方法
CitespaceⅡ软件中网络节点的中心性测量功能;
利用 突现词”(burst term) 检测辨识和探测学科
知识领域研究的热点,预测知识领域发展的前沿
趋势。
 词共现(Co-ocurring)聚类分析方法
对一组词两两统计它们在同一篇文献中出现
的次数,以此为基础对这些词进行聚类分析,从
而反映出这些词之间的亲疏关系,进而分析这些
词所代表的学科和主题的结构变化。
2015/4/13
2015/4/13
 研究发现
 国外顶级数学期刊关键词在共现频次与中心度排
名中,融入了更多跨学科的主题词,机械、仿真
、有限元素、流、变形、无网格局部彼得罗夫-伽
辽金方程与断裂等等。研究内容与主题涉及到跨
学科领域,诸如物理、化学与机械等等
2015/4/13
经济学期刊中国作者发文关键词可视化图谱
2015/4/13
经济学期刊外国作者发文关键词可视化图谱
2015/4/13
(2)引文网络上的引文模式分析
引文网络的无标度拓扑结构特性
度分布特性、优先连接特性
文献年龄修正的优先连接机制
渐消记忆优先连接机制
短期记忆优先连接机制
三种修正机制间的关系
2015/4/13
研究意义
该项研究阐明了引文网络宏观结构特性的
微观生成机制,揭示出微观的老化特性对
网络宏观结构生成的影响,这不仅对引文
网络这一类特殊网络的研究具有重要意义
,而且也将对具有类似老化特性的复杂网
络的研究产生影响,为理解这类网络的演
化规律提供了重要的借鉴。
2015/4/13
重要特性发现
 引文网络中优先连接机制的存在,导致:
网络中节点度分布的不均衡

较高度值的节点凸显成为重要节点,
成为网络度分布中的“长尾”
带来了引文网络度分布的无标度特性具有的
高的科研价值而备受研究者的关注和追捧,也由
此引发了对引文网络中重要节点的成长模式和先
兆特征的研究。
 高被引预测提供了科学依据
博士论文:引文网络的演化特性研究,博士生:王名扬
2015/4/13
(3) 高被引文献的特征提取及预测建模
 研究引文网络中不同度值节点的成长模式;
 揭示节点被引频次之后隐含的广泛的属性特征;
 构建节点的特征属性空间,提取文献的内容特征
和外部特征,共同构成高被引文献预测建模的特
征库。
 基于模糊粗糙集方法构造一系列预报因子组,结
合多分类器融合技术,实现了高被引文献的预测
建模。
2015/4/13
研究内容:
1)外部特征建模:文献外部特征采集;数据预处
理;构建分类模型
2)内容特征建模:文献内容特征采集;构建分类
模型
3)所有特征建模:预报因子组的生成方法,高被
引文献预测建模的预报因子组,多分类器融合方
法,基于高被引文献预报因子组的多分类器融合
,高被引文献的典型特征分析
4)实现高被引文献预测应用
2015/4/13
2015/4/13
2015/4/13
 Wang, Mingyang; Yu, Guang; ect. Development a case-based classifier for
predicting highly cited papers, JOURNAL OF INFORMETRICS, 6(4):
586-599, 2012
 Wang, Mingyang; Yu, Guang ect. The Preferential Attachment
Mechanism Basing on Weighted Past Citations, International Journal of
Modern Physics B, 25(15): 2055-2061, 2011
 Wang, Mingyang; Yu, Guang; ect. Mining typical features for highly cited
papers, SCIENTOMETRICS, 87(3): 695-706, 2011
 Yu, Guang; Wang, Ming-Yang; ect. Characterizing knowledge diffusion
of Nanoscience & Nanotechnology by citation analysis,
SCIENTOMETRICS, 84(1): 81-97, 2010.
论文来源:WOS,Springer, ScienceDirect
博士论文:引文网络的演化特性研究,博士生:王名扬
2015/4/13
(4)关于专利引文网络研究
 技术创新布局及其扩散分布网络:技术创新的布
局、学科构成、技术重心指数、整体布局
 技术创新网络静态结构:属性特征、专利、发明
人和发明机构引用网络静态结构
 技术创新网络的动态演化:属性特征、演化机制
和规律、演化模型和实例分析验证
博士论文:基于专利引文的技术创新网络结构与演化研究
博士生:宋天华
2015/4/13
研究理论与方法
研究内容
归纳
绪论
解决的问题
分析论文研究主题的意义与填补的科学空
白,提出研究的内容与技术路线。
演绎
复
杂
网
络
理
论
专
利
理
论
专
利
引
文
理
论
实
证
研
究
可
视
化
2015/4/13
星形网络
雷达图
技术创新布局与技术创
新扩散分布网络
揭示技术创新布局及其扩散分布的
特点与模式。
比较分析
拓扑分析
技术创新网络静态结
构
揭示技术创新属性特征网络的静态拓
扑性质,抽取影响网络成长的重要创
新节点。
图数据挖掘
拓扑演化分析
核方程
技术创新网络动态
演化
揭示了技术创新网络演化规律与演化机
制,构建技术创新网络演化模型。
连续理论
平均场
S-曲线模型
应用实证研究
SPLC/SPNP
文本数据挖掘
识别技术创新演化的主要路径,预测技
术创新发展趋势。
 通信设备巨头技术创新布局与扩散比较研究.科研管理,2011,11:18-24
 中外两家通信设备企业技术创新布局比较研究——基于思科与华为的DII专
利分析. 情报杂志,2010,29(7):65-69
 Technological innovation and diffusion of hybrid rice breeding based on patent
citation networks. Advances in Information Sciences and Service Sciences,2012,
4(14):304-311
 Exploring Key Transformism Properties of Patent Citation Network-The Base of
Hybrid Rice. WIT Transactions on Engineering Sciences(录用)
 Forecasting development of hybrid rice breeding through s-curve model and
community analysis in complex networks. Advanced Materials Research, 2012,
524-527:2127-2131(Ei: 20122315085428)
 Exploring Evolution of Technology Innovation Network: the Base of High Speed
Railway. Scientometrics(按审稿意见修改返回)
 .Evolution of technology innovation network for hybrid rice
breeding.(Technological Forecasting & Social Change, SSCI检索期刊,已投稿)
2015/4/13
科学研究带来的启示
 站在科研人员的角度分析信息需求
如何建立立体化的知识体系,如何从浩如烟
海的信息库中准确快速获取知识信息;如何选题
调研,获取思路,激发研究思想;跟踪某研究领
域的最新进展,等等…………
重要的:方便快捷地获取所需信息
 作为图书馆人要做到的:
 把适当的资料在适当的时间提供给适当的读者
2015/4/13
4、未来研究服务思考
问题1:
从知识积累角度:研究型大学面临的问题
问题2:
从研究者信息需求:文献资源的知识挖掘服务
(大数据环境下的信息服务)
问题3:
从学术交流平台建设:学术研究网络的自动分析
2015/4/13
问题1:研究型大学的知识累积问题
 评价大学的各项指标都是自身积淀总量的函数。
 累积量,取决于时间,取决于源;
 源:源泉之谓也,内生源和外在源;
 外在源:人才资源,生源,资金来源,信息源;
 内生源:人才培养、科研产出;科研教学效率。
 大学的知识管理中的存在问题:
研究生毕业的知识流失
2015/4/13
研究生毕业产生的知识流失问题
 研究生在能力达到最高点的同时也就离开了课题组,
导致某一课题研究严重拖期,某个程序不再能用,某
个设备废弃,某项技能失传等等事情。
 学生毕业时交接资料能留下的往往是纸面上的东西,
但是很多重要知识存储在毕业学生的头脑中的。
如果这些知识是独占性的,那么研究生毕业将导致知
识流失。
 新入学的学生如果没能从老生那里获得相关的知识,
则往往会遇到重复的老问题,从而使得学生的能力增
长曲线的梯度无法提高,最终限制了学生群体的平均
科研产出率。
一个简单的知识积累模型
知识
产出
知识
产出
知识累积
1/S
+
知识累积
反馈系数
理想的知识积累 和实际的的知识积累
知识积累模型的说明
 随着研究生的毕业,必将带走一部分活动知识,即在
知识产生后的积累中,知识在不断的转移消失,在知
识积累的积分环节上面增加了一个知识转移消失的负
反馈。
 负反馈的比例系数和团队成员之间知识传递的流畅程
度成反比的。知识传递越流畅,高年级研究生的活动
知识就越充分地转移给其他成员,毕业带来的损失就
越少,即负反馈的比例系数就很小。
 知识传递中不存在堵塞环节,负反馈系数为零,即整
个团队知识一直在增加。反之,则负反馈的比例系数
就越大,团队的整体活动知识保留下来的少,增长就
很慢。
模型的讨论
这模型尚不足以反映所有的影响学术增长
的机制,描述知识积累的环节还可以进一
步考虑知识转移的微观机制(研究生培养
过程)去细化完善;
描述知识流失的负反馈系数和描述知识产
出的模块也可以进一步细化;
但这些都不影响这个简单模型对知识流失
的效应做出结论:最终限制团队的学术水
平的成长,形成了一个发展瓶颈。
目前解决问题的简单对策
 找到了瓶颈,就去打破这些瓶颈
 研究组的网状组织机制
 制度性的学术交流和讨论
 现代化的资料共享和知识共享平台
 博士生助教制度
但这些远远不够,进一步要做的研究工作,及模
型的细化……
作为大学图书馆我们需要做什么
作为创新的基础服务组织
如何减少知识流失
建立什么样的交流、信息共享平台
因为创新是时代的主旋律,也是研究型大
学快速发展的灵魂。
问题2:文献资源的知识挖掘服务
大数据环境下的信息服务
从研究者信息需求:
网络化和数字化带来信息获取方便的同时
也可看到在海量数据面前的无奈
“Academic search is
treated as document
search, but ignore
semantics”
2015/4/13
大数据环境下的信息服务
目前需要解决的首要问题:
对海量的数据源进行(及时的)分析和挖
掘,提取有用的信息
未来研究:
用户检索和下载的行为模式分析和挖掘
文献数据文本或内容挖掘的知识发现
2015/4/13
面临的研究难点
大数据的特点带来的困难?
研究方法上的局限?
研究人员知识匮乏?
需要整合其他学科人力资源?
2015/4/13
大数据的特点
2015/4/13
研究方法
复杂网络理论
文本挖掘、情感分析
模式识别、决策分类
数据处理方法:模糊粗糙集、粒计算
…..等等·
2015/4/13
问题3:学术研究网络的自动分析方法
从研究者利用学术交流平台的角度思考
问题
 建设什么样的学术研究网络平台
 如何在功能上:
达到多维度、多功能、全面准确的融合
2015/4/13
Examples – 知识搜索
Expertise search
• When starting
a work in a new
research topic;
Researcher
A
• Or brainstorming
• Who are for
experts in this field?
novel ideas.
• What are the top research
labs?
• What are the top conferences
in the field?
• What are the best papers?
Examples – Citation network analysis
Researcher
B
• an in-depth
understanding of the
research field?
An Inverted Index
Implementation
Introduction of Modern
Information Retrieval
Topics
Filtered
Document Retrieval with
Frequency-Sorted Indexes
Parameterised Compression for
Sparse Bitmaps
Memory Efficient
Ranking
Topic 31: Ranking and Inverted Index
Topic 1 : Theory
Topic 27: Information retrieval
Topic 23: Index method
Signature les: An access Method
for Documents and
its Analytical Performance
Evaluation
Topic 21: Framework
Topic 34: Parallel computing
Self-Indexing Inverted Files for
Fast Text Retrieval
Topic 22: Compression
A Document-centric Approach
to Static Index Pruning in Text
Retrieval Systems
Other
Vector-space Ranking with
Effective Early Termination
Citation Relationship Type
Efficient Document Retrieval in
Main Memory
Static
Index Pruning for Information
Retrieval Systems
Basic theory
Comparable work
Other
Examples – 准确的会议推荐
Conference Suggestion
Which
conference
should we
submit the paper?
auth
ors
Researcher C
cont
Examples – 准确的审稿人推荐
Reviewer Suggestion
KDD Committee
conference
Paper content
Who are best
matching reviewers
for each paper?
如何构建适合的学术研究网
我们追求的目标
使研究者真正感受学术化的信息服务
 使咨询服务贯穿于学术研究的始终
 融入基于关联规则、语义分析和图上数
据挖掘的精准推荐方法
实现信息咨询服务多维度、多功能、全
面准确的融合
参见ArnetMiner
2015/4/13
感谢华南馆的会议筹办!
管窥之见就教方家
借大家之光照亮我们!
谢谢各位馆长的聆听!
请提出宝贵意见!
2015/4/13