2012年2月15日周三 - 北京大学互联网信息工程研发中心

Download Report

Transcript 2012年2月15日周三 - 北京大学互联网信息工程研发中心

本课目标
 授课对象:
 需要有一定计算机专业基础,偏重软件。
 关注信息技术与产业结合的内容。
 重点关注网络相关,最好对网络技术和搜索引
擎有兴趣,有一定基础(例如之前上过WBIA、
网络安全、通信、移动计算的课)。
 启发创新、创意、了解产业发展现状和方向。
 帮助大家规划研究项目找点子,例如:研究课
题的选择,申请院长基金,北大挑战杯等。
 希望对大家未来就业有所帮助。
授课人员






雷凯,总体安排。
王荣刚
李大刚
黄连恩
高之宁
外邀企业人士: 一些企业的负责人,例如博雅
互动的总经理张伟,腾讯负责娱乐机器人的,
擎旗的总经理李鸿等。
 专题覆盖面比较宽,所以请各个领域的专家
上课安排
 课堂授课为主






时间: 每周三晚上。
地点: 北大深研院: C栋202
每节课3个学时(2个半小时+休息时间+ Q/A)
TA:李立华 [email protected]
网站:
邮件列表:选课确认后,请TA收集、编辑一个
上课安排 (主要内容)






1、互联网舆论情报和管理与网络审计,雷凯
2、海量网页数据处理与存储, 黄连恩
3、移动计算技术与产业发展, 雷凯、高之宁
4、云计算技术与产业发展, 雷凯
5、移动互联网安全技术, 李大刚
6、嵌入式互联网研发与产业发展, 雷凯、张伟
上课安排 (主要内容)







7、虚拟化关键技术与应用,雷凯、罗英伟
8、多媒体技术与产业发展,王荣刚
9、互联网技术与产业发展,雷凯
10、音视频技术与产业发展,王荣刚
11、未来互联网发展趋势,雷凯
12、著名IT企业产业发展专题,雷凯
13、作业考核,PPT Presentation,雷凯、
王荣刚、李大刚、黄连恩等
教学方式
 上课为主。
 争取安排去一次企业现场参观考察。
 问卷调查、集体分小组讨论。
考核与成绩




平时成绩(出勤,课堂活跃问答)10%
期末 PPT Presentation 50%
期末提交一份作业报告 40%
作业,提前布置 (附件:Word 文档)
期末作业 (1.研究报告 40分)
 期末完成一份报告: 每人选择一个国外顶级计
算机专业排名的学校,通过浏览该校计算机系
网页,完成下面相关的问题。(TA 会选择学校
名单,进行分配)
① 请综合介绍一下这个学校目前的计算机研究的
情况。10分
② 这个学校计算机系最强的三个研究方向是什么
? 你是如何得出以上结论的?10分
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
期末作业 (1.研究报告 40分)
③ 这个学校计算机系你最感兴趣的三个老师是谁
,他们在研究什么科研问题和项目?你为什么
对他们的研究感兴趣?10分
④ 从你选择的三个老师课题小组中,选择一篇
2010年之后发表的有代表性的论文(最好与我
们本课专题相关,例如互联网, 数据挖掘,云
计算、移动互联网、数据库、多媒体、图形图
像等等),仔细阅读以后,为什么你看中了这
篇论文,这篇论文的亮点,难点,研究价值在
什么地方?谈一下你的读后感。10分
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
期末作业
(2.PPT Presentation 50%)
完成一个PPT, 并给大家做一次15分钟左右的
Presentation 。包括下面两个方面的内容:
① 8分钟,给大家讲【报告一】中4点,20分。
② 7分钟的时间,挑选一个报告一中的学校研究方
向,进行技术和产业分析,回答一个关键问题
:学术研究如何能够促进产业的发展。30分
1. 该方向研究成果跟哪些产业相关?
2. 该方向研究成果可以给哪些企业/产品带来好处?
3. 基于研究成果,制定一个具体的创业计划?讲讲
你设想的商业模式。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
期末作业
(2.PPT Presentation 50%)
举个例子:SIGIR
2011最佳论文:
Find It If You Can: A Game for Modeling
Different Types of Web Search Success Using
Interaction Data
论文的主要研究目标是理解高水平搜索用户的
行为。
局限于实验室中的小规模受限环境,要么在面
对大规模日志数据时由于要推导出用户查询意
图等其他因素而难以开展
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
期末作业
(2.PPT Presentation 50%)
 该方向研究成果跟哪些产业相关?
回答: 可能导致比Google, Baidu更好的搜索引擎
出现。
 该方向研究成果可以给哪些企业/产品带来好处?
所有可能结合社区型(能够给用户兴趣建模)信息搜索,
例如QQ, Taobao, 学术搜索等等。
 基于研究成果,制定一个具体的创业计划?讲讲你
设想的商业模式。
追踪淘宝网积分比较高的买家的行为。或者经常借
书的图书馆用户建立用户模型。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
互联网舆情分析与管理,网络审计(2012)
-
网络安全概述
国家的安全管理条例
网络舆情
相关科研机构和企业
案例分析
互联网审计
雷 凯 ([email protected])
北京大学深圳研究生院· 互联网研究中心
2012年2月15日 · 深圳
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
一、网络安全概述








网络及信息安全
网络安全面临的威胁
信息安全
网络安全的基本需求
网络安全机制
安全管理策略
计算机网络安全等级
主要解决途径
 网络与信息安全、网络人行为的关系
 国际网络与信息安全动态
 网络信息安全动态及现状
1.网络与信息安全总体内容
(1)涉及电子、通讯、计算机、应用数据、数
论、信息论等现代技术
(2)各种民间商业活动的增加,给网络安全带
来严峻形势。
(3)特点:技术含量高,应用范围广,市场前
景广阔。安全需求独特、复杂、难度大。处理
速度快,准确性,实时性要求高
2、网络安全面临人的威胁
 非人为因素
自然灾害,设备老化、断电、电磁泄露,存储
损坏
 人为因素
 无意失误 安全漏洞、后门
 和恶意攻击 。黑客,乱发帖子,恶意流量(
360刷机事件),竞价排名作假,竞争对手恶意
攻击,虚假广告灯。
 复杂事件、网络舆论 (茉莉花革命、郭美美事
件)
3、网络安全的基本需求
(1)保密性
(2)完整性
(3)可用性
(4)可控性
(5)可追溯性
4、行为安全管理策略
 分配权限,明确责任。(上网认证、实名
制游戏等)
可控性
 加强管理,建立审计和跟踪分析系统。
可追溯性
 加强网络安全教育,提高整体安全意识。
本讲的主要目的 (QQ, 游戏盗号,作为
技术人员内部违规修改数据都是犯罪)
二、国家信息安全保护制度
 信息安全技术标准只是度量信息系统或产品
安全性的技术规范,但信息安全技术标准的
实施必须通过信息安全法规来保障。
 1994年2月18日,中华人民共和国国务院发
布了第147号令《中华人民共和国计算机信
息系统安全保护条例》(以下简称《安全保
护条例》),为计算机信息系统提供了安全
保护制度。
国际联网备案与媒体进出境制度
 国际联网备案与媒体进出境制度是保障国家安全与利益的
重要手段之一,《安全保护条例》第十一条规定:进行国
际联网的计算机信息系统,由计算机信息系统的使用单位
报省级以上人民政府公安机关备案。 第十二条规定:运
输、携带、邮寄计算机信息媒体进出境的,应当如实向海
关申报。
 中国互联网络协会和各地公安机关相继建立了不良信息公
众举报网站,例如,公安部网络违法案件举报网站(
http://www.cyberpolice.cn),中国互联网络协会主
办的违法和不良信息举报中心(http://net.china.cn)
。
国际联网备案与媒体进出境制度
 http://www.miibeian.gov.cn/publish/query/index
First.action
 好多方式都查不到,最后在
安全管理与计算机犯罪报告制度

《安全保护条例》第十三条和第十四条分别规定:计算
机信息系统的使用单位应当建立健全安全管理制度,负责本
单位计算机信息系统的安全保护工作。对计算机信息系统中
发生的案件,有关使用单位应当在24小时内向当地县级以上
人民政府公安机关报告。

我国1997年全面修订《中华人民共和国刑法》时,分
别加进了第二百八十五条非法侵入计算机信息系统罪、第二
百八十六条破坏计算机信息系统罪和第二百八十七条利用计
算机实施的各类犯罪条款。
表: 国家信息安全保护常用法律法规
法律法规名称
颁布部门
颁布年份
中华人民共和国计算机信息系统安全保护条例
国务院147号令
1994-2-18
中国公用计算机互联网国际联网管理办法
邮电部493号令
1996-4-3
专用网与公用网联网的暂行规定
邮电部
1996-7-24
计算机信息系统安全专用产品检测和销售许可证管理办法 公安部令第32号令
1997-12-12
计算机信息网络国际联网安全保护管理办法
国务院批准公安部发布
1997-12-30
金融机构计算机信息系统安全保护工作暂行规定
公安部和中国人民银行
1998-8-31
中华人民共和国保守国家秘密法
全国人大常务委员会
1988-9-5
计算机信息系统国际联网保密管理规定
国家保密局
2000-1-1
计算机病毒防治产品评级准则GA 243-2000
公安部公共安全行业标准
2000-3-20
计算机病毒防治管理办法
公安部第51号令
2000-4-26
互联网信息服务管理办法
国务院第292号令
2000-9-20
续表: 国家信息安全保护常用法律法规
联网单位安全员管理办法
公安部
2000-9-29
互联网电子公告服务管理规定
信息产业部
2000-11-7
互联网站从事登载新闻业务管理暂行规定
国务院新闻办公室
关于维护互联网安全的决定
全国人民代表大会常务委员会
关于进一步加强互联网上网服务营业场所管理的通知
国务院办公厅
中国互联网行业自律公约
中国互联网协会
互联网出版管理暂行规定
新闻出版总署、信息产业部
互联网上网服务营业场所管理条例
国务院第363号令
2002-9-29
反垃圾邮件规范
中国互联网协会
2003-2-26
互联网站禁止传播淫秽色情等不良信息自律规范
中国互联网协会
2004-6-10
中华人民共和国电子签名法
全国人民代表大会常务委员会
2004-8-28
2000-11-10
2000-12-2
2001-4-3
2002-3-26
2002-8-1
互联网舆情分析与管理
 网络舆情 (节选至百度百科)
 舆情是由个人以及各种社会群体构成的公众,在一定的历史阶
段和社会空间内,对自己关心或与自身利益紧密相关的各种公
共事务所持有的多种情绪、意愿、态度和意见交错的总和。
 该定义明确了舆情的主体、客体和本体。
 不过随着社会的发展,人们越来越趋向于对任何时间发表自己
的观点和看法,从而为舆情的定义赋予了新的内涵。一方面,
舆情的客体不仅包含公共事务,一些私人事务也被人们所讨论
甚至产生较大影响,如“郭美美”这一私人事件由于关涉道德
伦理迅速演变为公众话题,一度成为人们最为关注的话题之一
;另一方面,舆情所隐含的不仅是人们的情绪、态度等,不少
言论具有较高的鼓动性,表现出一定的行为倾向,如2008奥
运火炬传递期间的“家乐福事件”等。
表:2011年度20件网络热点事件 (网络贴文数量)
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情态势





多发化:天天有看点、网络很热闹。
海量化:负面事件引发的舆情多。
一边倒:涉官、富、警等的舆情一边倒。
交互扩散:网上网下、媒体、网民之间。
非预期性: 松花江污染事件中,政府善意掩盖事实的停水公告导
致了谣言、流言的舆情高涨,政府失措。
 标签化:标签性概念成为社会流行语:躲猫猫、七十码、范跑跑
、俯卧撑、打酱油、楼倒倒等。
 恶搞化、无厘头化: 对事件舆情进行汇编整合,形成具有艺术色
彩的段子、顺口溜、视频等,如正龙拍虎、烈女传(邓玉娇)等
。
2011年网络舆论载体新的动向(一)
 微博大行其道
 微博极大地影响着中国互联网舆论的广度和深
度。2010年底的6311万剧增至2011年6月底
的1.95亿(现已突破2亿个),除新浪、腾讯
、搜狐、网易四大门户之外,人民网、新华社
、央视等新闻媒体以及天涯、Tom等社交媒体
也推出了自己的微博,“百度i吧”、
“ google+”
 过去两年间,微博成为用户增长最快的互联网
应用模式。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
2011年网络舆论载体新的动向(二)
 社交网站(SNS)的社会动员潜力
 社交网站(SNS)允许用户创造个人页面,列
出好友名单和自由发表评论。在中国,人人网
、占座网、海内网、蚂蚁网、一起网、开心网
、360圈等SNS网站大量涌现。
 社交网站具有大众传播和私人通信的双重特性
,信息只在个人圈子里流转,具有较强的私密
性,不便于站方和政府部门监管。
 2011年,从英国伦敦大骚乱、美国“占领华尔
街”运动,到西亚北非“茉莉花运动”,社会
化媒体都起到了某种社会动员的作用。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
2011年网络舆论载体新的动向(三)
 论坛/BBS丧失网络舆论“霸主”地位
 论坛/BBS的“意见领袖”继续大规模流失,不少人
转战微博,或退守个人博客,或前进到境外的“推
特”(Twitter)。原创性思想性贴文的减少。
 比较而言,地区性BBS并不太悲观,凭借独特的地
方内容特色,以及对同城社交资源的整合能力,在
一定程度避免了微博的冲击。
 当人们需要对某个热点事件做出全面、深入、理性
的了解和分析时,论坛/BBS仍然有着不可替代的作
用。论坛/BBS所具备的整合、分类、深度挖掘等优
势,能对纷繁杂乱的舆论进行梳理和价值导向
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
2011年网络舆论载体新的动向(四)
 移动互联崭露头角
 中国手机网民规模为3.18亿人,在网民中的比例高达
65.5% ,可以随时随地上网发布和浏览信息、发表和分
享意见。
 随时、随地、随人的“公民报道”成为可能,正在深刻
改变社会舆论的生成机制。任何一个在场的人都可能一
转身,上网发送文字、图片、视频,给政府的事件处置
及舆情应对挑战。
 2011年出现的“随手拍”活动,把移动互联的功效发挥
得较为充分。春节期间,微博发起“随手拍解救乞讨儿
童”活动。随后,网上出现了“随手拍解救大龄女青年
”等活动,接着,又有网友发起“随手拍政府大楼”的
活动。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络时代的社会政治影响

众声喧哗的网络:谁都在说,谁都想说,谁都准备说。

麦克风式的网络:一个地方性声音可以传遍全国。

注意力为王的网络:有些人希望被注意,一被注意就成名;有些人害怕被注
意一被注意就前程尽毁。

媒介主位的网络:“中弹即到”效应,网民受制于网络。

情绪弥漫的网络: 怒火之战、口水之战——大杂烩充斥着各个讨论区。

强力施暴的网络: 烧烤式聚焦,网民对被关注对象进行评论、谴责、谩骂、
侮辱、诽谤、恐吓以及人身攻击。

无处藏身的网络:揭露型网络,网民通过人肉搜索将受关注者信息全面揭露
,使人无处藏身。

人为操控的网络:网络推手,网络策划公司,网络领袖。

网络:无处不在、无所不能、无法逃避!
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网民的诉求取向
 1、探寻真相
陕西虎照真假的真相;湖南副市长死亡的真相等。
 2、价值裁判
武大张在元事件对武大人文精神缺乏的批判
邓玉娇案对邓玉娇责任的判断
 3、利益表达
重庆出租车事件;上海钓鱼执法事件
 4、社会抗议
表达自我情绪、不满,无明确指向
 5、行动动员
奥运MSN”爱我中国”; 网络营救;网络抵制;人肉搜索等
 6、自我表现

顺口溜;流行语;网络恶搞等
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
互联网舆情分析与管理
 舆情分析与管理(监控)
 整合互联网信息采集技术及信息智能处理技术通过对互联网海
量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现
用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、
报告、图表等分析结果,为客户全面掌握群众思想动态,做出
正确舆论引导,提供分析依据。
互联网舆情相关研究














突发事件网络舆情监测与预警系统
突发事件网络舆情演化要素与政府治理研究;
网络舆情监督与预防腐败
网络舆情的司法影响
突发事件网络舆情政府回应机制研究;
网络舆情中反沉默螺旋现象研究
网络舆情喷涌型突发事件特征分析
基于受众中心模式的网民选择性接触与满足行为
突发事件网络舆情演变中的网民主体意识研究
网络民意与网络舆论审判
基于网络的社会思潮传播机制研究
网络民意的反向政治认知研究
网络舆情风暴与舆情漩涡现象解析
…………
如何面对媒体与回应舆情
1、以真诚的态度面对媒体的采访
不是对媒体表现出厌烦、躲避、敌意的态度,不是以“无可
奉告”或“最牛官话”来搪塞。
2、以谦卑的心态面对网民的质疑
对网民表达应有的礼貌、尊重、理解,而不是对网民表现出
敌视、鄙视、不满或愤恨。
3、在面对事件时有承担的勇气和行为
站出来说话,站出来回应,站出来表明态度。
4、要勇于承认政府和官员都会犯错误
认识到某一次的错误是为了避免更多的“衍生错误”行为。
如何面对媒体与回应舆情
5. 回应舆情不要前后矛盾
贵州安顺枪击事件、山西疫苗事件,虽然也都召开了新闻发
布会,有所谓“信息公开”的形式。但发布内容闪烁其词,甚至前后
矛盾,令事件发展一波三折,引起更大的混乱。恩施邓玉娇案,警
方通报前后不一,引起网民质疑。
6. 回应舆情不仅讲技巧,更要正视和重视问题和矛盾
回应舆情不仅要讲外交辞令,对网民关注的问题矛盾要正视,
要以谦卑的心态和诚恳的态度承认政府的问题、官员的错误,要把
自己的姿态放低,以低姿态来消解舆情。
网络舆情的商业价值
网络社区的到来,实现了公关传播中的平衡双向沟通。
平面媒体、电波媒体、视频媒体、
网络1.0
信息编码
信息解码
调
整
沟
通
信息输出
品牌
平衡双向沟通
与产品
信息反馈
策
目标消费
者
略
信息解码
承载着民意
反馈的90%
信息编码
网络社区、博客、评论
网络舆情的产业口碑营销
 网络社区的到来,意味着互动性口碑营销时代的来临。
舆情监控
话题炒作
口碑
营销
活动引导
圈子营销
Text3
话题维护
Text5
事件营销
网络舆情监测的相关关键技术(一)
 网络舆情采集与提取技术
 网络舆情主要通过新闻、论坛/BBS、博客、即
时通信软件等渠道形成和传播,这些通道的承
载体主要为动态网页,它们承载着松散的结构
化信息,使得舆情信息的有效抽取很有难度。
 关键在于抓得快,抓得准,抓得全
 索引更新也要快,一般多级索引,内容为主导
 分布式处理,多级存储构架
 云存储模式,支持无限扩展
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情监测的相关关键技术(二)
 网络舆情话题发现与追踪技术
 网民讨论的话题繁多,涵盖社会方方面面,如何
从海量信息中找到热点、敏感话题,并对其趋势
变化进行追踪成为研究热点。早期的研究思路是
基于文本聚类,即文本的关键词作为文本的特征
。这种方法虽然能将一个大类话题下的文本进行
聚合,但没有保证话题的可读性与准确性。
 在此思路的基础上进行改进,实现了话题发现与
追踪:即将文本聚类问题转换为话题特征聚类问
题,并依据事件对语言文本信息流进行重新组织
与利用。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情监测的相关关键技术(三)
 网络舆情倾向性分析技术:
 通过倾向性分析可以明确网络传播者所蕴涵的感情
、态度、观点、立场、意图等主观反映。比如新浪
网的“新闻心情排行”将用户阅读新闻评论时的心
情划分。
 对舆情文本进行倾向性分析,实际上就是试图用计
算机实现根据文本的内容提炼出文本作者的情感方
向的目标。
 通过判断网络环境下倾向性特征词的特点和类型,
并进行语气极性判别和标注,从而构建一个面向互
联网的倾向性语气词典,建设一定规模的标准数据
集,为中文倾向性分析的深入研究提供支持。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情监测的相关关键技术(四)
 多文档自动文摘技术:
 新闻、帖子、博文等页面都包含着垃圾信息,
多文档自动摘要技术能对页面内容进行过滤,
并提炼成概要信息,便于查询和检索。
 这个课题很难,有一定的研究成果,但是效果
不理想。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些主要科研机构(1)
 北大网络所李晓明教授
 (2003)提出了一个利用计算机技术、针对某一
特定主题,对互联网上海量信息进行采样收集
与分析的模型(InfoMall, 下一讲,黄连恩老师
会详细介绍)。
 该模型包括样本空间的选取、主题特征的提取
、目标参量的设置、网页收集、数据后处理几
个模块。需要强调的是,模型在目标参量设置
上提出“主题强度参量体系”,对样本空间的
网页从宏观统计和变化过程,绝对数量和相对
数量,总体信息和独立信息这三个维度进行分
析。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些主要科研机构(2)
 人民日报社网络中心舆情监测室
 人民日报社有关机构自2006年起就开始逐步探索网络舆情监测研
究课题,并于2008年正式组建人民日报社网络中心舆情监测室。
目前,监测室拥有具备舆论传播学、社会学、经济学、公共管理等
背景的舆情研究分析人员数十名。形成了一套较完整的舆情监测理
论体系、工作方法、作业流程和应用技术。
 代表性工作主要有中国社科院年度《社会蓝皮书》网络舆情课题(
2007年起)、《文化蓝皮书》课题(2008年起)、清华大学年度
《传媒蓝皮书》课题(2008年起)
 主要还包括:网络舆情监测报告、人民网舆情频道、《网络舆情》
杂志(内参)
 《网络舆情》内参,国家正式刊号(CN11-5803/D),是人民
日报社主管,人民网主办的我国目前唯一一分以网络信息为主要内
容、反映网络民意和动向的有国家正式刊号的杂志
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些主要科研机构(3)
 中国传媒大学网络舆情(口碑)研究所
 (英文简称IRI)是国内权威的专于为政府服务的网络舆情
研究和咨询机构。IRI成立于2007年底,是中国传媒大学采
用新模式、新机制的独立核算的创新型科研机构。
 五十多人的专业全职研究队伍,他们主要来自北京大学、
社科院、中国传媒大学的新闻传播、信息管理、数据统计
挖掘等专业的博士、硕士等高素质人员以及从美国、英国
、意大利、法国留学归国的人才,是中国规模最大的网络
舆情研究咨询机构
 制定了国家级的网络舆情指数体系,解决了国家用指数来
衡量网络舆情从而更加科学研判的国家难题。国内首次建
立了通过对网络舆情量化及指数化实现网络舆情的科学收
集、分析研判和预警对策一整套科学规范的工作体系
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些代表性企业(1)
 北大方正
 方正公司长期致力于网络舆情监测分析技术研究与推广。是国
内网络舆情监测软件的先行者和标准制定者。目前方正公司的
舆情监测软件已经覆盖行业市场70%以上。据方正公司产品
负责人李崇纲介绍,方正智思舆情分析应对整体解决方案能够
整合互联网信息采集技术及信息智能处理技术,通过对新闻、
专题、评论、论坛、主贴、回帖、博客、贴吧进行数据采集,
针对关键词和摘要的智能化分析和处理,对网络上的信息进行
跟踪监测,提取与事件相关的舆情信息,最终得出舆情分析,
同时制定出合理的处理方式,为政府机构与客户决策层全面掌
握舆情动态,做出正确舆论引导,提供分析依据。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些代表性企业(2)
 中科天玑公司

中科天玑公司(2008)依托中国科学院计算技术研究所设计并开发了
天玑网络舆情监测系统,先后深入研究十余年,目前已推出3.0版本
。天玑舆情监测系统实时定向采集互联网新闻、论坛、博客等通道的
信息,抽取舆情要素,发现舆情热点,挖掘舆情敏感话题,研判舆情
态势,能快速有效地提升政府机构以及企业的舆情掌握与危机公关能
力。天玑舆情系统集舆情采、看、编、处、报、管为一体,为用户在
第一时间内获取网络信息,并对信息进行加工、整理、筛选、预警,
为用户快速有效决策提供有利的保证。天玑舆情监测系统分为政府版
、金融版与境外版三个系列。天玑舆情监测系统目前已经应用于中国
证监会、中国银监会、工信部、质检总局、总参、中国工商银行、中
国移动、上海、福建、新疆各省舆情监测部门。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些代表性企业(3)
 北京拓尔思信息技术股份有限公司
 (300229.SH,下称拓尔思)进入资本市场,登
陆上交所创业板
 该公司互联网舆情管理系统“广泛应用在政府
、公检法、电力、石化、军工、通信、媒体、
医药等各个行业”,并为某电网公司打造了“
国内最大的企业级舆情项目”——覆盖31个省
市3000多用户,采集超过3000个站点,每年
可以监测1亿条数据,3TB的数据量。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络舆情分析的一些代表性企业(4)
 北京天亚科创软件有限公司
 互联网搜索与网络舆情监测技术研究、开发、
销售、服务为一体的高新技术软件企业。利用
分布式的云计算搜索平台,采用倒排拉链方式
,我们开发的舆情监测系统支持对海量信息库
的高效搜索以及对于各种新闻,博客和论坛等
网站进行垂直抓取;
 采用自然语言分析处理技术和自有算法的网页
结构分析,可以对抓取到的数据进行准确的分
析和判断,从而为政府和企业客户提供精准有
效的互联网舆情数据服务。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
案例分析:Rank舆情监控系统
 北京天亚科创软件有限公司
 团队和运行情况比较了解
 了解整个项目分析,立项,研发到现在的盈利
过程
 创业型公司,规模还不大。
 几个百度“有啊”的高级工程师出来自己创业
的。
 复制了硅谷比较成功企业模式
 比较专注,有之前成功的产业探索的经验。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
技术优势:Rank舆情监控系统 (一)
 1、 数据的完备性
 Rank舆情监控系统抓取的范围涵盖新闻网站、论坛、博客和
微博,7*24小时的无缝抓取全网信息。
 2、 数据的准确性
 Rank舆情监控系统通过多层的保证机制,无论是数据的相关
性、正负面的属性判断都能做到准确率在99%以上。
 3、 数据的及时性
 对重要文章,尤其是突发负面信息的快速响应是考核舆情监控
系统的重要指标。Rank舆情监控系统的高效率的采集和处理
技术可以保证对重要程度最高的网站,抓取频率控制在5分钟
以内,次重要的网站控制在30分钟内。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
技术优势:Rank舆情监控系统 (二)
 4、 构架的先进性
 Rank舆情监控系统采用云计算技术,分布式的
搜索平台,利用倒拉排链的方式,支持对信息
库的高效搜索。
 5、 系统的个性化
 Rank舆情监控系统可以完全根据客户需求来订
制系统,基于云计算的SaaS模式。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
系统模块:Rank舆情监控系统 (三)
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
系统模块:Rank舆情监控系统 (四)
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
产品亮点:Rank舆情监控系统 (五)
 舆情自动发现与追踪
(可视化)
对于用户设定的重点
舆情信息,系统提供
舆情的走向分析。从
第一天的可能几家网
站的发布到高潮期的
多家网站的转载等数
据一目了然。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
产品亮点:Rank舆情监控系统 (六)
 舆情地域性分布
 对于某些舆情来说,在什么地域传播对于政府或
企业来说具有重要的意义。
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
性能分析:Rank舆情监控系统 (六)
性能参数
性能指标
数据处理能力
数据处理时间
数据采集范围
定向采集能力
平面媒体采集能力
SNS类监测
10亿页面以上
1分钟内
全网
可随用户随时进行配置
全国各地300家主流平面媒体
可监测新浪、sohu、QQ等微博。
A:系统集成
B:半系统集成
C:数据服务(SAAS)
A:网页分布式存储。
B:爬虫分布式抓取。
C:客户数据可指定存储。
系统初步判定->特定模式识别->人工判定(准
确率>99%)
准确率>99%
可服务于客户的方式
系统的可扩充性
新闻的分类准确性
新闻正负面等属性准确性
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
2012年网络舆情展望
 微博客达到巅峰,部分网友回归BBS和博客
 运营商的资金不足(新浪)、信息量大而杂乱、140个字(浮
躁和盲目、无法考证谣言和非理性情绪)
 网上社交娱乐更加广泛,移动互联助力发展
 米聊、微信、LBS(基于地理位置的服务)、3G网络质量的
提高和资费的下调
 传统媒体发展变革,全媒体时代加速到来
 三网融合、云电视、网络电视、电台
 网络问政持续推进,舆情热点继续升温

世界经济持续低迷、政府换届、错综复杂且日益加深的社会矛盾
北京大学深圳互联网中心
http://netlab.szpku.edu.cn
网络审计的概念
 网络审计是指审计人员基于互联网,借助现代
信息技术,运用专门的方法,通过人机结合,
对被审计单位的网络会计信息系统的开发过程
及其本身的合规性、可靠性和有效性以及基于
网络的会计信息的真实性、合法性进行远程审
计。
 审计系统是一种为事后观察、分析操作或安全
违规事件提供支持的系统,它广泛地存在于操
作系统、数据库系统和应用系统中,记录、分
析并报告系统中的普通或安全事件。
为什么要进行网络审计?
 我们的网络中到底发生了什么
 网络为什么慢、流量被什么应用吃光了?
 如何进行事后的追踪
 是谁把内部文档传送出去了?谁在论坛上
造谣生事?
 如何对网络进行有效的监控
 谁在上班时间打游戏了,炒股票了?
 如何改进网络的安全策略
 怎么会有外面的人进来内部网络?
中国法律法规要求
 《计算机信息网络国际互联网安全保护管理办法》
 《互联网安全保护技术措施规定》
 《计算机信息系统安全保护管理规定》
 要以本地重点互联网服务单位、联网单位以及有一
定规模和影响的网上服务为重点,
 抓好防范有害信息传播等技术措施落实,
 抓好系统运行日志、用户登录日志等信息记录留存
措施的落实。
 各省地市网监的管理力度随着互联网犯罪的增加日益
加强,在继网吧审计之后,酒店、企业、各大院校的
互联网监管的政策法则将日益完善。各地教育部也对
各属高校,各区、县级教育局、教育单位发文,要求
对加强互联网管理,上网记录历史保存90天。
 我们实验室曾经也参加培训和认证 (刘立、高晓飞)
相关的制度要求
 等级保护

国家颁布的安全等级保护技术要求,在确
立为第二级(指导保护级)以及以上级的
信息系统中必须建立并保存下面的各种访
问日志
 公安部82号令

明确要求互联网服务提供者和连接到互联
网上的企事业单位必须记录、跟踪网络运
行状态,监测互联网安全事件
 萨班斯法案

在美国上市公司必须遵循的“萨班斯
(SOX)法案” 中要求对企业内部网络信
息系统进行评估,其中涉及对业务系统操
作、数据库访问等业务行为的审计
互联网安全审计市场前景广阔
 IDC研究显示,对违反企业政策和政府及行业规范的外流信
息的监测与预防极为重要。
 这一新兴的安全市场(IDC将其定义为外流信息监控,简称
“OCC”)营收将在2009年增至19亿美元。
 IDC安全产品和服务研究经理Brian Burke称,越来越多的
组织需要应对具有潜在破坏力的信息传输以及违反政府及
行业规范的信息的解决方案。
 而这些需求现在可以通过监测、保护/加密、过滤和阻
断电子邮件、即时通讯、P2P、文件传送、网上发布和
其他通讯传输方式中的外流信息的解决方案得以满足。
 OCC在使企业信息安全符合外部规范要求和内部政策中
均发挥着重要作用,
 网络审计市场需求快速增长(广东市场“井喷”现象)
安全审计主要模块
审计系统分类
 面向业务的信息安全审计
 网络安全审计
 操作系统审计
面向业务的信息安全审计
 中国青年报曾报道,上海一电脑高手,方某今年25岁,
学的是计算机专业,曾是某超市分店资讯组组长。方某
利用职务之便,设计非法软件程序,进入超市业务系统,
即超市收银系统的数据库,通过修改超市收银系统的数
据库数据信息,每天将超市的销售记录的20%营业款
自动删除,并将收入转存入自己的账户。从2004年6
月至2005年8月期间,方某等人截留侵吞超市3家门店
营业款共计397万余元之多。
 是对用户业务的安全审计,与用户的各项应用业务有密
切的关系,是信息安全审计系统中重要的组成部分,它
从用户的业务安全角度出发,思考和分析用户的网络业
务中所存在的脆弱点和风险。主要是针对内部人员,他
们利用职务之便,违规操作导致的安全问题日益频繁和
突出,这些操作都与客户的业务息息相关。
网络安全管理审计
 网络安全审计系统应用于企业,能够规范员工
上网行为、提高工作效率、防止企业机密资料
外泄,为企业的网络提供保障,使企业的网络
资源发挥应有的经济效益
 内网安全审计
 外网接入审计
操作系统审计
 审计子系统作为操作系统的一个重要组成部分
对于监督系统的正常运行,保障安全策略的正
确实施,构造计算机入侵检测系统等都具有十
分重要的意义。
 一个安全操作系统的审计系统就是对系统中有
关安全的活动进行记录,检查及审核.它的主要
目的就是检测和阻止非法用户对计算机系统的
入侵并显示合法用户的误操作。
网络审计的主要技术内容
•
•
•
•
•
•
•
•
•
•
•
•
•
网络连接审计
协议审计
端口审计
拨号连接审计
个人帐户审计
文件访问审计
数据审计
流量统计审计
数据库审计
WEB服务器审计
安全事件再现审计
系统统计分析
……
审计产品部署示例
Internet
审计引擎
Sniffer Server
monitoring/analysis
集线器
控制台
Linux
windows2k
windows2k
网络审计的功能
 规范员工上网行为 提高办公效率
 可以管理多达45种网络协议,包括网页访问,聊天
工具、股票 工具、WEBMAIL,游戏等占用大量工
作时间的网络滥用行为,从而提高工作效率。
 网络应用优化 提升带宽利用率
 通过流量排名工具,来 发现并管理网络中的异常
网络行为;
 封堵有害流量 保证网络畅通
 有效封堵BT ,P2P,迅雷等下载应用与QQ等聊天
工具,从而保证网络畅通。
互联网信息工程研发中心(CIRE)
http://netlab.szpku.edu.cn
网络审计的功能
 敏感资料泄密防护 保证组织信息资产安全
管理员可以通过网络哨兵中的各种内容审计工具,来
发现网络中的对内部敏感资料的外泄企图和事实;
 全面的报表分析 提供准确的决策依据
通过各种报表,管理人员对内部每个员工使用互联网的
情况了如指掌,针对上述网络资源管理中的每个问题
都能得到数据依据,做相关决策时更准确。
总结
 安全审计是一类事后安全技术,记录有关安全
事件的信息或提供调查手段,有助于摸清安全
事件发生的原因并认定事件责任,可以起到约
束以后安全事件再度发生的作用
相关工作
1. 05级楚玉强论文:《Maze系统中基于贝叶斯分
类算法的敏感资源识别》
2. 06级孙晓的论文:《基于监控的BT、eMule系统
资源扩散特征分析》
3. 数据库 王腾蛟老师等, 2011深港科技创新大奖
“基于互联网突发事件检测与快速响应支持平台”
4. InfoMall
5. 任子行 (网吧审计系统,正准备上市)
6. 张凯 王思博 宋伟伟:微博搜索。
本讲小结




介绍本门课的安排
强调了网络行为合理、合法的重要性
分析了网络舆情信息分析管理的状况、重要性
介绍了相关网络舆情的关键技术、科研机构和
企业,并进行了案例分析
 网络审计 – 机构内部网络行为安全保障机制
理性操作、增强防范、善待网络、文明上网
互联网信息工程研发中心(CIRE)
http://netlab.szpku.edu.cn