Data Analysis using Computer

Download Report

Transcript Data Analysis using Computer

컴퓨터를 이용한 데이터 분석기법의
간단한 소개
부산대학교 물리학과 교수 유인권
[email protected]
1.
2.
3.
4.
강의 목적 및 개요
무엇을 할 것인가 ? 왜?
어떻게 할 것인가?
연습
1. 강의 목적 및 개요
•
•
강의 목적 :
–
이해에 대한 접근 방식 – 직관과 분석
–
‘이론과 실험’ or ‘실험과 이론’의 상관관계
–
컴퓨터 사용에 대한 호기심과 흥미 고취
–
IT 전문가, 사회적 영향(WWW)
–
향후 연구, 개발에 대한 기대
강의 개요 :
1. 무엇을 할 것인가? 왜?
2. 어떻게 할 것인가?
3. 컴퓨터 이용의 소개, 연습
핵물리학교2005@SKKU
데이터분석 강의
2
1.1 무엇을 할 것인가? 왜?
• 연구 개발에 대한 순서도
인간의 무지
가설
가설의 전개
해석
결론/오차
예측
확인가능성?
Alternative?
결과 분석
핵물리학교2005@SKKU
실
험
장치 개발 / 기술
데이터분석 강의
실험 구상
3
1.2 생각 / 자료 (데이터) 의 전개
해석학적 전개
논리적 도구 : 수학
계산적 전개
핵물리학교2005@SKKU
데이터분석 강의
4
1.3 예측, 확인, 해석
• 가설의 구체화 : 모델 설정
– 해석학적 예측의 한계
– 몬테카를로 모의 실험 (MC simulation)
• 모의 실험 : 결과의 예측
• 실제 실험 : 모의 실험 결과와 비교
– 모의 실험의 약점
– 실제 실험의 약점
• 해석의 재료 : 다른 변수(오차)에 대한 이해
• 새로운 모델의 제시 : “이상과 현실”
핵물리학교2005@SKKU
데이터분석 강의
5
2. 어떻게 할 것인가?
고에너지 물리학 실험의 구조
고에너지 (고운동량) 충돌
(생성) 입자의 검출
모델
데이터의 획득
결과와 오차
핵물리학교2005@SKKU
데이터 분석
데이터분석 강의
6
2.1 충돌 실험 데이터
• Beam – Collision – Production – Detection
• RAW data : 모든 검출기들로부터의 모든 디지털 정보, 압축
(데이터의 손실 : dead time)
• Data Array! 데이터베이스!!
– Single- vs. Multi-Parameter Analysis
– Function, Histogram, Graph, Picture
– MC Database
• On/Off line Analysis : Event Builder
–
–
–
–
(Collision) Event building ? g-p, p-p, p-p, p-d, p-A, A-A
Track Reconstruction : 검출된 입자들의 경로 만들기
Reconstruction Chain
Beam/Event/Track Selection
• Acceptance / Efficiency Correction : HOW?
핵물리학교2005@SKKU
데이터분석 강의
7
2.1.1 실험 데이터의 종류
• RAW data : on storage media
– Evenwise saved with conditions, trigger/beam informations
• Reconstructed data : DST
– Trackwise recombined with full information
– http://na49info.cern.ch/cgi-bin/w3-msql/na49/Status/production.html
• Selected data : mini-DST, micro-DST, nano-DST..
– 관심에 따라 선택한 데이터만 저장
– 분석 도구에 따라 포맷이 다양 : ntuple (PAW), tree (ROOT)
핵물리학교2005@SKKU
데이터분석 강의
8
2.1.2 실험 데이터의 구조
• Beam time
• RUN : 편의상 데이터를 나눈 단위 (e.g. ~30000 events)
• Event variables :
– Impact parameter, Centarlity, beam info, Main Vertex
• Tracks (particle) : Primary and Secondary Particles
• Track variables :
– All possible physical variables, dE/dx, p, mass, charge etc.
– Fit-quality info for the track
핵물리학교2005@SKKU
데이터분석 강의
9
2.2.1 컴퓨터에 대한 기본
• Hardware :
– CPU : Intel x86, Mac, Alpha, SGI ..
– Random Access Memory (RAM), Read Only Memory (ROM)
– Storage : Disk, Tape, Exabyte ..
– BUS : (E)IDE, SATA(raid), PCI, SCSI, ISA, AGP, VESA ..
• Operating System :
– Apple : Mac OS
– MS : DOS, Window, NT
– IBM : OS2, OS9 ..
– Unix : Linux, HP-UX, Irix, AIX, Solaris ..
• Software Package : Precompiled or Source
핵물리학교2005@SKKU
데이터분석 강의
10
2.2.2 Linux
• Linux vs. Windows
– Copyleft vs. copyright
– Development (user=developer) vs. Commercial (only user)
– Open source vs. Secret source
– Universality vs. CPU dependent (Intel)
– Stable X-window system vs. instable Single window system
– Multi-tasking and – user vs. Single- stand-alone style
– Expert-friendly vs. user-friendly
– …
• Linux :
– Kernel 2.4…
– Various names : Red Hat, Debian, SuSE, Hancom, SLC…
핵물리학교2005@SKKU
데이터분석 강의
11
2.3 Programing
Algorith
m
Programing
(C, C++, Fortran)
Link
Compile
(libraries, subroutines)
(Language Grammar,
CPU, OS Environment
dependent)
Execution
핵물리학교2005@SKKU
데이터분석 강의
Interpreter
12
2.3.1 Packages & OOP
• Cernlib : 고에너지 물리 데이터 분석용 패키지 모음
–
–
http://cernlib.web.cern.ch/cernlib/version.html
Physics Analysis Workstation (PAW)
– hbook, kuip, kxterm, minuit, zebra etc.
– Fortran based (old), no more development
• ROOT : new Object Oriented Tool
– http://root.cern.ch
– C++ based, all inclusive framework tool
• Object Oriented Programing
–
Object Building
– Simple Adoption
– Preloading libraries
핵물리학교2005@SKKU
데이터분석 강의
13
2.3.2
•
•
•
•
Origin : NA49 Collaboration
Interactive / bground working
Grafic User Interface
OOP : user = developer, sharing LIBs
– own personal lib/Class, group/collab. lib/Class
– root49, STARoot, ALIRoot, CBMRoot
핵물리학교2005@SKKU
데이터분석 강의
14
2.4 Learning Programing
• Sad “hello world” story
– 언어는 약속된 습관
– 목적의식 필요
– 무조건 흉내/사용 : 문법책부터 읽지 말 것
• Demo program + Manual
–
–
–
–
예제 프로그램 활용
목적을 분명히 할 것
복사 / 편집 / 사용법의 경험적 습득
문법책 참고 / 논리 (수학) 적 사고
핵물리학교2005@SKKU
데이터분석 강의
15
3. 연습 계획 및 개요 / 소개
• VNC for WinXP 설치 :
–
http://nuri.pusan.ac.kr/~hipex/utility/vnc-3.3.3r2_x86_win32.zip
• Linux VNC (Virtual Network Computing) Server 연
결:
– radium.phys.pusan.ac.kr:1 = user group 1
– lead.phys.pusan.ac.kr:1 = user group 2
– Fermium.phys.pusan.ac.kr = user group 3
• Login : nps / Password : 핵물리학교
• Shell open : GUI  click!
• 자기 디렉토리 만들기
nps@lead:~>mkdir mine
nps@lead:~>cd mine  여기를 본거지로 활용할 것
핵물리학교2005@SKKU
데이터분석 강의
16
3. 연습
• Root interactive 연습
– nps@lead:~/mine>root
– root [0] .x demos.C
• 프로그래밍 편집 해보기 (다른 shell open)
– nps@lead:~/mine>cp –r /cern/root/macros ~/mine/
• Emacs (텍스트 에디터 열기)
– Open mine/macros/demos.C  각각의 demo 버튼이 어떤 프로그램을 불러
내는지 들여다 본다.
– 그 차례대로(!) 프로그램을 열어서 조금씩 바꿔가며, 일어나는 일과 비교한다.
– root [32] .x macros/new.C
• 필요한 경우 online manual을 참고한다. (http://root.cern.ch)
핵물리학교2005@SKKU
데이터분석 강의
17