低信噪比星系光谱的识别和测量

Download Report

Transcript 低信噪比星系光谱的识别和测量

LOGO
低信噪比星系光谱的识别与测量
——LAMOST星系光谱识别测量模块
张健楠
国家天文台郭守敬望远镜研究与发展中心
主要内容:
 为什么研究设计LAMOST星系光谱的识别测量
 星系模块的功能
 模块性能测试结果
1
研究背景
 星系与类星体的红移巡天是LAMOST主要科学目标之一。
通过尽可能完备的星系与类星体的样本,追踪宇宙大尺度质量结构,研究宇宙的结构、
形成和演化,以及星系的形成、演化。
 LAMOST 1D pipeline对光谱数据进行分类结果
星系、类星体、恒星(恒星光谱细分类)、unknown, 4大类,并测量红移参数。
 LAMOST光谱数据处理现状:
DR1处理了4百多万光谱数据,发布了2百多万条。
经过多次的调试与改进,目前对恒星的识别分类正确率很高,但是对于河外天体光谱
识别与红移测量上表现很差。
4
为什么研究设计LAMOST星系光谱的识别测量
 对DR1中的星系光谱分析(galaxy:12082):
62%的星系没有正确识别,绝大部分分类为unknown,部分分类为STAR。采用人工的方
法从unknown中找回并人工测量红移。
15000
8000
7000
6000
5000
4000
3000
2000
1000
0
10000
Pipeline分类正确
5000
OBJTYPE!=STAR
人工找回
OBJTYPE=STAR
0
GALAXY
GALAXY
 目前pipeline星系光谱数据产品还很简单,没有更多的测量信息。
1D Pipeline对星系光谱处理性能状况原因分析:
 核心算法:PCAZ;
 LAMOST光谱数据:相对 流量定标、信噪比
 核心算法:借鉴SDSS的基于模板主成份拟合的全谱模板匹配方法。
模板类型
是否应用主成份
• 恒星
•否
• 类星体
•是
• 星系
•是
模板主成份数量
• 0(183个恒星模板)
• 4
•4
多项式阶数
•5
•5
•5
全谱模板匹配缺点:强烈受限于流量定标质量。
1.
关键步骤: 低阶多项式的方法去除流量定标差异和消光影响。
2.
LAMOST:河外源的天区基本为M和F的天区,星等范围集中与16~20等(r星等),普遍存在流量相
对定标、红蓝端拼接问题,信噪比较低问题。
3.
SDSS:光谱通过测光数据和流量标准星进行了流量定标,流量定标差异小(<10%)可以用低阶多项式
更正。
5
星系光谱模块研究目标
 研究并设计基于谱线信息的星系识别与测量光谱处理方法
 目的:通过提取谱线信息,实现由谱线信息对LAMOST星系光谱准确
的自动识别和红移测量。提高LAMOST星系光谱正确识别率,提供更
多星系光谱数据产品。
 功能:谱线自动提取与测量,识别星系谱线类型并求红移,测量谱线
参量(线心位置、EW, 线指数等)并确定星系类型,其它参量测量。
星系识别与测量核心功能模块
星系模块接口
GAL_M
连续谱拟合
continuum
谱线提取与测
量searchline
谱线识别与红移
测量getz
进展:基本完成星系模块v1.0
星系类型
galtype
其它参量测量
测试数据:
 2014年3月1日至3月26日 LAMOST观测数据。
 模块运行条件,经1D pipeline运行后,根据1D pipeline分类结果,选取
所有
1)1D分类为Unknown,
2)1D分类为Star且置信度zconf<80%,
3) 1D分类为Galaxy或QSO,
4)目标为河外源的光谱,
 共59614条光谱数据。
 分类标准:以人工验证后的2155条星系光谱为标准。
 LAMOST 星系模块总体分类测试结果
1D Pipeline
星系模块
正确星系分类
927
1991
分类正确率
43.02%
91.46%
错误分为星系
14
1198
人工证认
(final_class)
2155
测试结果及分析
 星系模块分类正确率同信噪比sng的关系
400
Correct ratio of GAL classification
1
350
300
N
250
200
150
100
50
0
-5
0
5
10
15
20
25
30
35
40
0.95
0.9
0.85
0.8
0
5
sng
 左图:分类正确数量在sng上的直方图
 右图:分类正确率vs. sng
10
15
20
sng
25
30
测试结果及分析
星系模块分类正确率同信噪比snr的关系
150
Correct ratio of GAL classification
1
N
100
50
0
-10
0
10
20
30
snr
40
50
60
70
0.95
0.9
0.85
0
10
 左图:分类正确数量在snr上的直方图
 右图:分类正确率vs. snr
20
30
snr
40
50
60
星系模块错分为星系与人工星系分类比率同信噪比sn的关系
25
20
wrong ratio of GAL classification
wrong ratio of GAL classification
25
15
10
5
0
0
20
15
10
5
0
2
4
6
8
sng
10
12
14
16
 左图:分类错误比 vs. sng
 右图:分类错误比 vs. snr
0
2
4
6
8
10
snr
12
14
16
18
结论:
 在信噪比sng>4,准确率达到95%; sng>3,准确率达到85%;
错误率稳定小于0.05;在信噪比sng>10,分类正确率稳定
在大于99%.
 在信噪比snr大于9的情况下,准确率已经达到90%,错误
率稳定小于0.05。
 错误分类主要分布在信噪比0~5
 信噪比大于10,分类稳定可信
星系光谱红移精度测试
 测试数据:
 前述2014年3月份分类正确的星系通过与SDSS DR9交叉获
取同源星系1457条光谱。
 Z_SDSS: 全谱模板匹配算法PCAZ;
 Z_ours: 谱线测量算法
 星系模块的红移测量算法:以高斯函数拟合星系谱线,确
定谱线线心,计算每条谱线红移,星系红移为谱线红移的
均值。
1457 spectra: z_SDSS vs. z_ours
sdss z vs. our z for 1457 spectra
0.35
z from galaxy model
0.3
0.25
0.2
0.15
0.1
0.05
0
0
0.05
0.1
0.15
0.2
z from SDSS
0.25
0.3
0.35
1457条LAMOST与SDSS同源星系光谱红移测量差直方图分析
350
300
a=303.4563
b=0.0000
c=0.0002
250
N
200
150
100
50
0
-6
-5
-4
-3
-2
-1
diff z
0
1
2
3
4
-3
x 10
ΔZ (z_SDSS-z_ours)
μ
δ
0.0000
0.0002(60km/s)
 星系模块正确识别率>80%
 sng>4, 星系模块正确识别率>95%
snr>9,准确率已经达到90%,错误率稳定小于0.05。
 错误分类主要分布在信噪比0~5
信噪比大于10,分类稳定可信
 基于谱线信息的红移算法与基于全谱匹配的算法精度:
μ:0.0000
δ:0.0002 (60km/s)
LOGO
谢谢!
80
200
60
relative flux
relative flux
100
0
20
-100
-200
3.55
3.6
3.65
3.7
3.75
3.8
wavelength (log)
3.85
3.9
3.95
0
3.55
4
3.6
3.65
3.7
3.75
3.8
wavelength (log)
3.85
3.9
3.95
4
3.6
3.65
3.7
3.75
3.8
wavelength (log)
3.85
3.9
3.95
4
80
80
60
relative flux
60
relative flux
40
40
40
20
20
0
3.55
3.6
3.65
3.7
3.75
3.8
wavelength (log)
3.85
3.9
3.95
4
0
3.55
60
local threshold
星系光谱谱线提取与红移测量的示例:
relative flux
40
20
0
z=0.045273时提取并测量的谱线系
-20
-40
3.55
3.6
3.65
3.7
3.75
3.8
wavelength (log)
3.85
3.9
3.95
4
列:
60
relative flux
40
[OII]_3727,H_delta,H_gamma,
20
0
-20
-40
3.55
3.6
3.65
3.7
3.75
3.8
wavelength (log)
3.85
3.9
3.95
4
H_beta,[OIII]_4960,[OIII]_5008,
H_alpha,[NII]_6585,[SII]_6718,
[SII]_6732