Сетевой интерактивный ресурс данных по физике космоса Space Physics Interactive Data Resource (SPIDR) Михаил Жижин, ИФЗ РАН [email protected] Основная концепция Интерактивный поиск данных (data mining) Параллельность – сразу в.
Download ReportTranscript Сетевой интерактивный ресурс данных по физике космоса Space Physics Interactive Data Resource (SPIDR) Михаил Жижин, ИФЗ РАН [email protected] Основная концепция Интерактивный поиск данных (data mining) Параллельность – сразу в.
Сетевой интерактивный ресурс данных по физике космоса Space Physics Interactive Data Resource (SPIDR) Михаил Жижин, ИФЗ РАН [email protected] Основная концепция Интерактивный поиск данных (data mining) Параллельность – сразу в нескольких базах данных Метаданные – общий список параметров, спутников и наземных станций Многодисциплинарная визуализация События – удовлетворить нечеткие критерии отбора Функции Гибкая доставка данных по Сети (content delivery) Синхронные региональные серверы Персональная «покупательская» корзина Адаптивный формат экспорта данных Приложения Сбор и контроль качества данных Синтез данных B2B источник для моделей космической погоды Основные разделы данных SSN – статистика солнечных пятен, с 1700 Геомагнитные вариации (минутные и часовые) тестируется, c 1901 Геомагнитные и солнечные индексы, с 1932 Параметры ионосферы, c 1954 IMF – межпланетное магнитное поле и параметры солнечного ветра, с 1973 GOES – геостационарные спутники NOAA, с 1986 DMSP – метеорологические спутники, с 1991 Изображения Солнца в различных диапазонах и магнитограммы, с 1992 Типовой узел SPIDR Data Base 1 Client Java servlets Internet Application server W eb RM se I rv i ce s WWW server JDBC Data Base 2 Data Base 3 Space weather models Internet SPIDR API Кластер баз данных Linux-кластер SPIDR database structure (Boulder) stp dmspdb goesdb hpidb imfmin sgd swrstations qdays solardb esg5.ngdc.noaa.gov geomag Wsg9.ngdc.noaa.gov Swr1.ngdc.noaa.gov swr rstndb Internet Beluga.ngdc.noaa.gov (WWW server) cosmdb Esg1.ngdc.noaa.gov Esg4.ngdc.noaa.gov geomdb Esg2.ngdc.noaa.gov ionodb Esg3.ngdc.noaa.gov Кластер баз данных в Москве 15 Linux nodes 1 Tbyte of disk space 1 Gbit Ethernet backbone 1 Gbit optical link to Internet Подключаемые (pluggable) базы данных Для подключения новой базы данных необходимо: Написать метод доступа к базе, создающий объект модели данных SPIDR (день наблюдений параметра на станции) по JDBC запросу (MySQL, Oracle); Создать HTML (JSP) форму запроса данных; Проинформировать сервлеты выборки и визуализации о новом типе данных (метаданные о физических единицах, масштабах и типах шкал на графиках, и т.п.) http://clust1.wdcb.ru/spidr Ссылки на узлы Прошлые сессии Доступные данные на текущий момент Новости Динамический интерфейс Logo and homepage Links to developers Tips and quick help Links to regional hosts Buttons toolbar Data menu Frame for data requests and visualization Синхронные графики временных рядов Интерактивная картография HTML Карта станций для интервала дат Java Список и описания отобранных станций HTML Web-анимация рядов изображений со спутников Снимки Земли: DMSP, Terra Изображения Солнца: обсерватории и спутники Расстановка узлов SPIDR Поддержка множества узлов Региональные узлы в России, США, Африке, Австралии, Японии и Китае Сравнение метаданных на разных узлах (web-сервисы) Независимая загрузка данных в любой из узлов (браузер или web-сервис) Автоматическая синхронизация узлов (email) Автоматический анализ логов загрузки и предупреждение об ошибках (e-mail) Загрузка данных через Web Сравнение метаданных на разных узлах SPIDR Детальная инвентаризация за период-элемент-станцию Сравнение узлов и синхронизация по запросу Геомагнитные данные из России Нечеткий поиск событий Data basket Fuzzy Visualization search Критерий поиска в терминах нечеткой логики «Спокойный день»: Малые значения индекса Kp Индекс Dst около нуля «Магнитная буря»: Большие значения индекса Kp Большие отрицательные значения Dst Форма «нечеткого» запроса Временной интервал для поиска Параметры Тип нечеткой функции принадлежности Пороги и значимость Результат поиска – список событий Rank 1 2 3 4 5 6 7 8 9 10 Score 0.995 0.99 0.974 0.959 0.957 0.955 0.944 0.944 0.936 0.914 Date 1999-01-31 1998-12-16 1997-03-09 1998-10-14 1997-05-11 1997-12-26 1997-04-15 1999-05-10 1997-08-25 1997-11-20 Time 20:00 21:00 9:00 6:00 20:00 22:00 6:00 21:00 12:00 21:00 «Синтез» данных в SPIDR Минутные данные о солнечном ветре (скорость, плотность, магнитное поле): ACE – с августа 1997 WIND – с ноября 1994 IMP8 – с июля 1992 по ноябрь 2000 Слияние минутных данных с трех спутников Средняя скорость солнечного ветра и задержка до границы магнитосферы для каждого спутника На данную минуту если нет данных ACE, то использовать WIND, в крайнем случае IMP8 (с учетом положения вне Сравнение с часовыми данными OMNI, 1-7 августа 1999 Магнитное поле 1 мин OMNI Плотность Space Weather Reanalysis - SWR SPIDR Geomag IMF min GOES QC Algoritms Indices WDC-B SWR Clean Geomag SWR databases Models SPIDR databases GEODAS AMIE MSM Integration suit SPIDR API Model output Integration suit Raw data WDC-C CTIM SWR KRM ISP SPIDR WEB interface SWR WEB interface Internet Internet Intermag Client Client SWR API Контроль качества данных для SWR SWR homepage http://swr.ngdc.noaa.gov/swr SWR временные ряды Графики временных рядов Java апплет или GIF изображения Запрос на выборку временного ряда в интервале времени для нескольких узлов на сетке и по множеству параметров SWR значения поля на сетке Статические карты 9 – 12 на страницу Динамический Java для анимации изменения поля во времени Распределение пользователей на узле в Болдере, США 450 400 6400 users from USA 350 300 250 200 150 100 50 0 Amount of SPIDR users (USA node) U n ite d S ta te s U n ite d K in g d o m R u s s ia n F e d e r a tio n C a n a d a G e rm a n y A u s tr a lia Ita ly Ja p a n F ra n c e IN B r a z il N e th e r la n d s C h in a S p a in A r g e n tin a M e x ic o B e lg iu m A r m e n ia G re e c e S w e d e n N e w P u e r to R ic o F in la n d D e n m a rk S w itz e r la n d A u s tr ia P o la n d S o u th A fr ic a K o r e a (S o u th ) P o r tu g a l C z e c h R e p u b lic B u lg a r ia C o lo m b ia F r a n c e M e tr o p o lita n U k r a in e Is r a e l N o rw a y T u rk e y R o m a n ia T a iw a n E g y p t In d o n e s ia Ir e la n d V e n e z u e la C h ile A fg h a n is ta n H u n g a ry C u b a M a la y s ia T h a ila n d P a k is ta n S a u d i A r a b ia Z e a la n d In d ia Статистика в реальном времени Число пользователей Запросы на визуализацию и экспорт данных Доступна на каждом узле из меню: - SPIDR tools - Statistics Bugrat – база данных ошибок и исправлений Основная концепция Интерактивный поиск данных (data mining) Параллельность – сразу в нескольких базах данных Метаданные – общий список параметров, спутников и наземных станций Многодисциплинарная визуализация События – удовлетворить нечеткие критерии отбора Функции Гибкая доставка данных по Сети (content delivery) Синхронные региональные серверы Персональная «покупательская» корзина Адаптивный формат экспорта данных Приложения Сбор и контроль качества данных Синтез данных B2B источник для моделей космической погоды Coming release SPIDR 3.0 MVC and workflow state machine using Jakarta Struts Enhanced usability with wizards: data collection trails “by time” and “by dataset” Ionosphere data loading and synchronization re-worked Web services for all B2B transactions SWR data products included Experimental SPDML-compliant metadata Experimental GRID Globus toolkit ver. 3+