ГРИД-технологии и облачные вычисления Кореньков В.В. (ЛИТ ОИЯИ, университет «Дубна») Конференция INTRUS, Дубна, 12.10.2010T.Strizh (LIT, JINR) Концепция Грид «Грид - это система, которая: · координирует использование ресурсов.
Download ReportTranscript ГРИД-технологии и облачные вычисления Кореньков В.В. (ЛИТ ОИЯИ, университет «Дубна») Конференция INTRUS, Дубна, 12.10.2010T.Strizh (LIT, JINR) Концепция Грид «Грид - это система, которая: · координирует использование ресурсов.
ГРИД-технологии и облачные вычисления Кореньков В.В. (ЛИТ ОИЯИ, университет «Дубна») Конференция INTRUS, Дубна, 12.10.2010 1 T.Strizh (LIT, JINR) Концепция Грид «Грид - это система, которая: · координирует использование ресурсов при отсутствии централизованного управления этими ресурсами · использует стандартные, открытые, универсальные протоколы и интерфейсы. · обеспечивает высококачественное обслуживание» Cоздание компьютерной инфраструктуры нового (Ian Foster: "What is the grid? ", 2002 г.) типа, обеспечивающей глобальную интеграцию информационных и вычислительных ресурсов на основе управляющего и оптимизирующего программного обеспечения (middleware) нового поколения. Междисциплинарный характер грид: развиваемые технологии применяются в физике высоких энергий, космофизике, микробиологии, экологии, метеорологии, различных инженерных и бизнес приложениях. Виртуальные организации (VO) T.Strizh (LIT, JINR) Five Emerging Models of Networked Computing From The Grid Distributed Computing • || synchronous processing High-Throughput Computing • || asynchronous processing On-Demand Computing • || dynamic resources Data-Intensive Computing • || databases Collaborative Computing • || scientists Ian Foster and Carl Kesselman, editors, “The Grid: Blueprint for a New Computing Infrastructure,” Morgan Kaufmann, 1999, http://www.mkp.com/grids 3 T.Strizh (LIT, JINR) Грид широко применяется • Физика высоких энергий (LHC, CERN) • UK Science Grid • TeraGrid • HealthGrid (GEMSS, MammoGrid, Pharma Grid, BioGrid, Infogenmed) • Молекулярная биологии для моделирования структуры белка, анализа последовательностей ДНК • Бизнес — нефтяная отрасль, геологоразведка • В банковском деле • В автомобильной промышленности Grid позволяет ускорить и удешевить расчет виртуальных крэштестов • Airbus и Boeing используют технологию для постоянного контроля состояния двигателей и других агрегатов и узлов самолета показания датчиков, непрерывно собирающих информацию, через спутник передаются на землю, где T.Strizh (LIT, JINR) Large Hadron Collider Start-up of the Large Hadron Collider (LHC), one of the largest and truly global scientific projects ever, is the most exciting turning point in particle physics. CMS ALICE LHCb LHC ring: 27 km circumference ATLAS T.Strizh (LIT, JINR) Параметры детектора АТЛАС Энергия центра масс 14 TeV Частота столкновений пучков 40 MHz Светимость : • начальная: 1031 см-2с-1 • низкая: 2*1033 см-2с-1 • целевая: 1034 см-2с-1 Вес 7000 тонн, Диаметр 22м, Длина 46м Количество регистрирующих каналов 140 000 000 6 T.Strizh (LIT, JINR) SDX1 CERN computer 6 centre Event rate Local Data storage ~ 200 Hz Storage SubFarm Outputs (SFOs) DataFlow Manager Trigger / DAQ architecture dual-CPU nodes ~1800 ~100 ~ 500 Event Builder Event Filter (EF) SubFarm Inputs (SFIs) stores LVL2 output Gigabit Ethernet Event data requests Delete commands Requested event data Regions Of Interest Event data pulled: partial events @ ≤ 100 kHz, full events @ ~ 3 kHz SDX1 pROS Network switches Network switches LVL2 Supervisor Secondlevel trigger LVL2 farm USA15 USA15 ~150 PCs Data of events accepted 1600 by first-level trigger ReadOut VME Dedicated links Links ReadOut Drivers (RODs) Read-Out Subsystems (ROSs) RoI Builder Timing Trigger Control (TTC) October 31, 2015 Firstlevel trigger Event data pushed @ ≤ 100 kHz, 7 1600 fragments of ~ 1 kByte each T.Strizh (LIT, JINR) UX15 Потоки данных от физических установок БАК до вычислительного центра ЦЕРН (Tier 0 at CERN) 8 T.Strizh (LIT, JINR) [email protected] 1.25 GB/sec (ions) Взаимодействие уровней Tier 0 – Tier 1 – Tier 2 Tier-0 (CERN): • Прием данных • Начальная реконструкция данных • Распределение данных Tier-1 (11 centres): •Постоянное хранение данных •Реконструкция и обработка •Анализ Tier-2 (>200 centres): • Моделирование • Физический анализ T.Strizh (LIT, JINR) [email protected] 9 Комната управления СMS (CERN) T.Strizh (LIT, JINR) Global Community 11 T.Strizh (LIT, JINR) Some history 1999 – Monarc Project • Early discussions on how to organise distributed computing for LHC 2001-2003 - EU DataGrid project • middleware & testbed for an operational grid 2002-2005 – LHC Computing Grid – LCG • deploying the results of DataGrid to provide a production facility for LHC experiments 2004-2006 – EU EGEE project phase 1 • starts from the LCG grid • shared production infrastructure • expanding to other communities and sciences 2006-2008 – EU EGEE-II • Building on phase 1 • Expanding applications and communities … 2008-2010 – EU EGEE-III 2010-…- EGI-NGI T.Strizh (LIT, JINR) CERN 12 EGEE (Enabling Grids for E-sciencE) The aim of the project is to create a global Pan-European computing infrastructure of a Grid type. - Integrate regional Grid efforts - Represent leading grid activities in Europe 10 Federations, 27 Countries, 70 Organizations 13 T.Strizh (LIT, JINR) 350 sites 55 countries 150,000 CPUs 26 PetaBytes (Disk) 40 PetaBytes (Tape) >15,000 users >300 Vos 12 mln jobs/month Астрономия и астрофизика Безопасность населения Вычислительная химия Вычислительные науки/Программирование Физика конденсированного состояния Науки о Земле Синтез Физика высоких энергий Науки о жизни 14 T.Strizh (LIT, JINR) The Map of OSG Sites (in the US) NERSC LBL UDAVIS STANFORD UCSB CALTECH UCLA UCR SDSC HARVARD RIT ALBANY MIT BU BUFFALO T BNL UWM UMICH WSU CORNELL MSU WISC PSU FNAL UIC LEHIGH UCHICAGOGEORGETOWN UNI UNL UIOWA ANL NDPURDUE NSF UMD UIUC IUPUI UVA IU KU RENCI ORNL VANDERBILT CU UNM OU TTU UTA LTU SMU LSU UMISS CLEMSON UFL FIT Ruth Pordes, FNAL T.Strizh (LIT, JINR) 1 5 EGEE & OSG WLCG depends on two major science grid infrastructures EGEE - Enabling Grids for E-Science OSG - US Open Science Grid 16 T.Strizh (LIT, JINR) Collaborating e-Infrastructures Potential for linking ~90 countries by 2010 17 T.Strizh (LIT, JINR) European e-Infrastructure Need to prepare permanent, common Grid infrastructure Ensure the long-term sustainability of the European e-infrastructure independent of short project funding cycles Coordinate the integration and interaction between National Grid Infrastructures (NGIs) Operate the European level of the production Grid infrastructure for a wide range of scientific disciplines to link NGIs 18 T.Strizh (LIT, JINR) - Bob Jones - EGEE'08 - 22 September 2008 The EGEE project 18 What future holds ARC consortium (NorduGrid, NDGF, KnowARC et al), together with gLite and UNICORE, contribute to creation of the Universal Middleware Distribution (UMD) for the European Grid Initiative (EGI) • Sites and VOs that use ARC will get an access to the European e-Science infrastructure, just like those that use gLite or UNICORE What about Clouds? • Technically, very similar to Grids: distributed, serviceoriented • However, Clouds business model is closer to that of HPC Single administrative domain, carefully selected resources 19 T.Strizh (LIT, JINR) The Future of Grids From e-Infrastructures to Knowledge Infrastructures Network infrastructure connects computing and data resources and allows their seamless usage via Grid infrastructures Federated resources and new technologies enable new application fields: • Distributed digital libraries • Distributed data mining • Digital preservation of cultural heritage • Data curation → Knowledge Infrastructure Major Opportunity for Academic and Businesses alike 20 T.Strizh (LIT, JINR) 20 Grids, clouds, supercomputers.. Grids Grids, clouds, supercomputers, etc. Supercomputers • Collaborative environment • Expensive • Distributed resources • Low latency interconnects (political/sociological) • Applications peer reviewed • Commodity hardware (also • Parallel/coupled applications supercomputers) • Traditional interfaces (login) • (HEP) data management • Also SC grids (DEISA, Teragrid) • Complex interfaces (bug not feature) Many different problems: Amenable to different solutions Clouds Volunteer computing • Proprietary (implementation) • Simple mechanism to access No right answer • Economies of scale in management millions CPUs • Commodity hardware • Difficult if (much) data involved • Virtualisation for service provision and • Control of environment check encapsulating application environment • Community building – people • Details of physical resources hidden involved in Science • Simple interfaces (too simple?) • Potential for huge amounts of real work Mirco Mazzucato DUBNA-19-1221 09 T.Strizh (LIT, JINR) Ian Bird 21 Концепция «Облачных вычислений» Все есть сервис (XaaS) AaaS: приложения как сервис PaaS: платформа как сервис SaaS: программное обеспечение как сервис DaaS: данные как сервис IaaS: инфраструктура как сервис HaaS: оборудование как сервис Воплощение давней мечты о компьютерном обслуживании на уровне обычной коммунальной услуги: масштабируемость оплата по реальному использованию (pay-as-you-go) T.Strizh (LIT, JINR) Software-as-a-Service (SaaS) Platform-as-a-Service (PaaS) Infrastructure-as-a-Service (IaaS) Everything as a Service (XaaS) T.Strizh (LIT, JINR) Virtual Laboratory layer. Grid Layer T.Strizh (LIT, JINR) Radiology Application DNA-Array MACS Lab Application Layer Some Desktop Grids World Community Grid - IBM (http://www.worldcommunitygrid.org/) 300.000 PCs Leiden Classical Grid - Education on Grid (http://boinc.gorlaeus.net/) 17.000 PCs SZTAKI - Hungarian initiative (http://www.desktopgrid.hu/) 70.000 PCs AlmereGrid (http://almeregrid.nl) 3.000 PCs PS3GRID (Based on Playstations) (http://ps3grid.net/) T.Strizh (LIT, JINR) Суперкомпьютер МГУ “Ломоносов” T.Strizh (LIT, JINR) Суперкомпьютер МГУ “Ломоносов” Пиковая производительность Реальная производительность Эффективность Число вычислительных узлов Число процессоров Число процессорных ядер Типы вычислительных узлов Основной процессор Оперативная память Коммуникационная сеть Система хранения данных Операционная система Занимаемая площадь Энергопотребление вычислителя 420 Тфлопс 350 Тфлопс 83% 4 446 8 892 35 776 T-Blade2, T-Blade 1.1, PowerXCell 8i Intel Xeon 5570, 2.93 GHz 56,5 ТБайт QDR Infiniband 1,35 ПБайт Clusrtx T-Platforms Edition 252 м2 1.5 МВт T.Strizh (LIT, JINR) Japan Courtesy of Satoshi Matsuoka, Tokyo Institute of Technology, Japan, ISC-2010 T.Strizh (LIT, JINR) The RDIG infrastructure В настоящее время RDIG –инфраструктура состоит из 17 ресурсных центров, в которых доступно около 5000 CPU и 3200 TB дискового пространства. • RDIG Resource Centres: – ITEP T.Strizh (LIT, JINR) – JINR-LCG2 – RRC-KI – RU-Moscow-KIAM – RU-Phys-SPbSU – RU-Protvino-IHEP – RU-SPbSU – Ru-Troitsk-INR – ru-IMPB-LCG2 – ru-Moscow-FIAN – ru-Moscow-GCRAS – ru-Moscow-MEPHI – ru-PNPI-LCG2 – ru-Moscow-SINP - Kharkov-KIPT - BY-NCPHEP Структурные элементы грид-инфраструктуры в России ROC – региональный операционный центр в России • • • • • • • • Обеспечение функционирования базовых грид сервисов 24х7 Мониторинг и реагирование на черезвычайные ситуации Учет ресурсов и выполненных работ (accounting) Управление и поддержка виртуальных организаций Поддержка безопасности инфраструктуры, CA Сертификация (валидация) грид ПО Поддержка пользователей Операционная поддержка ресурсных центров VO – виртуальные организации: • физика высоких энергий: LHC – ATLAS, ALICE, CMS, LHCb; PHOTON, HONE … • • • • биомед Fusion российские VOs: e-Earth (геофизика), химфизика (Черноголовка, МГУ ++), T.Strizh (LIT, JINR) нанотехнологии и наноиндустрия Russian NGI is e-ARENA The national association of research and educational е-Infrastructures «e-ARENA» has been established in August 2009 as a legal body for coordinating efforts of different organizations in Russian Federation in creating and developing the e-infrastructures, including networking and grids, to serve science and higher education. The e-Arena Association is recognized by the Ministry of Communications as a legal body for coordination of the e-infrastructure efforts at national level. In scope of the EGI stream the Russian NGI include five organizations, actively participated in the EGEE/EGEE-II/EGEE-III projects: RRC KI (Moscow), SINP MSU (Moscow), JINR (Dubna), PNPI RAS (Gatchina) and ITEP (Moscow). 31 T.Strizh (LIT, JINR) Центральный информационно-вычислительный комплекс ЦИВК ОИЯИ Производительность ЦИВК ОИЯИ составляет 2800 kSI2K Емкость дискового хранилища составляет 1068 TB (>1PB) Scheme of the CICC network connections T.Strizh (LIT, JINR) ОИЯИ в проектах WLCG/EGEE Протокол между ЦЕРН, Россией и ОИЯИ об участии в проекте LCG был подписан в 2003 году. MoU об участии в проеке Worldwide LHC Computing Grid (WLCG) был подписан в 2007 году. Задачи ОИЯИ в проектах WLCG/EGEE Поддержка и развитие WLCG/EGEE инфраструктуры; Участие в тестировании и сертификации нового промежуточного ПО (middleware testing/evaluation), Участие в Data and Service Challenges, Развитие систем grid мониторинга и учета ресурсов; Развитие системы FTS-monitoring; Развитие информационной системы MCDB; Участие в проекте ARDA; Развитие приложений в области физики высоких энергий; Организация обучения пользователей и системных администраторов 33 Поддержка стран-участниц ОИЯИ в развитии грид-технологий T.Strizh (LIT, JINR) USER- INTERFACE AND VISUALIZATION SERVICE DEVELOPMENT FOR VIRTUAL ORGANIZATION SUPPORT IN HIGH ENERGY PHYSICS S. Mitsyn (LIT) LHC Project Support Grid Monitoring: Deals with decentralized structures involving a large amount of data. Its proper representation is an essential part of the monitoring process. Google Earth offers a quite informative and visually attractive representation which mapping Grid infrastructure objects, processes and events on a geographic map. 34 T.Strizh (LIT, JINR) JINR CMS Remote Operation Centre Founded in 2009 as a part of GRID-based JINR Tier-2 Monitoring of detector systems Data Monitoring / Express Analysis Shift Operations (except for run control) Communications of JINR shifter with personal at CMS Control Room (SX5) and CMS Meyrin centre Communications between JINR experts and CMS shifters Coordination of data processing and data management Training and Information 35 T.Strizh (LIT, JINR) Статистика использования CPU time по странам (июнь 2009 - октябрь 2010) 36 T.Strizh (LIT, JINR) Статистика по CPU time среди грид-сайтов в России (июнь 2009 - октябрь 2010) 37 T.Strizh (LIT, JINR) Grid training and education – distributed training infrastructure: gLite user trainings for students of Dubna University and University Centre of JINR, grid site administrators trainings for JINR member-states, testbed for grid developers, testbed for middleware evaluation, GILDA cooperation 39 T.Strizh (LIT, JINR) Participation in GridNNN project Grid support for Russian national nanotechnology network To provide for science and industry an effective access to the distributed computational, informational and networking facilities Expecting breakthrough in nanotechnologies Supported by the special federal program Main points based on a network of supercomputers (about 15-30) has two grid operations centers (main and backup) is a set of grid services with unified interface partially based on Globus Toolkit 4 40 T.Strizh (LIT, JINR) GridNNN infrastructure 10 resource centers at the moment in different regions of Russia RRC KI, «Chebyshev» (MSU), IPCP RAS, CC FEB RAS, ICMM RAS, JINR, SINP MSU, PNPI, KNC RAS, SPbSU 41 T.Strizh (LIT, JINR) 4-rd International Conference "Distributed Computing and Grid-technologies in Science and Education“ 28 June – 3 July, 2010 http://grid2010.jinr.ru T.Strizh (LIT, JINR) 42 Useful References: Grid Café: http://www.gridcafe.org/ OPEN GRID FORUM: http://www.ogf.org GLOBUS: http://www.globus.org TERAGRID: http://www.teragrid.org Open Science Grid: http://opensciencegrid.org/ LCG: http://lcg.web.cern.ch/LCG/ EGEE: http://www.eu-egee.org EGEE-RDIG: http://www.egee-rdig.ru EGI: International Science Grid this Week: http://www.isgtw.org/ http://web.eu-egi.eu/ 43 T.Strizh (LIT, JINR) The blind men and the elephant in the room Cyberinfrastructure SaaS SOA Web 2.0 Shared Infrastructure/ Shared Services Grids Automation Virtualization T.Strizh (LIT, JINR)