Машина за открития

Суперкомпютърът Discoverer дава перспективи за развитие на българската наука и бизнес

На фасадата на най-новата сграда на „София Тех Парк“ (СТП) e окачен надпис с големи черни букви DISCOVERER Sofia Petascale Supercomputer. Discoverer (англ.- откривател, бел. авт.) е името на най-новия български суперкомпютър, създаден да прави изчисления, непосилни за обикновените компютри. Зад неговото изграждане стои инициативата EuroHPC JU (виж карето), която финансира 35% от общата цена на Discoverer, която възлиза на €11,5 млн., като останалите пари са от българската държава.



Discoverer все още не е влязъл в действие – очаква се това да стане до месец-два, но през юни влезе в Топ 100 на най-бързите компютри в света с изчислителна мощ от 4,5 петафлопа (1 петафлоп е 1 млн. млрд. аритметични операции) и пикова от около 6 петафлопа. Той не е само машина, а цяло минипредприятие. Изграден е от френската технологична компания Atos, като се състои от 2256 64-ядрени процесора AMD EPYC 7H12, разположени в 12 изчислителни „шкафа“ (рака), а отделно има още 2 контролни рака. Процесорите са монтирани в сървъри с охлаждане с топла вода – течността влиза с температура около 30 градуса и излиза 45 градуса, така че в съседство с оперативната зала се намира помещение с охладителна техника. Под максимално натоварване системата консумира 1,4 мегавата електроенергия на час. За осигуряване на непрекъсната работа освен захранването ѝ от две независими мрежи има и UPS-и, както и електрически генератор за краен случай.



Суперкомпютърът се управлява от консорциума „Петаскейл суперкомпютър България“, който включва СТП, Националния център за суперкомпютърни приложения (НЦСП), Стратегическия център по изкуствен интелект и частната компания „Рила Солюшънс“.



„Най-големите трудности при изпълнението на проекта бяха свързани с доставката на елементи и електронни компоненти заради ковид пандемията“, казва проф. Симеон Стоянов, мениджър бизнес развитие в консорциума. Но той казва, че от Atos, които изпълняват проекти по цял свят, са били впечатлени от скоростта и ефективността на българския екип на СТП, който е успял да проектира сградата, цялата съпътстваща инфраструктура и да координира нейното изпълнение с много фирми, които е трябвало да работят в синхрон и навреме.



Какво се случва със съществуващия суперкомпютър



Докато Discoverer още не е започнал работа, в България вече приключва жизнения си цикъл още един суперкомпютър. Наречен „Авитохол“ на името на легендарен прабългарски владетел, той се намира в сградата на Института по информационни и комуникационни технологии в комплекса на БАН на Четвърти километър. По въздуха разстоянието между него и Discoverer е точно 1 километър. „Авитохол“ започва работа през 2015 г., но отдавна е излязъл от Топ 500 на компютрите с най-голяма изчислителна мощност. Само за сравнение, дори един от 12-те рака на Discoverer е с по-голяма изчислителна мощ от него.



„Машината е претоварена от работа. Тя се използва за обучение и от изследователски екипи на институтите на БАН и университетите“, казва проф. Стоян Марков, ръководител на НЦСП. „Ние се стараем да образоваме хората, които са добри специалисти в своята област, да се научат да ползват суперкомпютъра като инструмент в своята изследвания и при създаването на прототипи на изделия „ Проф. Марков е ръководител и на екипа, проектирал Discoverer.



„Авитохол“ се ползва за бързо прогнозиране на климата в цялото Софийско поле и за оценка на земетръсоустойчивост на жилищни райони. Ресурсът му е използван и от бизнеса – например за модифициране на 2 антибиотика от „Биовет Пещера“. На него се правят и изследвания за генно модифициране на сортове лозя, така че да са приспособими за определена почва и влажност.



Още от създаването си през 2008 г. НЦСП се присъединява към инициативата PRACE (Partnership for Advanced Computing in Europe), в която участват научни организации и е насочена към приложни изследвания с цел да се увеличи пазарното присъствие на съответните браншове, в които се използват суперкомпютрите.



НЦСП е организирал 7 училища, в които обяснява на специалисти, които не са запознати със суперкомпютрите, как те могат да ги използват практически в своята учебна, преподавателска, изследователска и индустриална работа. Последното училище, открито на 20 септември, е посветено на моделирането на биологичните молекули, тяхното взаимодействие и виртуалното търсене на кандидати за лекарства.



През годините са обучени 130 български специалисти, но не повече от 12-15 са останали в България, другите са намерили работа в Европа и САЩ. „Хората, които умеят да използват тези машини, за да повишат качеството и ефективността на своята работа, да направят кариера, няма къде да оползотворят своите знания и възможности. Например, за разлика от Унгария, Словения и Полша, в България няма фармацевтична фирма или фармакологични лаборатории, които да синтезират лекарства. Малко хора с такава специалност завършват факултетите по фармация. Когато се промени профилът на българската индустрия, когато тя стъпи на високо технологичните производства, нашите специалисти ще останат в страната“ казва проф. Марков.



Неслучайно Discoverer е разположен на територията на „София Тех Парк“. Това позволява да се засили действието на екосистемата, която свързва бизнес и наука. „Имаме лабораторен комплекс, имаме суперкомпютър, имаме бизнес инкубатор, което дава възможност възможност да се събере критична маса от хора, които мислят в една посока в областта на технологиите и научните иновации. Така че машината е много важна за СТП, за София, както и за цяла София“, казва проф. Стоянов.



За България наличието на такава машина означава, че ще може да правим изчисления в много по-голям мащаб, защото скоростта на развитие на ИТ технологиите изисква все по-големи изчислителни ресурси. Така българските потребители ще имат достъп до най-съвременни технологии, възможност да ги използват и да са конкурентни както на научната сцена, така и в бизнеса. „Нашата цел е, когато клиенти отвън искат да го използват, по възможност това да става в сътрудничество с партньор от българска страна, което ще ни даде възможност и за нови бизнес или научни контакти“, допълва проф. Стоянов.



Но Discoverer постоянно ще трябва да се обновява, защото след 5 години той ще бъде остарял и един нов геймърски компютър може да се окаже със сравнима мощ с него. А на екипа му ще трябва да се осигурят подходящи условия за развитие и работа, защото тези хора са конкурентоспособни на целия пазар на суперкомпютри и могат да си намерят работа по цял свят.



„Самата поддръжка на машината не е евтина – при пиково потребление от 1,4 мегавата при тези цени на тока може да сметнете какво означава това за поддръжка“, казва проф. Стоянов.



За какво ще се използва Discoverer



„Има много задачи в атомната и ядрената физика, които изискват обработка на голямо количество данни и много сложни изчисления. На ниво молекули можем да разработваме нови материали или нови полимери или лекарства и ваксини за вируси“, казва проф. Стоянов. Например при милиони кандидати за лекарства или ваксини трябва да се селектират само най-перспективните. Всяка стъпка в този процес сама по себе си е сложна изчислителна задача, а трябва да се изпълнят милиони такива стъпки. След селекцията изчисленията трябва да продължат на следващ етап, да се провери и дори in silico (виртуално) да се симулира дали селектираните кандидати ще бъдат ефективни в клетъчни култури. Когато са успешни такива модели могат да помогнат да се намалят тестовете, които се правят върху живи същества и да има най-голяма сигурност, когато се отиде на крайната фаза на тестове върху хора.



При разработката на високотехнологични изделия, като например самолетни крила или детайли, които отговарят на сложни изисквания, също трябва голяма изчислителна мощ, вместо да се работи на принципа проба – грешка.



За тестването на обекти, като сгради или самолети за надеждност и как ще се държат при екстремни условия, също се използват суперкомпютри. Правят се т.нар. дигитални двойници, като така обектите могат да бъдат тествани във виртуална среда. Енциклопедичен пример е самолетът Airbus А380, който е толкова голям, че не е имало аеродинамичен тунел, на който да бъдат тествани неговите летателни свойства. Така че голяма част от необходимите изпитания са били направени на суперкомпютри.



За машините има работа и при задачи, свързани с предсказване на климат и природни бедствия. „Наводнения след снеговалежи, цунами след земетресение, ако искаме да ги предскажем с максимална точност и с разделителна способност от десетки или стотици метри, това изисква огромна изчислителна мощ“, казва проф. Стоянов.



Суперкомпютри се използват и при космологията, като решават задачи, с които се опитваме да разберем структурата на Вселената.



В областта на обработка на данни и изкуствения интелект също има много задачи, при които се използват суперкомпютри. Част от тях могат да бъдат направени в облака, но тези, за които трябват голяма изчислителна мощ и бързо взаимодействие между отделните компоненти на машината, изискват суперкомпютри.



„В момента в почти всички области ИТ индустрията прави революция в бизнес моделите и начините на работа. Финансовите пазари, моделиране на потребителско поведение, това са области, които отново са свързани с голямо количество информация и отделяне на рационалната част от информацията и намиране на връзките между крайните свойства, които искате да предвидите“, казва проф. Стоянов. Например, преди да пуснат нов продукт на пазара, компаниите могат да направят моделиране, с което да проучат потребителското поведение, за да прогнозират дали той ще е успешен.



Кой ще използва суперкомпютъра



Като част от мрежата на EuroHPC около една трета от капацитета на Discoverer е резервиран за проекти на организацията, а заради ограниченията, свързани с избягване на държавна помощ само до 20% от ресурса му може да се използва за комерсиални цели. Но според проф. Стоянов е възможно при правилно структуриране и при интерес от бизнеса машината да може да се самоиздържа от тези 20% от ресурса, предназначен за бизнес потребители.



В същото време през 2018 г. за проект „Център за върхови постижения по информатика и ИКТ“ консорциум, който включва и Института по информационни и комуникационни технологии на БАН, спечели финансиране за 29,4 млн. лв. по Оперативна програма „Наука и образование за интелигентен растеж“. От тях 75% са предвидени за покупка на оборудване и проф. Стоян Марков очаква с част от парите да бъде изграден нов суперкомпютър с капацитет от 2 петафлопа, който ще е само за България. Така дори „Авитохол“ да спре да работи, ще има достоен наследник.



Мрежа от 8 суперкомпютъра



European High Performance Computing Joint Undertaking (EuroHPC JU) е съвместна инициатива на ЕС, европейските държави и частни партньори, създадена през 2018 г. със седалище в Люксембург. Нейната цел е да развие суперкомпютърна екосистема на световно ниво в Европа. За периода 2019 – 2020 г. нейният бюджет възлиза на €1,1 млрд., като €536 млн. идват по многогодишната финансова рамка на ЕС 2014 – 2021 г., а останалите средства от страните партньори.



Discoverer е част от мрежата на суперкомпютри на EuroHPC, която в окончателния си вид ще се състои от 8 машини – 5 „малки“, които имат производителност над 5 млн. млрд. операции в секунда (петафлопа) и 3 „големи“ пре-екзаскейл машини (1 екзаскейл е 1000 петафлопа).



Най-мощният от големите суперкомпютри, наречен Lumi, e във Финландия, близо до Полярния кръг и е в процес на изграждане. Неговата изчислителна мощ е планирана да бъде 375 петафлопа, а пиковата – 552 петафлопа.



Вторият – Leonardo, е в Болоня, също в процес на изграждане. Мощност (планирана): 294,9/322,6 петафлопа. Третият „голям“ суперкомпютър – MareNostrum 5, ще е в Барселона, все още тече избор на изпълнител, като още не са обявени данни. Останалите, освен Discoverer, 4 „малки“ машини са в Португалия (Deucalion, 7,22/10 петафлопа, в процес на изграждане), Словения (Vega, 6,9/10,1 петафлопа, действащ), Чехия (Karolina, 9,13/15,2 петафлопа, в процес на изграждане) и Люксембург (MeluXina 10/15 петафлопа, действащ).



Защо са нужни суперкомпютри?



От десетилетия върви дискусия за това дали са необходими суперкомпютри, или изчислителната дейност може да се извършва от разпръснати по цял свят машини. Част от задачите могат да се изпълняват на разпръснати или облачни структури, но комуникацията между тях става проблем. „Ако вземете една голяма сложна задача и я разделите на части в началния етап, ефективността се увеличава, защото имате повече изчислителна мощ. Но увеличаването на ефективността не върви до безкрайност и в един момент тя започва да пада“, казва проф. Симеон Стоянов.



Причината е, че в един момент отделните елементи – процесори, сървъри, са свършили задачата и чакат информацията, която е необходима, за да се комуникира между тях. Така че скоростта на комуникация става тясното място. Такива суперкомпютри, които всъщност са много сървъри на едно място, свързани с голяма скорост дават възможност тази ефективност да продължи в по-голям мащаб.

