Znanstveniki Uporabljajo Manj Kot 1% Podatkov, Ki Jih Je Zbral Veliki Hadronski Trkalnik - Alternativni Pogled

Znanstveniki Uporabljajo Manj Kot 1% Podatkov, Ki Jih Je Zbral Veliki Hadronski Trkalnik - Alternativni Pogled
Znanstveniki Uporabljajo Manj Kot 1% Podatkov, Ki Jih Je Zbral Veliki Hadronski Trkalnik - Alternativni Pogled

Video: Znanstveniki Uporabljajo Manj Kot 1% Podatkov, Ki Jih Je Zbral Veliki Hadronski Trkalnik - Alternativni Pogled

Video: Znanstveniki Uporabljajo Manj Kot 1% Podatkov, Ki Jih Je Zbral Veliki Hadronski Trkalnik - Alternativni Pogled
Video: A Day with Particles 2024, April
Anonim

Jasno je, kdaj pride do težav pri pridobivanju znanstvenih podatkov. Vendar se izkaže, da obstaja težava, da jih shranite in obdelamo.

Celotna serija odmevnih odkritij, izvedenih s trkalnikom, je temeljila na analizi podatkov, katerih obseg je manj kot en odstotek celotne količine ustvarjenih podatkov.

Preostali podatki so nepovratno izgubljeni.

26,7-kilometrski predor za trk se uporablja za pospeševanje delcev blizu hitrosti svetlobe. Dva toka delcev, ki se gibljeta v nasprotni smeri, trčita v mestih v prostoru, ki jih nadzirajo občutljivi senzorji. Tudi pri najnižji gostoti protonskih žarkov, ki vsebujejo 120 milijard protonov, je število trkov 30 milijonov trkov na sekundo.

Po podatkih, objavljenih na spletni strani Evropske organizacije za jedrske raziskave CERN, milijarda trkov na sekundo ustvari podatkovni tok 1 petabajt na sekundo. In to je največja težava v tem trenutku, saj je tok podatkov s tako hitrostjo preprosto nemogoče shraniti, kaj šele pravilno obdelati. "Za najmanj 30 milijonov trkov potrebujemo 2000 petabajtov, da shranimo rezultate tipične 12-urne faze trkalnika. Pri 150 izstrelitvah trkalnikov na leto bi potrebovali 400.000 petabajtov, 400 eksebajtov podatkov, da bi shranili vse podatke, ogromno količino, ki je trenutno ne moremo shraniti, "pravi Andreas Hoecker, znanstvenik iz CERN-a.

Rešitev problema velike količine podatkov je seveda drastično zmanjšanje njihove količine. In to ni storjeno na račun algoritmov stiskanja informacij, za to ni dovolj moči vseh procesorjev obstoječih superračunalnikov. Zmogljivosti računalniške tehnologije, ki je na voljo pri CERN-u, omogočajo shranjevanje rezultatov le 1200 trkov na vsakih 30 milijonov takšnih primerov. To je 0,004 odstotka celotne količine, preostalih 99,996 odstotka pa, kot je bilo omenjeno zgoraj, izgubljenih za vedno.

Image
Image

Takšno stanje se zdi grozno zapravljanje, vendar ni vse tako žalostno. Pojavi, ki resnično zanimajo znanstvenike, se s to hitrostjo ne pojavijo. Na primer, Higgsov bozon se pojavi s hitrostjo enkrat na sekundo, medtem ko se drugi dogodki pojavljajo s pogostostjo več deset ali sto krat na sekundo. Za poudarjanje najbolj zanimivega celotnega toka podatkov so vključeni posebni "sprožilci", naprave, ki izvajajo predhodno filtriranje podatkov predvsem na strojni ravni. Ti sprožilci so razviti za vsak posamezen primer in so nastavljeni v skladu z lastnostmi iskanih delcev, kot so Higgsov bozon, resnični kvark, W in Z bozoni itd.

Promocijski video:

Seveda se ob takšni izvedbi predhodne obdelave podatkov izgubi nekaj zanimivih podatkov skupaj z goro nepotrebnih in nezanimivih "smeti". Toda preostale informacije vsebujejo predvsem pomembne podatke, njen razmeroma skromen obseg pa že omogoča dovolj globoko obdelavo tudi v realnem času.

In na koncu je treba opozoriti, da rešitev problema, opisanega zgoraj, nikakor ne zagotavlja možnosti shranjevanja večinoma neuporabnih podatkov. Rešitev problema je ustvariti nove senzorje za trkalnik, ki bodo uporabili najnovejše dosežke sodobnih tehnologij in bodo lahko prodrli v globine trenutno neraziskanih področij fizike. Mimogrede, nekateri od teh senzorjev se bodo pojavili na trkalniku med naslednjo modernizacijo, ki se izvaja prav zdaj. In začetek posodobljenega trkalnika je predviden leta 2025.