Abstract | Svaki dan ljudi udahnu oko dvadeset tisuća puta, što bi iznosilo otprilike trinaest do petnaest tisuća litara zraka. Dakle, neminovno je zaključiti da je glavna komponenta života na Zemlji onda svakako zrak. Kao glavna komponenta, neophodan je za opstanak svih živih bića. Zrak je dakle mješavina plinova i to prvenstveno dušika i kisika, a zatim ugljikova dioksida, argona, neona, vodika i drugih. S obzirom na količinu zraka koju ljudi dnevno udišu važno je voditi računa o kvaliteti zraka koji se udiše. Bilo kakvo onečišćenje u zraku utječe na zdravlje ljudi, pravilan rad i aktivnost tijela, cirkulaciju krvi, pravilan rad mozga, a samim tim i na kvalitetu života. Velik je broj parametara koji utječu na onečišćenje zraka. Međutim, većina čestica i plinova koji utječu na kvalitetu zraka nastaju ljudskim djelovanjem i uglavnom potječu iz urbanih i industrijskih područja. Tako primjerice, veliki gradovi poput Pekinga ili Delhija zbog velike naseljenosti i industrijalizacije imaju problem s tamnim smogom. Koncentracija onečišćujućih tvari u zraku zajedno sa povezanim zdravstvenim rizicima mogu se prikazati indeksom kvalitete zraka, AQI. Indeks kvalitete zraka može se odrediti „ručno“ mjerenjem utjecaja pojedinih parametara; temperature, tlaka, vidljivosti i slično te sumiranjem njihovih utjecaja. Ali, kako bi se brže i jednostavnije odredio utjecaj pojedinih parametara na AQI moguća je primjena algoritama strojnog učenja uz korištenje nekog od dostupnih programskih jezika. Dakle, cilj ovog rada jest primjenom algoritama strojnog učenja i programskog jezika R pronaći model koji najbolje predviđa indeks kvalitete zraka te usporediti mjerne vrijednosti indeksa kvalitete zraka s vrijednostima dobivenim predikcijom. |
Abstract (english) | Every day, people breathe in about twenty thousand times, which would amount to approximately thirteen to fifteen thousand liters of air. Therefore, it is inevitable to conclude that the main component of life on Earth is air. As the main component, it is necessary for the survival of all living beings. Air is a mixture of gases, primarily nitrogen and oxygen, followed by carbon dioxide, argon, neon, hydrogen, and others. Considering the amount of air that people breathe in daily, it is important to take care of the quality of air that is inhaled. Any air pollution affects human health, proper body work and activity, blood circulation, proper brain work, and therefore the quality of life. There are a large number of parameters that influence air pollution. However, most of the particles and gases that affect air quality are human-made and mainly originate from urban and industrial areas. For example, large cities such as Beijing or Delhi have a problem with dark smog due to high population and industrialization. The concentration of pollutants in the air together with the associated health risks can be represented by the air quality index, AQI. The air quality index can be determined "manually" by measuring the influence of individual parameters; temperature, pressure, visibility, and similar but also summarizing their effects. But, to determine the influence of individual parameters on AQI more quickly and simply, the application of the machine learning algorithms combined with one of the available programming languages is possible. Therefore, the goal of this work is to find a model that best predicts the air quality index by applying machine learning algorithms and the R programming language and to compare the measured values of the air quality index with the values obtained by prediction. |