Відбувся вебінар «Наука про дані й інструменти для великих даних» у межах проєкту Горизонт HEI4S3-RM. Свої доповіді презентували науковці з Іспанії та Греції.
Мігель Ангел Родригес Роман, доцент кафедри обчислювальних наук і штучного інтелекту Університету Уельви, розповів про концепції щодо великих даних, їхню історію, причини виникнення, архітектуру й пов’язані з ними проблеми. Він сфокусувався на найбільш популярних платформах й інструментах для роботи з великими даними, серед яких Hadoop, Mapreduce, HDFSPIG, HIVE, Spark RDD, Dataframes.
Пан Родригес наочно й детально показав, як використовувати Python, Numpy, Panda, Matplotlib, Sklearn для машинного навчання, застосованого до даних. Науковець презентував також LLM/Jupyter notebooks – навчальні помічники для коду й машинного навчання.
Антоніос Куфу, дослідник лабораторії «Гефест» відділу хімії Міжнародного грецького університету, прочитав лекцію про застосування великих даних і машинного навчання. Він дав визначення великих даних, розповів про основні інструменти для роботи з ними: Microsoft Azure HDInsight, Microsoft SQL Server Big Data Clusters, IBM BigInsights, Cloudera Data Platform і MapR Convergent Data Platform.
Основна частина виступу пана Куфу була присвячена застосуванню великих даних і машинного навчання в охороні праці й обчислювальній хімії. Так, він презентував аналітичну програму для попередження нещасних випадків на будівництві. Антоніос Куфу розповів, як збираються й аналізуються дані, розробляються відповідні заходи на їхній основі. Також дослідник пояснив, як за допомогою великих даних і машинного навчання створюються програми для симулювання й аналізу молекулярних систем на атомному рівні в реальних умовах.