Böyük verilənlərin klasterləşdirilməsi üçün yeni alqoritm işlənilib

Böyük verilənlərin klasterləşdirilməsi üçün yeni alqoritm işlənilib -Kybernetika jurnalında çap olunub

Mövcud kompüter resursları daxilində böyük verilənləri klasterləşdirməyə imkan verən yeni alqoritm işlənilib.

Faktinfo.az xəbər verir ki,beynəlxalq əməkdaşlıq çərçivəsində AMEA-nın vitse-prezidenti, ETN İnformasiya Texnologiyaları İnstitutunun baş direktoru, akademik Rasim Əliquliyev, AMEA-nın müxbir üzvü Ramiz Alıquliyev və Avstraliya Federasiya Universitetinin professoru Adil Bağırov tərəfindən aparılan tədqiqatların nəticələri təsir əmsalı (impact factor) 2.2 olan “Kybernetika” jurnalında çap olunub.

“IBK-means: böyük verilənlərin klasterləşdirilməsi üçün iterativ paketli k-mərkəzlər (k-means) alqoritmi” adlı tədqiqat işində təqdim olunan iterativ paketli k-mərkəzlər (iterative batch k-means, “ibk-means”) alqoritmi böyük verilənlərin emalında mövcud məhdudiyyətləri aradan qaldırmaq üçün işlənilib. Ənənəvi k-means və mini-paketli k-means alqoritmləri böyük verilənlər dəstində yaddaş və hesablama gücü məhdudiyyətləri səbəbindən effektiv olmur. Təklif olunan yeni alqoritm isə verilənləri hissələr (paket) üzrə emal etməklə bu çətinliyi aradan qaldırır, nəticədə həm sürət, həm də dəqiqlik baxımından daha üstün nəticələr əldə edilir.

Təcrübələr göstərib ki, iterativ paketli k-mərkəzlər alqoritmi verilənlər dəstinin ölçüsündən asılı olaraq daha az vaxt sərf edir və daha dəqiq klasterləşdirmə nəticələri verir. Hissələrin ölçüsü artdıqca alqoritmin məhsuldarlığı da artır: yerinə yetirilmə vaxtı azalır, klasterlərin keyfiyyəti isə yaxşılaşır. Xüsusilə böyük verilənlər dəstində aparılan eksperimentlər “ibk-means”in real vaxt rejimində səmərəli nəticələr verdiyini sübut etmişdir.

Tədqiqatçılar vurğulayırlar ki, təklif olunan yanaşma yalnız nəzəri cəhətdən deyil, həm də praktik tətbiq baxımından əhəmiyyətlidir. Alqoritm süni intellekt və ekspert sistemlərində real vaxtda böyük verilənlərin emalında istifadə oluna bilər. Bununla yanaşı, nəticələr gələcəkdə daha dəqiq və səmərəli klasterləşdirmə alqoritmlərinin işlənməsinə də yol açır.

Məqalədə həmçinin qeyd olunur ki, iterativ paketli k-mərkəzlər alqoritmi kompüter resurslarından daha səmərəli istifadə etməyə imkan verir. Milyonlarla elementdən ibarət verilənlər dəstinin emalı üçün ənənəvi alqoritmlər kifayət qədər vaxt və resurs tələb etdiyi halda, iterativ paketli k-mərkəzlər alqoritmi məhdud resurslu kompüterlərdə belə böyük verilənlərlə işləməyi mümkün edir. Bu isə gələcək tədqiqatlar üçün yeni perspektivlər açır.

Nəticə etibarilə, “ibk-means” alqoritmi həm elmi, həm də tətbiqi baxımdan mühüm əhəmiyyət kəsb edir və onun inkişafı böyük verilənlərin analizi, qərarvermə sistemləri və süni intellekt tətbiqlərində mühüm rol oynaya bilər.

Qeyd edək ki, "Kybernetika" jurnalı Web of Science və Scopus beynəlxalq elmi bazalarında indeksləşir.

Faktinfo.az

Birinci məlumatlanmaq üçün facebook səhifəmizi