Dərin öyrənmə (ing. Deep Learning) — süni intellektin bir bölməsi olaraq, çoxqatlı neyron şəbəkələrindən istifadə edərək mürəkkəb dataların avtomatik olaraq xüs

Dərin öyrənmə (ing. Deep Learning) — süni intellektin bir bölməsi olaraq, çoxqatlı neyron şəbəkələrindən istifadə edərək mürəkkəb dataların avtomatik olaraq xüsusiyyətlərini öyrənməyə imkan verən maşın öyrənməsi üsulu. Bu üsul kompüter görməsi, təbii dilin emalı, səs tanıma, tibbi diaqnostika və avtonom nəqliyyat kimi sahələrdə inqilabi nəticələr əldə edib.

Tarixi

Dərin öyrənmənin əsası 1940-cı illərdə McCulloch və Pitts tərəfindən təklif edilən sadə neyron modelinə gedib çıxır. 1980-ci illərdə geri yayılma alqoritmi ilə çoxqatlı şəbəkələrin öyrədilməsi mümkün oldu. 2006-cı ildə Geoffrey Hintonun “deep belief networks” işi müasir “dərin öyrənmə” dövrünü başlatdı. 2012-ci ildə ImageNet yarışmasında AlexNet-in qələbəsi sahəyə kütləvi maraq yaratdı. Son onillikdə GPU hesablamalarının ucuzlaşması və böyük verilənlər bazalarının yaranması sayəsində dərin öyrənmə praktiki olaraq bütün elm və sənaye sahələrinə nüfuz edib.

İş prinsipi

Dərin şəbəkə üç və daha artıq gizli qatdan ibarətdir. Hər qat aşağıdan gələn siqnalları çəkir, xüsusiyyət xəritəsi yaradır və nəticəni yuxarı qata ötürür. Son qat vəzifəyə görə klassifikator, regressor və ya generator olur. Böyük həcmli etiketli və ya etiketsiz datalar şəbəkənin çəkilərsə ümumiləşdirmə qabiliyyətini artırır. Aktivasiya funksiyaları (ReLU, sigmoid, Swish) və arxitektur qatları (konvolusiya, max-pool, dropout) bu prosesdə əsas rol oynayır.

Öyrənmə növləri

Nəzarətli öyrənmə – CNN, RNN, Transformer
Nəzarətsiz öyrənmə – autoencoder, GAN, diffusion
Öz-özünə öyrənmə – masked language modeling, contrastive learning
Gücləndirməli öyrənmə – DQN, PPO, DDPG

Arxitektur növləri

Konvolusiya neyron Şəbəkələri (CNN)

Rəqəmsal görüntülərdə yerli xüsusiyyətləri tutmaq üçün istifadə olunur. ResNet, DenseNet, EfficientNet nümunələrdir. Tibbi görüntülərdə dəqiq diaqnoz, 3-D CT mərhələlərində klinik baxış əsasında model qurmaq üçün tətbiq edilir.

Dövri neyron Şəbəkələri (RNN, LSTM, GRU)

Ard-arda məlumatlarda istifadə olunur: səs, mətn, vaxt sıraları. CNN-BiGRU-Attention hibridi ACLR reabilitasiyasında geyilə bilən sensorlardan qüvvət siqnallarını 0,979 R² ilə proqnozlaşdırır.

Transformer və diqqət mexanizmləri

Self-attention ilə uzun münasibətləri tutur; BERT, GPT, ViT, Swin Transformer nümunələrdir. FDGC adlı fazi-derin klasterləşdirmə işi dual-granularity contrastive learning ilə səhv mənfi nümunə seçimini azaldaraq clustering yaxşılaşdırır.

Generative Adversarial Networks (GAN) və Diffusion modelləri

İki şəbəkə – generator və discriminator – bir-biri ilə rəqabət edir. StyleGAN, BigGAN, DDPM, Stable Diffusion foto-realistik görüntü, super-aydınlatma və bərpa işlərində istifadə olunur. Uzaktan algılama fusyonunda diffusion modelləri spektral və məkan detallarını ən yaxşı bərpa edir.

Tətbiq sahələri

Dərin öyrənmə kompüter görməsindən tutmuş kənd təsərrüfatına, tibbdən kosmik texnologiyalara qədər geniş spektrdə istifadə olunur. Aşağıda əsas istiqamətlər və 2024–2026-cı illərdə dərc olunmuş nümunəli tədqiqatlar verilib.

Kompüter görməsi və avtonom nəqliyyat

Konvolusiya şəbəkələri (CNN) real zamanlı obyekt təyinatı, yol nişanı tanıma və stereo-məkan dərinliyi hesablamasında standart hala gəlib. İordaniya yol nişanları üzərində aparılan son işdə ResNet-50 + SVM hibridi 0,83 F1 əmsalı ilə şəhər və magistral şəraitində etibarlı tanıma göstərib. Avtonom avtomillərdə kameralar, LiDAR və radar məlumatları CNN və Transformer arxitekturaları ilə birləşdirilərək 99 %-ə yaxın dəqiqliklə idarəetmə qərarı verilir.

Tibb və diaqnostika

Dəri xərçəngi

Balanslaşdırılmamış dərmatoskopiya dəstlərində "mBSML" çərçivəsi mini-batch sampling və metrik itki funksiyası birləşdirərək intra-class dəyişkənliyi və inter-class oxşarlığı eyni anda idarə edir; HAM1000 və ISIC-2018 bazalarında 0,91-dən yuxarı F1 göstərilib.

Rəqəmsal patologiya

Butöv slayd görüntülərində (WSI) CNN, Vision Transformer, GAN və diffusion modelləri adenokarsinoma, sarkoma və limfoma alt-tiplərini ayırd edir; Camelyon-16 dəstində xəstəlik-spesifik xüsusiyyətləri 0,97 AUC ilə proqnozlaşdırır.

Leptospiroz diaqnozu

Süd və qan nümunələrində mikroskopik agqlutinasiya testinin (MAT) vizual qiymətləndirilməsi üçün təlim olunmuş DenseNet121 şəbəkəsi ekspert qiymətləri ilə 0,95-dən yuxarı Pearson korrelyasiyası verir, bu isə epidemioloji monitorinqi sürətləndirir.

Hiperspektral kadran analizi

Yumurta qabığında kadmium çirklənməsi NIR diapazonunda 900–1700 nm dalğa uzunluğu ilə qeyri-məhv edici müəyyən edilir; 1D-CNN + DWT + ensemble arxitekturası 0,91 R² və 3,4 RPD göstəricisi ilə laboratoriya metodlarına alternativ yaradır.

Energetika və infrastruktur

Elektrik ötürücü xətləri

İnspeksiya üçün dron çəkilişlərində YOLOv8 və Swin-Transformer əsaslı modellər izolyator çatı, kabel aşınması və xarici cisimləri 0,95 F1-ə yaxın dəqiqliklə ayırd edir; 500 kV xətti üzrə sınaq 44% nasazlıq əvvəlcədən aşkar göstərib.

Su qurğuları və bəndlər

UAV və sualtı robotlarla toplanan görüntülərdə U-Net, DeepLab ve EfficientUNet arxitekturaları dəmir-beton körpülərdə, bəndlərdə və boru xətlərində çat, pas və eroziya növlərini pixel-səviyyəsində seqmentləşdirir; mIoU 0,82-ə çatır.

Nəqliyyat, dənizçilik və okean proqnozu

Yol nişanları

İordaniya şəbəkəsində ResNet-50 + SVM hibridi 43 sinif üzrə 0,83 F1 göstərib; günəş və kölgə şəraitində transformer-əsaslı augmentasiya dəqiqliyi 7 % artırıb.

Gəmi trayektoriyası

AIS dataları əsasında CNN-LSTM birləşməsi Çin daxili dəniz yollarında gəmi hərəkətini 15 dəqiqəlik üzlük proqnozla 0,92 accuracy ilə təyin edir; toqquşma riski 18% azalıb.

Kürəşio intruziyası

Cənubi Çin dənizində UNET + CNOP (Conditional Non-linear Optimal Perturbation) hibridi 14-günlük Kuroshio intruziyasını 0,85 anomaly correlation ilə proqnozlaşdırır; xəta CNOP həssaslıq sahəsində 20% azaldılaraq ümumi model bacarığı artırılıb.

Kiber-təhlükəsizlik

Sənaye İdarəetmə Sistemləri (ICS) üçün blockchain-lə birləşdirilmiş CNN, LSTM və GAN əsaslı IDS modelləri hücumları 0,99 F1 ilə aşkar edir, etibarlılıq və mənşə yoxlamasını təmin edir.

Kənd təsərrüfatı və ərzaq təhlükəsizliyi

Protein-funksional peptid proqnozu

CNN, autoencoder, GAN və transformer kombinasiyası ilə 10 000-dən çox peptid sırası ekranlaşdırılır; bitter, antioksidan və ACE-inhibitor aktivlikləri 0,90 R² ilə regressiya edilir, bu da funksional məhsul inkişafını sürətləndirir.

NIR/HSI spektral keyfiyyət

Çörək buğdasında nəmiş, zülal və qlüten üçün 1D-CNN, ResNet və Vision Transformer arxitekturaları 900–2500 nm diapazonunda 0,95-dən yuxarı R² göstərir; transfer öyrənmə sayəsində model cəmi 200 spektrumla yenidən kalibrlənə bilir.

Robotika və kosmik enişlər

Dual-asteroid missiyası

DDPG (Deep Deterministic Policy Gradient) alqoritmi ilə hazırlanan dərin gücləndirmə agenti 67P tipli ikili asteroid sistemində eniş-trassanı 44% enerjiyə qənaətlə planlaşdırır; yaxınlaşma fazasında neyrodinamik xəta ±5 sm-ə qədər sıxılır.

Elektrik avtomobili güc modulu

Physics-enhanced U-Net + DRL kombinasiyası pin-fin istilik xəndək dizaynını avtomatlaşdırır; optimal konfiqurasiya bazaya nisbətən 8,8 K temperatur və 11,3% təzyiq düşməsi ilə 10% əlavə güc çıxışı verir.

Digər sahələr

Barmaq izi və biometriya

Latent barmaq izində CNN, DBN, autoencoder və GAN birləşməsi xətt, minutia və poraları 0,99-dan yuxarı dəqiqliklə bərpa edir; NIST SD-302 dəstində 0,12 EER əldə olunub.

Yol-qəza analizi

Bayesian DNN + çəkilmiş itki funksiyası ilə balanslaşdırılmamış motosiklet xəsarətləri datasetində heterojenlik və zaman-moment dəyişməsi nəzərə alınır; model 0,92 F1 göstərərək klassik logit regressiyanı 15% üstələyir.

Fazik 3-D ölçmə

SIFT flow-based pattern registration + CNN birləşməsi spektral örtülmə problemini azaldaraq mürəkkəb toxumalı obyektlərdə 0,05 mm-ə qədər sahə səhvi verir; single-shot rejimi real-zaman istehsala uyğunlaşdırılıb.

Üstünlükləri

Avtomatik xüsusiyyət çıxarışı – əl ilə işarələməyə ehtiyac qalmır
Yüksək dəqiqlik – böyük datalarla 95–99% səviyyəsi
Çoxölçülü məlumatla iş – şəkil, səs, mətn, video, spektr
End-to-end öyrənmə – xüsusiyyət + klassifikator birlikdə

Çətinliklər və perspektivlər

İzaholunma (explainability) – “qara qutu” problemi
Data və hesablama xərci – milyonlarca parametrlə təlim GPU/TPU tələb edir
Ümumiləşdirmə (OOD) – paylanmadan kənar nümunələrdə etibarsızlıq
Etik və təhlükəsizlik – hücumlar (adversarial), qərəz (bias), məxfilik

Gələcək istiqamətlər:

Foundation modelləri (CLIP, GPT-4V, SAM) və çoxsahəli öyrənmə
Zero-shot / few-shot öyrənmə ilə etiket tələbinin azaldılması
Physics-informed və hybrid modellər (PDE + CNN, U-Net + DRL)
Edge AI və səliqəli (green) dərin öyrənmə
Federativ öyrənmə və blockchain ilə etibarlılıq

Proqramlaşdırma ekosistemi

Əsas çərçivələr: TensorFlow, PyTorch, JAX, Paddle, MindSpore
Qatılaşdırılmış kitabxanalar: Keras, FastAI, Lightning, Hugging Face Transformers
Mobil/edge: TensorFlow Lite, ONNX Runtime, Core ML, NCNN
Bulud xidmətləri: Google Vertex, AWS SageMaker, Azure ML, Alibaba PAI

Müqayisə

Klassik ML vs Dərin Öyrənmə
Xüsusiyyət	Klassik ML	Dərin Öyrənmə
Xüsusiyyət hazırlığı	Əl ilə, domain bilik	Avtomatik
Parametr sayı	10²–10⁵	10⁶–10¹¹
Data həcmi	Kiqa–Miqa	Miqa–Tiqa
İzaholunma	Asan	Çətin
Tələb olunan resurs	CPU	GPU/TPU