Dərin öyrənmə (ing. Deep Learning) — süni intellektin bir bölməsi olaraq, çoxqatlı neyron şəbəkələrindən istifadə edərək mürəkkəb dataların avtomatik olaraq xüsusiyyətlərini öyrənməyə imkan verən maşın öyrənməsi üsulu. Bu üsul kompüter görməsi, təbii dilin emalı, səs tanıma, tibbi diaqnostika və avtonom nəqliyyat kimi sahələrdə inqilabi nəticələr əldə edib.
Tarixi
Dərin öyrənmənin əsası 1940-cı illərdə McCulloch və Pitts tərəfindən təklif edilən sadə neyron modelinə gedib çıxır. 1980-ci illərdə geri yayılma alqoritmi ilə çoxqatlı şəbəkələrin öyrədilməsi mümkün oldu. 2006-cı ildə Geoffrey Hintonun “deep belief networks” işi müasir “dərin öyrənmə” dövrünü başlatdı. 2012-ci ildə ImageNet yarışmasında AlexNet-in qələbəsi sahəyə kütləvi maraq yaratdı. Son onillikdə GPU hesablamalarının ucuzlaşması və böyük verilənlər bazalarının yaranması sayəsində dərin öyrənmə praktiki olaraq bütün elm və sənaye sahələrinə nüfuz edib.
İş prinsipi
Dərin şəbəkə üç və daha artıq gizli qatdan ibarətdir. Hər qat aşağıdan gələn siqnalları çəkir, xüsusiyyət xəritəsi yaradır və nəticəni yuxarı qata ötürür. Son qat vəzifəyə görə klassifikator, regressor və ya generator olur. Böyük həcmli etiketli və ya etiketsiz datalar şəbəkənin çəkilərsə ümumiləşdirmə qabiliyyətini artırır. Aktivasiya funksiyaları (ReLU, sigmoid, Swish) və arxitektur qatları (konvolusiya, max-pool, dropout) bu prosesdə əsas rol oynayır.
Öyrənmə növləri
- Nəzarətli öyrənmə – CNN, RNN, Transformer
- Nəzarətsiz öyrənmə – autoencoder, GAN, diffusion
- Öz-özünə öyrənmə – masked language modeling, contrastive learning
- Gücləndirməli öyrənmə – DQN, PPO, DDPG
Arxitektur növləri
Konvolusiya neyron Şəbəkələri (CNN)
Rəqəmsal görüntülərdə yerli xüsusiyyətləri tutmaq üçün istifadə olunur. ResNet, DenseNet, EfficientNet nümunələrdir. Tibbi görüntülərdə dəqiq diaqnoz, 3-D CT mərhələlərində klinik baxış əsasında model qurmaq üçün tətbiq edilir.
Dövri neyron Şəbəkələri (RNN, LSTM, GRU)
Ard-arda məlumatlarda istifadə olunur: səs, mətn, vaxt sıraları. CNN-BiGRU-Attention hibridi ACLR reabilitasiyasında geyilə bilən sensorlardan qüvvət siqnallarını 0,979 R² ilə proqnozlaşdırır.
Transformer və diqqət mexanizmləri
Self-attention ilə uzun münasibətləri tutur; BERT, GPT, ViT, Swin Transformer nümunələrdir. FDGC adlı fazi-derin klasterləşdirmə işi dual-granularity contrastive learning ilə səhv mənfi nümunə seçimini azaldaraq clustering yaxşılaşdırır.
Generative Adversarial Networks (GAN) və Diffusion modelləri
İki şəbəkə – generator və discriminator – bir-biri ilə rəqabət edir. StyleGAN, BigGAN, DDPM, Stable Diffusion foto-realistik görüntü, super-aydınlatma və bərpa işlərində istifadə olunur. Uzaktan algılama fusyonunda diffusion modelləri spektral və məkan detallarını ən yaxşı bərpa edir.
Tətbiq sahələri
Dərin öyrənmə kompüter görməsindən tutmuş kənd təsərrüfatına, tibbdən kosmik texnologiyalara qədər geniş spektrdə istifadə olunur. Aşağıda əsas istiqamətlər və 2024–2026-cı illərdə dərc olunmuş nümunəli tədqiqatlar verilib.
Kompüter görməsi və avtonom nəqliyyat
Konvolusiya şəbəkələri (CNN) real zamanlı obyekt təyinatı, yol nişanı tanıma və stereo-məkan dərinliyi hesablamasında standart hala gəlib. İordaniya yol nişanları üzərində aparılan son işdə ResNet-50 + SVM hibridi 0,83 F1 əmsalı ilə şəhər və magistral şəraitində etibarlı tanıma göstərib. Avtonom avtomillərdə kameralar, LiDAR və radar məlumatları CNN və Transformer arxitekturaları ilə birləşdirilərək 99 %-ə yaxın dəqiqliklə idarəetmə qərarı verilir.
Tibb və diaqnostika
Dəri xərçəngi
Balanslaşdırılmamış dərmatoskopiya dəstlərində "mBSML" çərçivəsi mini-batch sampling və metrik itki funksiyası birləşdirərək intra-class dəyişkənliyi və inter-class oxşarlığı eyni anda idarə edir; HAM1000 və ISIC-2018 bazalarında 0,91-dən yuxarı F1 göstərilib.
Rəqəmsal patologiya
Butöv slayd görüntülərində (WSI) CNN, Vision Transformer, GAN və diffusion modelləri adenokarsinoma, sarkoma və limfoma alt-tiplərini ayırd edir; Camelyon-16 dəstində xəstəlik-spesifik xüsusiyyətləri 0,97 AUC ilə proqnozlaşdırır.
Leptospiroz diaqnozu
Süd və qan nümunələrində mikroskopik agqlutinasiya testinin (MAT) vizual qiymətləndirilməsi üçün təlim olunmuş DenseNet121 şəbəkəsi ekspert qiymətləri ilə 0,95-dən yuxarı Pearson korrelyasiyası verir, bu isə epidemioloji monitorinqi sürətləndirir.
Hiperspektral kadran analizi
Yumurta qabığında kadmium çirklənməsi NIR diapazonunda 900–1700 nm dalğa uzunluğu ilə qeyri-məhv edici müəyyən edilir; 1D-CNN + DWT + ensemble arxitekturası 0,91 R² və 3,4 RPD göstəricisi ilə laboratoriya metodlarına alternativ yaradır.
Energetika və infrastruktur
Elektrik ötürücü xətləri
İnspeksiya üçün dron çəkilişlərində YOLOv8 və Swin-Transformer əsaslı modellər izolyator çatı, kabel aşınması və xarici cisimləri 0,95 F1-ə yaxın dəqiqliklə ayırd edir; 500 kV xətti üzrə sınaq 44% nasazlıq əvvəlcədən aşkar göstərib.
Su qurğuları və bəndlər
UAV və sualtı robotlarla toplanan görüntülərdə U-Net, DeepLab ve EfficientUNet arxitekturaları dəmir-beton körpülərdə, bəndlərdə və boru xətlərində çat, pas və eroziya növlərini pixel-səviyyəsində seqmentləşdirir; mIoU 0,82-ə çatır.
Nəqliyyat, dənizçilik və okean proqnozu
Yol nişanları
İordaniya şəbəkəsində ResNet-50 + SVM hibridi 43 sinif üzrə 0,83 F1 göstərib; günəş və kölgə şəraitində transformer-əsaslı augmentasiya dəqiqliyi 7 % artırıb.
Gəmi trayektoriyası
AIS dataları əsasında CNN-LSTM birləşməsi Çin daxili dəniz yollarında gəmi hərəkətini 15 dəqiqəlik üzlük proqnozla 0,92 accuracy ilə təyin edir; toqquşma riski 18% azalıb.
Kürəşio intruziyası
Cənubi Çin dənizində UNET + CNOP (Conditional Non-linear Optimal Perturbation) hibridi 14-günlük Kuroshio intruziyasını 0,85 anomaly correlation ilə proqnozlaşdırır; xəta CNOP həssaslıq sahəsində 20% azaldılaraq ümumi model bacarığı artırılıb.
Kiber-təhlükəsizlik
Sənaye İdarəetmə Sistemləri (ICS) üçün blockchain-lə birləşdirilmiş CNN, LSTM və GAN əsaslı IDS modelləri hücumları 0,99 F1 ilə aşkar edir, etibarlılıq və mənşə yoxlamasını təmin edir.
Kənd təsərrüfatı və ərzaq təhlükəsizliyi
Protein-funksional peptid proqnozu
CNN, autoencoder, GAN və transformer kombinasiyası ilə 10 000-dən çox peptid sırası ekranlaşdırılır; bitter, antioksidan və ACE-inhibitor aktivlikləri 0,90 R² ilə regressiya edilir, bu da funksional məhsul inkişafını sürətləndirir.
NIR/HSI spektral keyfiyyət
Çörək buğdasında nəmiş, zülal və qlüten üçün 1D-CNN, ResNet və Vision Transformer arxitekturaları 900–2500 nm diapazonunda 0,95-dən yuxarı R² göstərir; transfer öyrənmə sayəsində model cəmi 200 spektrumla yenidən kalibrlənə bilir.
Robotika və kosmik enişlər
Dual-asteroid missiyası
DDPG (Deep Deterministic Policy Gradient) alqoritmi ilə hazırlanan dərin gücləndirmə agenti 67P tipli ikili asteroid sistemində eniş-trassanı 44% enerjiyə qənaətlə planlaşdırır; yaxınlaşma fazasında neyrodinamik xəta ±5 sm-ə qədər sıxılır.
Elektrik avtomobili güc modulu
Physics-enhanced U-Net + DRL kombinasiyası pin-fin istilik xəndək dizaynını avtomatlaşdırır; optimal konfiqurasiya bazaya nisbətən 8,8 K temperatur və 11,3% təzyiq düşməsi ilə 10% əlavə güc çıxışı verir.
Digər sahələr
Barmaq izi və biometriya
Latent barmaq izində CNN, DBN, autoencoder və GAN birləşməsi xətt, minutia və poraları 0,99-dan yuxarı dəqiqliklə bərpa edir; NIST SD-302 dəstində 0,12 EER əldə olunub.
Yol-qəza analizi
Bayesian DNN + çəkilmiş itki funksiyası ilə balanslaşdırılmamış motosiklet xəsarətləri datasetində heterojenlik və zaman-moment dəyişməsi nəzərə alınır; model 0,92 F1 göstərərək klassik logit regressiyanı 15% üstələyir.
Fazik 3-D ölçmə
SIFT flow-based pattern registration + CNN birləşməsi spektral örtülmə problemini azaldaraq mürəkkəb toxumalı obyektlərdə 0,05 mm-ə qədər sahə səhvi verir; single-shot rejimi real-zaman istehsala uyğunlaşdırılıb.
Üstünlükləri
- Avtomatik xüsusiyyət çıxarışı – əl ilə işarələməyə ehtiyac qalmır
- Yüksək dəqiqlik – böyük datalarla 95–99% səviyyəsi
- Çoxölçülü məlumatla iş – şəkil, səs, mətn, video, spektr
- End-to-end öyrənmə – xüsusiyyət + klassifikator birlikdə
Çətinliklər və perspektivlər
- İzaholunma (explainability) – “qara qutu” problemi
- Data və hesablama xərci – milyonlarca parametrlə təlim GPU/TPU tələb edir
- Ümumiləşdirmə (OOD) – paylanmadan kənar nümunələrdə etibarsızlıq
- Etik və təhlükəsizlik – hücumlar (adversarial), qərəz (bias), məxfilik
Gələcək istiqamətlər:
- Foundation modelləri (CLIP, GPT-4V, SAM) və çoxsahəli öyrənmə
- Zero-shot / few-shot öyrənmə ilə etiket tələbinin azaldılması
- Physics-informed və hybrid modellər (PDE + CNN, U-Net + DRL)
- Edge AI və səliqəli (green) dərin öyrənmə
- Federativ öyrənmə və blockchain ilə etibarlılıq
Proqramlaşdırma ekosistemi
- Əsas çərçivələr: TensorFlow, PyTorch, JAX, Paddle, MindSpore
- Qatılaşdırılmış kitabxanalar: Keras, FastAI, Lightning, Hugging Face Transformers
- Mobil/edge: TensorFlow Lite, ONNX Runtime, Core ML, NCNN
- Bulud xidmətləri: Google Vertex, AWS SageMaker, Azure ML, Alibaba PAI
Müqayisə
| Xüsusiyyət | Klassik ML | Dərin Öyrənmə |
|---|---|---|
| Xüsusiyyət hazırlığı | Əl ilə, domain bilik | Avtomatik |
| Parametr sayı | 10²–10⁵ | 10⁶–10¹¹ |
| Data həcmi | Kiqa–Miqa | Miqa–Tiqa |
| İzaholunma | Asan | Çətin |
| Tələb olunan resurs | CPU | GPU/TPU |
Açıq mənbə layihələri
Həmçinin bax
vikipedia, viki, ensiklopediya, kitab, məqalə, oxumaq, pulsuz yüklə, Dərin öyrənmə haqqında məlumat. Dərin öyrənmə nədir? Dərin öyrənmə nə deməkdir?