Butun axtardiqlarinizi tapmaq ucun buraya: DAXIL OLUN
  Mp4 Mp3 Axtar Yukle
  Video Axtar Yukle
  Shekil Axtar Yukle
  Informasiya Melumat Axtar
  Hazir Inshalar Toplusu
  AZERI CHAT + Tanishliq
  Saglamliq Tibbi Melumat
  Whatsapp Plus Yukle(Yeni)

  • Ana səhifə
  • Təsadüfi
  • Yaxınlıqdakılar
  • Daxil ol
  • Nizamlamalar
İndi ianə et Əgər Vikipediya sizin üçün faydalıdırsa, bu gün ianə edin.

Verilənlərin artırılması

  • Məqalə
  • Müzakirə

Verilənlərin artırılması — maşın öyrənməsi və süni intellekt sahəsində modelin öyrənmə qabiliyyətini artırmaq və ümumiləşdirmə (ing. generalization) bacarığını yüksəltmək üçün mövcud məlumat dəstində süni şəkildə yeni nümunələr yaratmaq prosesi.[1] Bu üsul xüsusilə kompüter görünüşü, təbii dilin emalı və səs tanınması kimi sahələrdə geniş istifadə olunur.[2]

Tipik yanaşmalara təsadüfi fırlatma, kəsmə, ölçü dəyişmə, rəng dəyişiklikləri və səs-küy əlavə edilməsi daxildir.[3] Təbii dil emalında isə sinonim əvəzlənməsi, cümlə strukturlarının dəyişdirilməsi və ya generativ modellərlə yeni mətnlər yaradılması istifadə olunur. Verilənlərin artırılması həmçinin dərin öyrənmə modellərinin həddən artıq öyrənməsinin (ing. overfitting) qarşısını almağa, balanssız məlumat dəstlərini tarazlaşdırmağa və modelin performansını real mühitdə yüksəltməyə xidmət edir.[4]

Mündəricat

  • 1 Siqnal emalı üçün verilənlərin artırılması
    • 1.1 Bioloji siqnallar
    • 1.2 Mexaniki siqnallar
  • 2 İstinadlar

Siqnal emalı üçün verilənlərin artırılması

Zaman sırası (time series) üçün artırma üsulu kimi qalıq və ya blok bootstrap yanaşmalarından istifadə edilə bilər.[5]

Bioloji siqnallar

Süni verilənlərin artırılması, xüsusən yüksək ölçülü və az nümunəli olan bioloji məlumatlar üçün maşın öyrənməsində təsnifatın (ing. classification) keyfiyyətini yüksəltmək baxımından böyük əhəmiyyət daşıyır.[6] Həm əlil, həm də sağlam şəxslərdə robot nəzarəti və siqnal artırılması tətbiqləri hələ də əsasən subyektə xas analizlərə əsaslanır. Parkinson xəstəliyinə aid elektromioqrafiya (EMG) siqnallarının toplanması çətin olduğundan məlumat azlığı xüsusi ilə nəzərə çarpır.[7] Zanini və həmkarları generativ adversarial şəbəkə (xüsusilə DCGAN) istifadə etməklə üslub ötürməsi (ing. style transfer) apararaq Parkinson xəstəliyinə məxsus sintetik EMG siqnallarının yaradılmasının mümkün olduğunu göstərmişdir.[8]

Bu yanaşmalar elektroensefaloqrafiya (EEQ, beyin dalğaları) üçün də mühüm əhəmiyyət kəsb edir. Vanq və digərləri dərin konvolyusion neyron şəbəkələrdən istifadə edərək EEQ-əsaslı emosiyanın tanınması mövzusunu araşdırmış və məlumat artırılması tətbiq edildikdə nəticələrin yaxşılaşdığını göstərmişdir.[9]

Tez-tez istifadə olunan üsullardan biri real məlumatın komponentlərini yenidən tərtib etməklə sintetik siqnallar yaratmaqdır.[10] Lotte “Analogiyaya əsaslanan süni sınaq yaradılması” adlı metod təklif etmişdir.[11] Bu yanaşmada üç nümunə ( x 1 , x 2 , x 3 {\displaystyle x_{1},x_{2},x_{3}}   ) əsasında x 3 {\displaystyle x_{3}}   what x 2 {\displaystyle x_{2}}   nisbəti qədər çevrilmə tətbiq olunur və nəticədə x s y n t h e t i c {\displaystyle x_{synthetic}}   adlı yeni siqnal formalaşır.[12] Bu üsul Linear Discriminant Analysis klassifikatorunun üç müxtəlif verilənlər toplusu üzərində nəticələrini yaxşılaşdırmışdır.[13]

Son araşdırmalar göstərir ki, nisbətən sadə texnikalar belə böyük təsir göstərə bilir. Məsələn, Frir toplanmış verilənlərə səs-küy əlavə etməklə yeni nümunələr yaratmağın, əvvəlcə zəif nəticə göstərən bir neçə modelin öyrənmə qabiliyyətini yüksəltdiyini qeyd etmişdir. Tsinqanos və digərləri böyüklük deformasiyası (ing. magnitude warping),[14] dalğacıq parçalanması (ing. wavelet decomposition) və sintetik səthi EMG modelləri (generativ yanaşmalar) kimi üsulları əl jestlərinin tanınması üçün araşdırmış və artırılmış məlumatların öyrədilmə mərhələsinə əlavə edilməsi nəticəsində təsnifat göstəricilərinin 16%-dək yaxşılaşdığını bildirmişdir. Daha sonrakı tədqiqatlar generativ modellərin süni məlumat yaratmaq və həmin məlumatı öyrənmə prosesinə daxil etmək imkanlarına yönəlmişdir.[15] 2018-ci ildə Luo və digərləri Şərti Vasserşteyn Generativ Adversarial Şəbəkələrindən (ing. Conditional WGAN) istifadə edərək EEQ siqnal məlumatı yaratmış və klassik train-test çərçivəsində təlim dəstinə əlavə etmiş, nəticədə təsnifat göstəricilərinin yaxşılaşdığını müşahidə etmişdir.[16]

Mexaniki siqnallar

Verilənlərin artırılması əsasında mexaniki siqnalların proqnozlaşdırılması yeni texnoloji innovasiyalar – enerji paylanmasının optimallaşdırılması, 5G rabitə sahəsi və robot nəzarət mühəndisliyi kimi istiqamətlər üçün yeni imkanlar açır.[17] 2022-ci ildə Yang və həmkarları məkan-zaman verilənlərinin korrelyasiyası ilə məlumat artırılması və məlumatın azaldılması (ing. data pruning) yanaşmalarını birləşdirən, məhdudiyyətlər, optimallaşdırma və idarəetməni dərin şəbəkə çərçivəsinə inteqrasiya edən metod təklif etmişdir. Bu yanaşma real sənaye layihələrində dərin öyrənmənin interpretasiyasını, təhlükəsizliyini və idarəolunmasını artırmaq üçün açıq riyazi proqramlaşdırma tənlikləri və analitik həllərdən istifadə edir.[17]

İstinadlar

  1. ↑ Dempster, A.P.; Laird, N.M.; Rubin, D.B. "Maximum Likelihood from Incomplete Data Via the EM Algorithm". Journal of the Royal Statistical Society. Series B (Methodological). 39 (1). 1977: 1–22. doi:10.1111/j.2517-6161.1977.tb01600.x. 10 oktyabr 2022 tarixində arxivləşdirilib. İstifadə tarixi: 28 avqust 2024.
  2. ↑ Rubin, Donald. "Comment: The Calculation of Posterior Distributions by Data Augmentation". Journal of the American Statistical Association. 82 (398). 1987. doi:10.2307/2289460. JSTOR 2289460. 7 avqust 2024 tarixində arxivləşdirilib. İstifadə tarixi: 28 avqust 2024.
  3. ↑ Jackman, Simon. Bayesian Analysis for the Social Sciences. John Wiley & Sons. 2009. 236. ISBN 978-0-470-01154-6.
  4. ↑ Shorten, Connor; Khoshgoftaar, Taghi M. "A survey on Image Data Augmentation for Deep Learning". Mathematics and Computers in Simulation. springer. 6. 2019. doi:10.1186/s40537-019-0197-0.
  5. ↑ Wang, Shujuan; Dai, Yuntao; Shen, Jihong; Xuan, Jingxue. "Research on expansion and classification of imbalanced data based on SMOTE algorithm". Scientific Reports (ingilis). 11 (1). 15 dekabr 2021: 24039. Bibcode:2021NatSR..1124039W. doi:10.1038/s41598-021-03430-5. ISSN 2045-2322. PMC 8674253 (#bad_pmc). PMID 34912009 (#bad_pmid).
  6. ↑ Yann Lecun; və b. Learning algorithms for classification: A comparison on handwritten digit recognition (Conference paper). nyuscholars.nyu.edu. World Scientific. 1995. 261–276. İstifadə tarixi: 14 may 2023.
  7. ↑ Simard, P.Y.; Steinkraus, D.; Platt, J.C. Best practices for convolutional neural networks applied to visual document analysis // Seventh International Conference on Document Analysis and Recognition, 2003. Proceedings. 1. 2003. 958–963. doi:10.1109/ICDAR.2003.1227801. ISBN 0-7695-1960-1.
  8. ↑ Hinton, Geoffrey E.; Srivastava, Nitish; Krizhevsky, Alex; Sutskever, Ilya; Salakhutdinov, Ruslan R. "Improving neural networks by preventing co-adaptation of feature detectors". 2012. arXiv:1207.0580 [cs.NE].
  9. ↑ Cagli, Eleonora; Dumas, Cécile; Prouff, Emmanuel. Convolutional Neural Networks with Data Augmentation Against Jitter-Based Countermeasures: Profiling Attacks Without Pre-processing // Fischer, Wieland; Homma, Naofumi (redaktorlar ). Cryptographic Hardware and Embedded Systems – CHES 2017. Lecture Notes in Computer Science (ingilis). 10529. Cham: Springer International Publishing. 2017. 45–68. doi:10.1007/978-3-319-66787-4_3. ISBN 978-3-319-66787-4.
  10. ↑ Shorten, Connor; Khoshgoftaar, Taghi M. "A survey on Image Data Augmentation for Deep Learning". Journal of Big Data. 6 (1). 6 iyul 2019: 60. doi:10.1186/s40537-019-0197-0. ISSN 2196-1115.
  11. ↑ Lotte, Fabien. "Signal Processing Approaches to Minimize or Suppress Calibration Time in Oscillatory Activity-Based Brain–Computer Interfaces" (PDF). Proceedings of the IEEE. 103 (6). 2015: 871–890. doi:10.1109/JPROC.2015.2404941. ISSN 0018-9219. 3 aprel 2023 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 5 noyabr 2022.
  12. ↑ Ghorbel, Emna; Ghorbel, Faouzi. "Data augmentation based on shape space exploration for low-size datasets: application to 2D shape classification". Neural Computing and Applications (ingilis). 36 (17). 1 iyun 2024: 10031–10054. doi:10.1007/s00521-024-09798-5. ISSN 1433-3058.
  13. ↑ Anicet Zanini, Rafael; Luna Colombini, Esther. "Parkinson's Disease EMG Data Augmentation and Simulation with DCGANs and Style Transfer". Sensors. 20 (9). 2020: 2605. Bibcode:2020Senso..20.2605A. doi:10.3390/s20092605. ISSN 1424-8220. PMC 7248755 (#bad_pmc). PMID 32375217 (#bad_pmid).
  14. ↑ Wang, Fang; Zhong, Sheng-hua; Peng, Jianfeng; Jiang, Jianmin; Liu, Yan. Data Augmentation for EEG-Based Emotion Recognition with Deep Convolutional Neural Networks // MultiMedia Modeling. Lecture Notes in Computer Science. 10705. 2018. 82–93. doi:10.1007/978-3-319-73600-6_8. ISBN 978-3-319-73599-3. ISSN 0302-9743.
  15. ↑ Freer, Daniel; Yang, Guang-Zhong. "Data augmentation for self-paced motor imagery classification with C-LSTM". Journal of Neural Engineering. 17 (1). 2020: 016041. Bibcode:2020JNEng..17a6041F. doi:10.1088/1741-2552/ab57c0. hdl:10044/1/75376. ISSN 1741-2552. PMID 31726440.
  16. ↑ Tsinganos, Panagiotis; Cornelis, Bruno; Cornelis, Jan; Jansen, Bart; Skodras, Athanassios. "Data Augmentation of Surface Electromyography for Hand Gesture Recognition". Sensors. 20 (17). 2020: 4892. Bibcode:2020Senso..20.4892T. doi:10.3390/s20174892. ISSN 1424-8220. PMC 7506981 (#bad_pmc). PMID 32872508 (#bad_pmid).
  17. ↑ 1 2 Yang, Yang. "Wind speed forecasting with correlation network pruning and augmentation: A two-phase deep learning method". Renewable Energy. 198 (1). 2022: 267–282. arXiv:2306.01986. Bibcode:2022REne..198..267Y. doi:10.1016/j.renene.2022.07.125. ISSN 0960-1481.
Mənbə — "https://az.wikipedia.org/w/index.php?title=Verilənlərin_artırılması&oldid=8319208"
Informasiya Melumat Axtar