DeepDream, Alexander Mordvintsev adlı Google mühendisi tarafından oluşturulmuştur. DeepDream, algoritmik pareidolia yoluyla görüntülerdeki desenleri tespit etmek ve görüntüleri geliştirmek için evrişimli sinir ağı kullanmaktadır. Böylece aşırı işlenmiş görüntüler vasıtasıyla rüya tarzında halüsinojenik görüntüler oluşturan bilgisayar programıdır.[1][2][3]

Google'ın programı, (derin) "rüya görme" terimini, eğitimli derin bir ağda istenen etkinleştirmeleri üreten görüntülerin üretimine atıfta bulunacak şekilde popüler hale getirmiştir. Ayrıca bu terim, ilgili biçimlerin bir koleksiyonunu ifade etmektedir.

DeepDream yazılımı, "Inception" isimli filmden esinlenilerek evrişimli sinir ağı formatında oluşturulmuştur.[1][2][3] Ayrıca, 2014 yılında ImageNet Büyük Ölçekli Görsel Tanıma Mücadelesi (Large-Scale Visual Recognition Challenge) için geliştirilmiş ve Temmuz 2015'te piyasaya sürülmüştür.

 
Birden çok katmana sahip bir sinir ağı.

Google'ın DeepDream programı sayesinde hayal kurma (dreaming) fikri ve ismi 2015 yılında internette popüler olmuştur. DeepDream fikri, sinir ağları tarihinin ilk dönemlerine dayanmaktadır. Aynı zamanda görsel doku oluşturmak için benzer yöntemler kullanılmıştır.[4] Benzer görselleştirme fikirleri, çeşitli araştırma grupları tarafından (Google'ın çalışmasından önce) geliştirilmiştir.

Google tekniklerini yayınlamıştır ve kodlarını açık kaynaklı hale getirmiştir.[5] Bundan sonra kullanıcıların kendi fotoğraflarını dönüştürmelerini sağlamak için mobil uygulamalar, web hizmetleri ve masaüstü yazılımları formatında çeşitli araçlar piyasaya çıkmıştır.[6]

Orijinal fotoğraf (üstteki), DeepDream'in 10 yineleme ile eğitilmiş hali ile köpekleri algılaması (ortadaki), DeepDream'in 50 yineleme ile eğitilmiş hali ile köpekleri algılaması (alttaki).

Program, görüntüleri otonom olarak sınıflandırmak amacıyla görüntülerdeki desenleri ve yüzleri algılamak için tasarlanmıştır.[7] Bununla birlikte, program bir kez eğitildikten sonra, ağ ters yönde de çalıştırılabilmektedir. Ardından orijinal görüntüyü biraz ayarlaması istenmektedir, böylece belirli bir çıktı nöronu (örneğin, yüzler veya belirli hayvanlar için) daha yüksek bir güven puanı vermektedir. Bu, sinir ağının ortaya çıkan yapısını daha iyi anlamak için kullanılan görselleştirmeler ile kullanılabilmektedir. Bu durum DeepDream konseptinin temelini oluşturmaktadır. Bu tersine çevirme prosedürü hiçbir zaman tam olarak anlaşılır değildir, çünkü birden çoğa haritalama sürecini kullanmaktadır.[8] Bununla birlikte, yeterince eğitimden sonra, başlangıçta aranan özelliklerden yoksun görüntüler bile, psikedelik ve gerçeküstü görüntülerin algoritmik olarak üretildiği bir pareidolia formunun ortaya çıkmasına neden olacaktır. Optimizasyon geri yayılımı andırmaktadır, ağırlıklar sabit tutulmaktadır ve giriş ayarlanmaktadır. Yalnızca ağ ağırlıklarını ayarlanmaktadır.

Örneğin, mevcut bir görüntü "kediye daha fazla benzer" olacak şekilde değiştirilebilmektedir ve elde edilen geliştirilmiş görüntü tekrar işleme girilebilmektedir.[2] Bu kullanım, bulutlardaki desenleri hayvan veya diğer desenlere benzetme durumuna benzemektedir.

Girdinin her pikseline bağımsız olarak gradyan inişinin uygulanması, bitişik piksellerin çok az ilişkiye sahip olduğu ve bu nedenle görüntünün çok fazla yüksek frekans bilgisine sahip olduğu görüntüler üretmektedir. Oluşturulan görüntüler, doğal görüntü istatistiklerine sahip (herhangi bir belirli görüntü için bir tercih olmaksızın) veya basitçe pürüzsüz olan girdileri tercih ederek ve düzenleyici eklenerek büyük ölçüde geliştirilebilir. Örneğin, Mahendran. Bu örnekte parçalı sabit görüntüleri tercih eden toplam varyasyon düzenleyicisini kullanılmıştır. Çeşitli düzenleyiciler daha ayrıntılı olarak tartışılmaktadır. Özellikle görselleştirme ve düzenleme tekniklerinin, görsel bir keşfi yakın zamanda yayınlanmıştır.[9]

Görüntülerin LSD'ye ve psilosibinin neden olduğu halüsinasyonlara atıfta bulunulan benzerliği, yapay sinir ağları ile görsel korteksin belirli katmanları arasında işlevsel bir benzerlik olduğunu düşündürmektedir.[10]

Bir bilgisayar bilimi programı olan Computerphile, Google Dream tarafından kullanılan makine öğrenimi süreçlerini ayrıntılı olarak anlatmaktadır.[11]

Kullanımı

değiştir
 
Havuzdaki üç adamın yoğun şekilde DeepDream ile işlenmiş fotoğrafı
 
ImageNet üzerinde eğitilmiş VGG16 ağını kullanan DeepDream efektli "Mona Lisa"

Rüya görme (dreaming) fikri, çıktıdakiler dışındaki gizli (iç) nöronlara uygulanabilmektedir. Bu durum ağın çeşitli bölümlerinin rollerinin ve temsillerinin keşfedilmesine izin vermektedir. Girdiyi tek bir nöronu (bu kullanıma bazen Aktivite Maksimizasyonu olarak adlandırılır) veya tüm nöron katmanını tatmin edecek şekilde optimize etmek de mümkündür.

Rüya görme (dreaming) en çok ağları görselleştirmek veya bilgisayar sanatı üretmek için kullanılmaktadır. Ancak son zamanlarda eğitim setine "hayal edilen" girdilerin eklenmesinin Bilgisayar Bilimi'ndeki soyutlamalar için eğitim sürelerini iyileştirebileceği önerilmiştir.

DeepDream modelinin sanat tarihi alanında da uygulamaya sahip olduğu gösterilmiştir.[12]

DeepDream, Foster the People'ın "Doing It for the Money" şarkısının klibinde kullanılmıştır.[13]

2017'de Sussex Üniversitesi'nden bir araştırma grubu, DeepDream algoritmasını önceden kaydedilmiş bir panoramik videoya uygulamıştır. Bu uygulama ile kullanıcıların psikoaktif maddeler ve / veya psikopatolojik durumların deneyimini taklit etmek için sanal gerçeklik ortamlarını keşfetmelerine olanak tanıyan bir Halüsinasyon Makinesi oluşturulmuştur.[14] Halüsinasyon Makinesi tarafından tetiklenen öznel deneyimlerin, psikedelik duruma fenomenolojik benzerlikler taşırken (psilosibinin uygulanmasını takiben) kontrol (halüsinojenik olmayan) videolardan önemli ölçüde farklı olduğunu göstermişlerdir.

Ayrıca bakınız

değiştir

Kaynakça

değiştir
  1. ^ a b "DeepDream - a code example for visualizing Neural Networks". Google Research. 2015. 8 Temmuz 2015 tarihinde kaynağından arşivlendi. 
  2. ^ a b c "Inceptionism: Going Deeper into Neural Networks". Google Research. 2015. 3 Temmuz 2015 tarihinde kaynağından arşivlendi.  Kaynak hatası: Geçersiz <ref> etiketi: "goingdeeper" adı farklı içerikte birden fazla tanımlanmış (Bkz: Kaynak gösterme)
  3. ^ a b Szegedy (2014). "Going Deeper with Convolutions". Computing Research Repository. 
  4. ^ Portilla (2000). "A parametric texture model based on joint statistics of complex wavelet coefficients". International Journal of Computer Vision. 40: 49-70. doi:10.1023/A:1026553619983. 
  5. ^ GitHub'da DeepDream
  6. ^ Daniel Culpan (3 Temmuz 2015). "These Google "Deep Dream" Images Are Weirdly Mesmerising". Wired. 8 Mayıs 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Temmuz 2015. 
  7. ^ "Fear and Loathing in Las Vegas is terrifying through the eyes of a computer". The Verge. 7 Temmuz 2015. 8 Temmuz 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 25 Temmuz 2015. 
  8. ^ Hayes (2015). "Computer Vision and Computer Hallucinations". American Scientist. 103 (6): 380. doi:10.1511/2015.117.380. ISSN 0003-0996. 
  9. ^ Olah (7 Kasım 2017). "Feature Visualization". Distill (İngilizce). 2 (11). doi:10.23915/distill.00007. ISSN 2476-0757. 
  10. ^ "When Robots Hallucinate". The Atlantic. 3 Eylül 2015. 4 Eylül 2015 tarihinde kaynağından arşivlendi. Erişim tarihi: 24 Eylül 2015. 
  11. ^ "Arşivlenmiş kopya". 2 Haziran 2021 tarihinde kaynağından arşivlendi. Erişim tarihi: 29 Mayıs 2021. 
  12. ^ Spratt (2017). "Dream Formulations and Deep Neural Networks: Humanistic Themes in the Iconology of the Machine-Learned Image" (PDF). Kunsttexte. Humboldt-Universität zu Berlin. 4. 27 Ekim 2020 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 29 Mayıs 2021. 
  13. ^ Foster The People - Doing It for the Money, 11 Ağustos 2017, 16 Ağustos 2017 tarihinde kaynağından arşivlendi, erişim tarihi: 15 Ağustos 2017 
  14. ^ Suzuki (22 Kasım 2017). "A Deep-Dream Virtual Reality Platform for Studying Altered Perceptual Phenomenology". Sci Rep. 7 (1): 15982. doi:10.1038/s41598-017-16316-2. PMC 5700081 $2. PMID 29167538. 

Dış bağlantılar

değiştir