Kullanıcı:Omarturko/DeepDream
Makine öğrenmesi ve veri madenciliği |
---|
DeepDream, Google mühendisi Alexander Mordvintsev tarafından oluşturulmuştur. DeepDream, algoritmik pareidolia yoluyla görüntülerdeki desenleri bulmak ve geliştirmek için evrişimli bir sinir ağı kullanmaktadır. Böylece kasıtlı olarak aşırı işlenmiş görüntüler vasıtasıyla rüya gibi halüsinojenik bir görünüm oluşturan bilgisayar vizyon programıdır. [1] [2] [3]
Google'ın programı, (derin) "rüya görme" terimini, eğitimli derin bir ağda istenen etkinleştirmeleri üreten görüntülerin üretimine atıfta bulunacak şekilde popüler hale getirmiştir. Ayrıca bu terim, ilgili yaklaşımların bir koleksiyonunu ifade etmektedir.
Tarih
değiştirDeepDream yazılımı, "Inception" isimli filmden esinlenilerek evrişimli sinir ağı formatında oluşturulmuştur.[1] [2] [3] Ayrıca, 2014 yılında ImageNet Büyük Ölçekli Görsel Tanıma Mücadelesi (Large-Scale Visual Recognition Challenge) için geliştirilmiş ve Temmuz 2015'te piyasaya sürülmüştür.
Hayal kurma (dreaming) fikri ve ismi, Google'ın DeepDream programı sayesinde 2015 yılında internette popüler olmuştur. DeepDream fikri, sinir ağları tarihinin ilk dönemlerine dayanmaktadır. Aynı zamanda görsel dokuları sentezlemek için benzer yöntemler kullanılmıştır. [4] İlgili görselleştirme fikirleri, birkaç araştırma grubu tarafından (Google'ın çalışmasından önce) geliştirilmiştir.
Google tekniklerini yayınlamıştır ve kodlarını açık kaynaklı hale getirmiştir. [5] Bundan sonra kullanıcıların kendi fotoğraflarını dönüştürmelerini sağlamak için web hizmetleri, mobil uygulamalar ve masaüstü yazılımları biçiminde bir dizi araç piyasaya çıkmıştır. [6]
İşlem
değiştirYazılım, görüntüleri otomatik olarak sınıflandırmak amacıyla görüntülerdeki yüzleri ve diğer desenleri algılamak üzere tasarlanmıştır. [7] Bununla birlikte, bir kez eğitildikten sonra, ağ ters yönde de çalıştırılabilir ve orijinal görüntüyü biraz ayarlaması istenir, böylece belirli bir çıktı nöronu (örneğin, yüzler veya belirli hayvanlar için olan) daha yüksek bir güven puanı vermektedir. Bu, sinir ağının ortaya çıkan yapısını daha iyi anlamak için görselleştirmeler için kullanılabilir ve DeepDream konseptinin temelini oluşturmaktadır. Bu tersine çevirme prosedürü hiçbir zaman tam anlamıyla açık ve net değildir, çünkü birden çoğa haritalama sürecini kullanmaktadır. [8] Bununla birlikte, yeterince tekrarlamadan sonra, başlangıçta aranan özelliklerden yoksun görüntüler bile, psikedelik ve gerçeküstü görüntülerin algoritmik olarak üretildiği bir pareidolia formunun ortaya çıkmasına yetecektir. Optimizasyon geri yayılımı andırmaktadır, ancak ağ ağırlıklarını ayarlamak yerine ağırlıklar sabit tutulmaktadır ve giriş ayarlanmaktadır.
Örneğin, mevcut bir görüntü "daha kediye benzer" olacak şekilde değiştirilebilmektedir ve elde edilen geliştirilmiş görüntü tekrar prosedüre girilebilmektedir. [2] Bu kullanım, bulutlarda hayvan veya diğer desenleri arama faaliyetine benzemektedir.
Girdinin her pikseline bağımsız olarak gradyan inişinin uygulanması, bitişik piksellerin çok az ilişkiye sahip olduğu ve bu nedenle görüntünün çok fazla yüksek frekans bilgisine sahip olduğu görüntüler üretmektedir. Oluşturulan görüntüler, doğal görüntü istatistiklerine sahip (herhangi bir belirli görüntü için bir tercih olmaksızın) veya basitçe pürüzsüz olan girdileri tercih ederek ve düzenleyici eklenerek büyük ölçüde geliştirilebilir. Örneğin, Mahendran. Bu örnekte parçalı sabit görüntüleri tercih eden toplam varyasyon düzenleyicisini kullanılmıştır. Çeşitli düzenleyiciler daha ayrıntılı olarak tartışılmaktadır. Özellikle görselleştirme ve düzenleme tekniklerinin, görsel bir keşfi yakın zamanda yayınlanmıştır. [9]
Görüntülerin LSD'ye ve psilosibinin neden olduğu halüsinasyonlara atıfta bulunulan benzerliği, yapay sinir ağları ile görsel korteksin belirli katmanları arasında işlevsel bir benzerlik olduğunu düşündürmektedir. [10]
Bir bilgisayar bilimi programı olan Computerphile, Google Dream tarafından kullanılan makine öğrenimi süreçlerini ayrıntılı olarak anlatmaktadır. [11]
Kullanımı
değiştirRüya görme (dreaming) fikri, çıktıdakiler dışındaki gizli (iç) nöronlara uygulanabilmektedir. Bu durum ağın çeşitli bölümlerinin rollerinin ve temsillerinin keşfedilmesine izin vermektedir. Girdiyi tek bir nöronu (bu kullanıma bazen Aktivite Maksimizasyonu olarak adlandırılır) veya tüm nöron katmanını tatmin edecek şekilde optimize etmek de mümkündür.
Rüya görme (dreaming) en çok ağları görselleştirmek veya bilgisayar sanatı üretmek için kullanılmaktadır. Ancak son zamanlarda eğitim setine "hayal edilen" girdilerin eklenmesinin Bilgisayar Bilimi'ndeki soyutlamalar için eğitim sürelerini iyileştirebileceği önerilmiştir.
DeepDream modelinin sanat tarihi alanında da uygulamaya sahip olduğu gösterilmiştir. [12]
DeepDream, Foster the People'ın "Doing It for the Money" şarkısının klibinde kullanılmıştır. [13]
2017'de Sussex Üniversitesi'nden bir araştırma grubu, DeepDream algoritmasını önceden kaydedilmiş bir panoramik videoya uygulamıştır. Bu uygulama ile kullanıcıların psikoaktif maddeler ve / veya psikopatolojik durumların deneyimini taklit etmek için sanal gerçeklik ortamlarını keşfetmelerine olanak tanıyan bir Halüsinasyon Makinesi oluşturulmuştur. [14] Halüsinasyon Makinesi tarafından tetiklenen öznel deneyimlerin, psikedelik duruma fenomenolojik benzerlikler taşırken (psilosibinin uygulanmasını takiben) kontrol (halüsinojenik olmayan) videolardan önemli ölçüde farklı olduğunu göstermişlerdir.
Ayrıca bakınız
değiştirKaynakça
değiştir- ^ a b "DeepDream - a code example for visualizing Neural Networks". Google Research. 2015. 8 Temmuz 2015 tarihinde kaynağından arşivlendi.
- ^ a b c "Inceptionism: Going Deeper into Neural Networks". Google Research. 2015. 3 Temmuz 2015 tarihinde kaynağından arşivlendi. Kaynak hatası: Geçersiz
<ref>
etiketi: "goingdeeper" adı farklı içerikte birden fazla tanımlanmış (Bkz: Kaynak gösterme) - ^ a b Szegedy (2014). "Going Deeper with Convolutions". Computing Research Repository.
- ^ Portilla (2000). "A parametric texture model based on joint statistics of complex wavelet coefficients". International Journal of Computer Vision. 40: 49–70. doi:10.1023/A:1026553619983.
- ^ GitHub'da Omarturko/DeepDream
- ^ Daniel Culpan (3 Temmuz 2015). "These Google "Deep Dream" Images Are Weirdly Mesmerising". Wired. Erişim tarihi: 25 Temmuz 2015.
- ^ "Fear and Loathing in Las Vegas is terrifying through the eyes of a computer". The Verge. 7 Temmuz 2015. Erişim tarihi: 25 Temmuz 2015.
- ^ Hayes (2015). "Computer Vision and Computer Hallucinations". American Scientist. 103 (6): 380. doi:10.1511/2015.117.380. ISSN 0003-0996.
- ^ Olah (7 Kasım 2017). "Feature Visualization". Distill (İngilizce). 2 (11). doi:10.23915/distill.00007. ISSN 2476-0757.
- ^ "When Robots Hallucinate". The Atlantic. 3 Eylül 2015. Erişim tarihi: 24 Eylül 2015.
- ^ https://www.youtube.com/watch?v=BsSmBPmPeYQ [yalın URL]
- ^ Spratt (2017). "Dream Formulations and Deep Neural Networks: Humanistic Themes in the Iconology of the Machine-Learned Image" (PDF). Kunsttexte. Humboldt-Universität zu Berlin. 4.
- ^ Foster The People - Doing It for the Money, 11 Ağustos 2017, erişim tarihi: 15 Ağustos 2017
- ^ Suzuki (22 Kasım 2017). "A Deep-Dream Virtual Reality Platform for Studying Altered Perceptual Phenomenology". Sci Rep. 7 (1): 15982. doi:10.1038/s41598-017-16316-2. PMC 5700081 $2. PMID 29167538.
Dış bağlantılar
değiştir- GitHub'da Deep Dream, python notebook
- Mordvintsev, Alexander; Olah, Christopher; Tyka, Mike (17 Haziran 2015). "Inceptionism: Going Deeper into Neural Networks". 3 Temmuz 2015 tarihinde kaynağından arşivlendi.