32,8826$% -0.25
35,1821€% -0.54
2.449,68%-0,30
4.001,00%-0,17
16.005,00%-0,18
2.326,34%-0,04
10.647,91%-0,31
Google’ın DeepMind yapay zeka laboratuvarı, görüntülere eşlik edecek müzikler ve hatta diyaloglar oluşturabilen yeni bir teknoloji üzerinde çalışıyor.
Laboratuvar, Google Veo ve OpenAI’nin Sora’sı gibi diğer görüntü oluşturma araçlarıyla eşleştirilebilen görüntüden sese (V2A) teknoloji projesindeki gelişmeleri bir görüntüyle paylaştı.
DeepMind ekibi, blog yazısında sistemin ham pikselleri anlayabildiğini ve ekranda olup bitenler için ses efektleri oluşturmak üzere bu bilgileri metin istemleriyle birleştirebildiğini iddia ediyor.
Yeni yapay zeka aracı sayesinde, sessiz filmler ve diğer sessiz görüntüler gibi klasik çekimler için arka plan müzikleri oluşturmak için de kullanılabilmesi mümkün görünüyor.
Yapay zekayı nasıl eğittiler?
DeepMind’ın araştırmacılarına göre bu yapay zeka, görüntüler, ses kayıtları ve seslerin detaylı açıklamalarını içeren açıklamalar üzerinde eğitildi. Bu sayede, yapay zeka muhakkak sesleri görsel sahnelerle ilişkilendirmeyi öğrendi.
Yeni araçta metin istemi kullanmak isteğe bağlı olsa da, son ürünü mümkün olduğunca doğru ve gerçekçi olacak şekilde şekillendirmek ve güzelleştirmek için kullanıcı metin üzerinden yapay zekaya müdahalede bulunabiliyor. Örneğin çıktıyı istediğiniz sesleri oluşturmaya yönlendirmek için olumlu istemler veya istemediğiniz seslerden uzaklaştırmak için olumsuz istemler girebiliyorsunuz. Aşağıdaki görüntüde izleyeceğini örnekte ekip şu ipucunu kullanmış: “Sinematik, tansiyon, korku sineması, müzik, tansiyon, ambiyans, beton üzerindeki ayak sesleri.“
Videodaki ses efektleri şimdi çok etkileyici ve gerçekçi görünmese de bu alanda bir başlangıç olduğunu ve kısa sürede kendini geliştireceğini de unutmamak gerekiyor.
“Yapay Zeka 10 Yıl İçinde İnsanlardan 10 Bin Kat Daha Akıllı Olacak”
Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için veri politikamızı inceleyebilirsiniz.