DOLAR

34,0521$% -0.04

EURO

37,9814% 0.16

GRAM ALTIN

2.818,13%0,55

ÇEYREK ALTIN

4.679,00%0,70

TAM ALTIN

18.661,00%0,69

ONS

2.572,46%0,54

BİST100

9.951,69%1,81

Akşam Vakti a 19:17
Bursa HAFİF YAĞMUR 23°
  • Adana
  • Adıyaman
  • Afyonkarahisar
  • Ağrı
  • Amasya
  • Ankara
  • Antalya
  • Artvin
  • Aydın
  • Balıkesir
  • Bilecik
  • Bingöl
  • Bitlis
  • Bolu
  • Burdur
  • Bursa
  • Çanakkale
  • Çankırı
  • Çorum
  • Denizli
  • Diyarbakır
  • Edirne
  • Elazığ
  • Erzincan
  • Erzurum
  • Eskişehir
  • Gaziantep
  • Giresun
  • Gümüşhane
  • Hakkâri
  • Hatay
  • Isparta
  • Mersin
  • istanbul
  • izmir
  • Kars
  • Kastamonu
  • Kayseri
  • Kırklareli
  • Kırşehir
  • Kocaeli
  • Konya
  • Kütahya
  • Malatya
  • Manisa
  • Kahramanmaraş
  • Mardin
  • Muğla
  • Muş
  • Nevşehir
  • Niğde
  • Ordu
  • Rize
  • Sakarya
  • Samsun
  • Siirt
  • Sinop
  • Sivas
  • Tekirdağ
  • Tokat
  • Trabzon
  • Tunceli
  • Şanlıurfa
  • Uşak
  • Van
  • Yozgat
  • Zonguldak
  • Aksaray
  • Bayburt
  • Karaman
  • Kırıkkale
  • Batman
  • Şırnak
  • Bartın
  • Ardahan
  • Iğdır
  • Yalova
  • Karabük
  • Kilis
  • Osmaniye
  • Düzce
a
SON DAKİKA

DOLAR 34,0521

EURO 37,9814

ALTIN 2.818,13

BİST 100 9.951,69

Akşam 19:17

23°

Openaı Sora’yı Unutun: Kling Aı Büyüleyici Görüntüler Üretiyor

ad826x90
Yapay zeka alanındaki büyüme inanılmaz bir hızla ilerlemeye devam ediyor. Şimdi şubat ayında OpenAI tarafından tanıtılan metinden görüntüye yapay zeka Sora’nın zerinden birkaç ay geçmişken önemli bir rakip beklenmedik bir şekilde Çin’den geldi. Çinli video platformu şirketi Kuaishou firmasının üretken video modeli Kling, gelişmiş yetenekleri ile büyüleyici gözüküyor.

Kling, Sora’yı unutturdu

OpenAI, Sora’yı bu yılın başında göstermiş olsa da hala genel kullanıma açmış değil. Öte yandan Kuaishou, Kling’i halihazırda piyasaya sürmüş durumda. Dolayısıyla Kling, halkın test etmesi için ücretsiz olarak sunulan ilk metinden görüntüye üretken yapay zeka modellerinden birisi olarak tarihe geçiyor.

Aktif kullanıcı sayısı 600 milyonu aşan kısa video platformu, yeni aracını bu ayın başlarında duyurdu. Kling, 30 FSP kare suratı ve 1080p‘ye kadar video çözünürlüğü ile iki dakikaya kadar uzunlukta görüntüler üretebiliyor. Bilindiği üzere Sora, 1 dakikalık klipler üretebiliyordu. Kuaishou ve kullanıcılar tarafından yayınlanan Kling örneklerine baktığımızda üretken video modelinin istemlere (prompt) bağlı kaldığını ve fizik konusunda epeyce iyi iş çıkardığını görüyoruz. Kling aynı zamanda bir fotoğrafı girdi olarak kullanarak onu görüntüye da dönüştürebiliyor.

Kling, en temelinde Sora ile aynı tıp difüzyon transformatör modeline dayanıyor ve çeşitli en uzunluk oranları ile farklı çekim çeşitlerini destekleyebiliyor. Yapay zekada kullanılan modelin de şirket içinde tescilli bir model olduğunu söyleyelim. Şirketin web sitesinde göre Kling, uzuv hareketini güzelleştirmek için gelişmiş 3D yüz ve vücut yapılandırma yeteneğine sahip. Aslında fizikî doğruluk da buradan geliyor.

Kling’in örneklerine yakından baktığımızda ise etkileyici fotogerçekçi sahneler sunabildiğini fakat diğer yapay zeka görüntülerinde gördüğümüz benzer bulanıklıkların da var olduğunu görebiliyoruz. Papağan videosu gibi bazı örneklerde görüntünün yapay zeka tarafından üretildiğini tespit etmek ilgili gözler için bile zor olabiliyor. Bu da modelin gücünü gözler önüne seriyor.

Kling’in bir diğer önemli gücü de sıvılarla olan ilişkisi. Sora, Runway ve öbürleri sıvılar konusunda zorlanabiliyor. Kling’in ise dengeli bir şekilde bir bardak kahveye süt dökebiliyor. Kling ve diğer benzer yapay zekaların çalışmaları dediğimiz gibi hayli benzer: Klasik olarak video oluşturma yapay zekalarında kullanılan difüzyon modellerini, daha büyük video veri evraklarını anlamasına ve daha verimli sonuçlar üretmesine yardımcı olan bir transformatör mimarisiyle birleştiriyor.

Ancak Kling’in en büyük gücü ise bu veriler üzerindeki hakimiyeti. Firma Çin’in en büyük kısa video platformlarından birisi ve kullanıcılar platforma milyonlarca video yüklüyor. Tüm bunlara rağmen Kling, şimdilik en azından halka açık sürümünde sadece birkaç saniyelik çıktılar üretiyor. Sora’nın da birçok örnekte kısa görüntüler yaptığını da söyleyelim. Bu aslında halüsinasyon problemini azaltmaya yönelik bir adım. Video süresi ne kadar uzarsa modelin daha fazla mümkünlüğü tahmin etmesi ve haliyle kusurlara daha açık olması beklenir.

Rekabet artıyor

Şimdilik piyasada bulunan metinden görüntüye yapay zekalar çoklukla birkaç saniyelik görüntüler üretebiliyor. Fakat bu birkaç saniyelik (5-20sn) görüntülerin bile bölümde büyük değişiklikler yapması bekleniyor. Günümüz sosyal medya mecralarında insanlar dikey formatta çoklukla birkaç saniyelik görüntüler izleyip kaydırmaya devam ediyor. Yapay zekalar tarafından üretilen kısa ama etkileyici görüntüler bu tüketime uyuyor. Ayrıca reklam noktasında da kullanılabilirler.

Ancak önümüzdeki dönemlerde bu araçlar içerik üreticilerini destekleyen üretkenlik araçları olarak kalacak. İlerleyen vakitlerde ise bu araçların video kliplerinde ve hatta sinema dünyasında kullanıldığını göreceğiz.

Sora için söyleyecek yeni bir şey yok fakat esas rakibi Runway, Gen-3 Alpha ile video üretken yapay zekasında büyük geliştirmeler yaptı. Artık ince denetimler, daha fazla tutarlılık ve kalite sunuyor.

Adını daha önce duymadığımız Luma AI isimli bir teşebbüs de benzer bir modeli genel kullanım için yayınlamış durumda ve o da etkileyici görünüyor. Kuaishou’nun en büyük rakibi olan ByteDance‘ın da yakında üretken video aracını piyasaya süreceği söyleniyor. ByteDance bilindiği üzere TikTok’un sahibi pozisyonunda. Dolayısıyla üretken yapay zeka ile video üretme alanındaki rekabet hızla artıyor.

Kling vs Sora vs Runway vs Luma

Kling, Sora, Runway ve Luma’dan bahsetmişken bunların kıyaslamalarını yapmamak da olmaz. Aşağıdaki GIF’ler aracılığıyla modeller arasındaki farkları görebilirsiniz. Bazıları aynı sahne ve prompttaki performansı doğrudan gösterirken bazıları ise genel kaliteyi sunuyor.

Runway Gen 3

Runway Gen 3

Luma AI

Luma AI

YORUMLAR

s

En az 10 karakter gerekli

Sıradaki haber:

Snapchat, Kullanıcıların Tanımadıklarıyla Bağlantısını Zorlaştıracak Güncellemesini Yayınladı

HIZLI YORUM YAP