DOLAR

38,2057$% 0.27

Created with Highcharts 8.2.208:3009:0009:3010:0010:3011:0011:3012:0012:3013:00
EURO

44,1665% 1.51

Created with Highcharts 8.2.208:3009:0009:3010:0010:3011:0011:3012:0012:3013:00
GRAM ALTIN

4.194,98%2,91

Created with Highcharts 8.2.208:3009:0009:3010:0010:3011:0011:3012:0012:3013:00
ÇEYREK ALTIN

6.902,00%2,75

Created with Highcharts 8.2.200:0012:0000:0012:0000:0012:0000:0012:0000:0012:0000:0012:0000:0012:00
TAM ALTIN

27.525,00%2,75

Created with Highcharts 8.2.200:0012:0000:0012:0000:0012:0000:0012:0000:0012:0000:0012:00
ONS

3.420,77%2,82

Created with Highcharts 8.2.208:3009:0009:3010:0010:3011:0011:3012:0012:3013:00
BİST100

9.454,59%1,47

Created with Highcharts 8.2.208:0008:3009:0009:3010:0010:3011:0011:3012:0012:30
İmsak Vakti a 02:00
Bursa PARÇALI AZ BULUTLU 21°
  • Adana
  • Adıyaman
  • Afyonkarahisar
  • Ağrı
  • Amasya
  • Ankara
  • Antalya
  • Artvin
  • Aydın
  • Balıkesir
  • Bilecik
  • Bingöl
  • Bitlis
  • Bolu
  • Burdur
  • Bursa
  • Çanakkale
  • Çankırı
  • Çorum
  • Denizli
  • Diyarbakır
  • Edirne
  • Elazığ
  • Erzincan
  • Erzurum
  • Eskişehir
  • Gaziantep
  • Giresun
  • Gümüşhane
  • Hakkâri
  • Hatay
  • Isparta
  • Mersin
  • istanbul
  • izmir
  • Kars
  • Kastamonu
  • Kayseri
  • Kırklareli
  • Kırşehir
  • Kocaeli
  • Konya
  • Kütahya
  • Malatya
  • Manisa
  • Kahramanmaraş
  • Mardin
  • Muğla
  • Muş
  • Nevşehir
  • Niğde
  • Ordu
  • Rize
  • Sakarya
  • Samsun
  • Siirt
  • Sinop
  • Sivas
  • Tekirdağ
  • Tokat
  • Trabzon
  • Tunceli
  • Şanlıurfa
  • Uşak
  • Van
  • Yozgat
  • Zonguldak
  • Aksaray
  • Bayburt
  • Karaman
  • Kırıkkale
  • Batman
  • Şırnak
  • Bartın
  • Ardahan
  • Iğdır
  • Yalova
  • Karabük
  • Kilis
  • Osmaniye
  • Düzce
a
SON DAKİKA

DOLAR 38,2057

EURO 44,1665

ALTIN 4.194,98

BİST 100 9.454,59

İmsak 02:00

21°

Deepseek Vs Chatgpt: Hangisi Daha İyi?

ad826x90

Çinli bir teşebbüs tarafından geliştirilen ve ChatGPT’yi tahtından indiren DeepSeek sohbet robotu dünyayı kasıp kavuruyor. Sırf teknoloji dünyası değil, çöken paylarla birlikte finans dünyası da bu yapay zekayı konuşuyor.

Doğrusu DeepSeek kısa sürede çok şeyi değiştirdi. ABD Başkanı Donald Trump yeni yapay zeka hakkında ilk yorum yapanlardan oldu. NVİDİA’nın hisseleri çakıldı, şirket sözcülerinden açıklamalar geldi. Meta’nın işvereni Mark Zuckerberg, DeepSeek’e bir cevap bulmak için bir ekip kurmak için harekete geçti. Elon Musk, DeepSeek’in iddialarını bu kadar düşük maliyetle gerçekten yapıp yapamayacağını sorgulamaya başladı.

Çin’in yeni yapay zeka sohbet robotu uzun süreler konuşulacak gibi görünüyor. Peki DeepSeek abartıldığı kadar başarılı mı? ChatGPT yerine DeepSeek kullanmaya başlamalı mıyız? Aslında bunun tam yanıtı sizde. İkisinin de başarılı ve başarısız olduğu taraflar var. Her insanın ihtiyacı, sorduğu sorular ve istekleri farklı. Kimisi diyor ki ChatGPT hala önde, kimisi diyor ki DeepSeek çok iyi işler çıkarıyor.

DeepSeek, Nisan 2023’te ana şirketi High-Flyer için bir yapay zeka laboratuvarı olarak kurulan Çinli bir yapay zeka girişimi. Şirketin tam ismi ise Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. şeklinde.

Mayıs ayında DeepSeek kendi başına bir şirket (High-Flyer yatırımcı olarak kaldı) haline geldi ve DeepSeek-V2 modeli tanıtıldı. V2, ByteDance, Tencent ve Baidu gibi diğer önde gelen Çinli yapay zeka firmalarıyla aynı düzeyde performans sunuyordu, ancak çok daha düşük bir işletme maliyeti vardı.

Şirketin ismi böyle lakin teknoloji dünyasında modellerin ismi de “DeepSeek” olarak lanse ediliyor. Basit bir tabirle DeepSeek, “çıkarım zamanlı hesaplama” olarak bilinen ve “her sorgu için modellerin ilgili kısımlarını kullanan” açık kaynaklı büyük bir dil modeli. Bu sayede maliyet ve hesaplama gücünden tasarruf sağlanabiliyor.

DeepSeek, sohbet robotları ChatGPT, Gemini ve Claude’un yapabildiği her şeyi yapabiliyor. Buna metin, ses, görüntü ve video oluşturma da dahil. Dahası, DeepSeek’in Janus Pro olarak isimlendirilen yeni çok modlu model ailesinin, bir çift sanayi kıyaslamasında DALL-E 3’ün yanı sıra PixArt-alpha, Emu3-Gen ve Stable Diffusion XL’den daha iyi performans gösterdiği bildiriliyor. o1’e rakip olan DeepSeek-R1, karmaşık muhakeme vazifelerini yerine getirmek için özel olarak tasarlanmış olup, sorunlara adım adım tahliller üretmekte ve bir sorunu çözerken muhakeme sürecini adım adım açıkladığı “mantıksal düşünce zincirleri” oluşturabilmekte.

Yapay zeka alanındaki çalışmalarına devam eden şirket, Aralık 2024’te V3 sürümünü piyasaya sürdü. V3‘ün 671 milyar parametreli bir model olduğu ve eğitilmesinin 2 aydan kısa sürdüğü bildirildi. Dahası, Jeffries’in yakın zamanda yaptığı bir tahlile göre DeepSeek’in “eğitim maliyeti sırf 5,6 milyon dolar (2 dolar/800 saat kiralama maliyeti varsayıldığında).

Bu ne anlama geliyor? Meta’nın geliştirdiği Llama modeline harcadığı paranın %10’undan daha az miktarda kaynak tüketildi. Google, Microsoft, xAİ ve OpenAİ gibi diğer ABD merkezli şirketler ise Aİ modellerini eğitmek için yüz milyonlarca ve hatta milyarlarca dolar harcadı, harcıyor. Yani Çinli teşebbüsün harcadığı ölçü rakiplerinin yanında devede kulak kalır.

DeepSeek, büyük miktarda datayı işlemeyi ve eğitim, kodlama veya araştırma gibi belirli alanlarda doğru, yüksek kaliteli dil çıktıları üretmeyi amaçlayan gelişmiş bir açık kaynaklı yapay zeka eğitim dili modeli olarak piyasaya giriş yaptı.

Burada insan benzeri metinleri etkili bir şekilde anlamak ve üretmek için NLP (Natural Language Processing) kullanılıyor. Çinli araştırmacılardan oluşan bir ekip tarafından açık kaynaklı yapay zekayı teşvik etmek amacıyla geliştirildi. GPT-4 ve Claude-3.5-Sonnet gibi kapalı kaynak sistemlerine rakip olan, kaynak açısından verimli bir model. Şimdi temel özelliklerine bakalım:

  • Mimari: DeepSeek, Uzmanların Karışımı (Mixture of Experts, MoE) adı verilen bir tasarım kullanmakta. MoE tasarımı, modelin bilgiyi verimli bir şekilde işlemek için birlikte çalışan farklı uzmanlara sahip olduğu anlamına geliyor. Türkçeye çevirdiğimizde tuhaf görünüyor. Burada uzman denilen şey, büyük ekosistem genelindeki daha küçük bölümleri temsil ediyor. DeepSeek toplam 671 milyar parametreye sahip ve belirli misyonları yerine getirmek için herhangi bir zamanda 37 milyarı aktif edilebiliyor. Parametreler yapay zekanın yapı taşları gibi, dili anlamasına ve üretmesine yardımcı oluyor.
  • Eğitim Verileri: Yeni yapay zeka, token (jeton) adı verilen 14,8 trilyon bilgi parçası üzerinde eğitilmiş. Token demek, modelin dili anlamak ve üretmek için işlediği sözler veya kelime parçaları gibi metin parçaları demek. Bu büyük veri seti, doğru sonuçlar verilmesine yardımcı olmakta.
  • Maliyet Verimliliği: DeepSeek kaynak açısından verimli olmayı amaçlamakta. Optimize edilmiş süreçler ve daha az enerji kullanarak hesaplamaları hızlandıran FP8 eğitimi sayesinde eğitimini güçlü H800 GPU’larda sadece 2,788 milyon saatlik hesaplama müddetiyle tamamladı.
  • Performans: Çin menşeili DeepSeek, GPT-4 ve Claude-3.5-Sonnet gibi gelişmiş yapay zeka modellerine benzer sonuçlar üretebiliyor. Metinlerdeki bağlamı anlama, bilgi üzerinden akıl yürütme ve detaylı, yüksek kaliteli metinler üretme konusunda başarılı.
    Yenilikler: Ekstra ayarlamalara ihtiyaç duymadan performans verimliliği sağlayan, yük dengeleme yöntemi gibi eşsiz özellikler içermekte. Ayrıca, aynı anda birkaç bilgi kesimini tahmin etmesine olanak tanıyan ve cevaplarını daha hızlı ve daha doğru hale getiren çoklu belirteç tahmin yaklaşımı kullanıyor.

Zaten yakından tanıyorsunuz lakin kısaca özet geçelim. ChatGPT, bir araştırma kuruluşu olan OpenAİ tarafından insan benzeri metinler üretmek ve bağlamı anlamak için oluşturulmuş popüler bir yapay zeka dil modeli. Ayrıca NLP’nin doğru cevap vermesine ve çeşitli profesyonel misyonlara ve kişisel kullanım durumlarına yardımcı olmasına olanak tanımakta.

Generative Pre-trained Transformer (GPT) çerçevesi üzerine inşa edilen bu model, soruları yanıtlamak, detaylı yanıtlar sağlamak, ayrıca profesyonel ve kişisel projeleri etkili bir şekilde desteklemek için büyük veri kümelerini işleyerek çalışıyor. Temel özelliklerine bakacak olursak:

  • Mimari: İlk versiyon olan GPT-3 yaklaşık 175 milyar parametre içeriyordu. Bir sonraki yineleme olan GPT-4 ise daha sofistike bir mimari ortaya koydu. OpenAİ, GPT-4’teki tam parametre sayısını kamuya açıklamış değil. Kestirimler ise yaklaşık 1 trilyon parametre içerebileceğini gösteriyor. Bu parametre artışı, modelin daha karmaşık kalıpları ve nüansları öğrenmesini sağlayarak dil anlama ve üretme yeteneklerini geliştiriyor.
  • Eğitim Verileri: ChatGPT, internetten, kitaplardan ve Wikipedia’dan metinler içeren geniş kapsamlı bir veri kümesi üzerinde eğitildi. Bu kapsamlı eğitim, karmaşık sorguların üstesinden gelmesini ve çeşitli hususlarda detaylı yanıtlar vermesini sağlamakta. GPT-4’ün veri kümesi GPT-3’ünkinden önemli ölçüde daha büyük ve modelin dili ve bağlamı daha etkili bir şekilde anlamasına imkan sağlıyor.
  • Performans: ChatGPT dengeli ve bağlama hassas yanıtlar üreterek içerik oluşturma, müşteri desteği ve beyin fırtınası gibi vazifelerde etkili. Gelişmiş NLP yetenekleri sayesinde çeşitli girdileri anlaması ve bunlara anlamlı yanıtlar vermesi mümkün hale geliyor.
  • Yenilikler: OpenAİ, fonksiyonelliği uygunlaştırmak ve farklı uygulamalarda uygunluğu sağlamak için kullanıcı geri bildirimlerini ve yapay zeka gelişmelerini kullanarak modeli düzenli olarak güncellemekte.
  • Hesaplama Kaynakları: ChatGPT’nin eğitimi ve dağıtımı önemli hesaplama kaynakları gerektiriyor. OpenAİ, modeli Microsoft Azure tarafından sağlanan ve büyük ölçekli yapay zeka iş yüklerini verimli bir şekilde yöneten bir süper bilgi işlem altyapısı kullanarak eğitti. Yapay zeka şirketi kesin eğitim maliyetlerini açıklamamış olsa da, iddialar GPT modellerinin, özellikle de GPT-4’ün eğitiminin milyonlarca GPU saati içerdiğini ve bunun da önemli operasyonel harcamalara yol açtığını göstermekte.
DeepSeek ChatGPT
Model Mimarisi Verimlilik için Mixture-of-Experts (MoE) yapısı Çok taraflılık için transformatör tabanlı model
Eğitim Maliyeti 12 milyon dolar 500 milyon dolar veya daha fazla
Performans Belirli misyonlar için optimize edilmiş, güçlü mantıksal dökümler Alanlar arasında çok yönlü ve tutarlı
Gerçek Dünya Uygulaması Teknik sorun çözme ve alan özelindeki vazifeler için ideal Genel bilgi ve yaratıcı misyonlar için başarılı
Hız Optimize edilmiş kaynak kullanımı sayesinde daha hızlı Görevin büyüklüğüne bağlı olarak ortalama hız
Doğal Dil Çıktısı Bağlamsal, yapılandırılmış ve görev odaklı Konuşma dili ve kullanıcı dostu
Entegrasyon Kolaylığı Kurumsal tahliller için esnek Daha geniş kullanım durumları için basit

Teknoloji ve Mimari

  • Modeller ve Eğitim Yöntemleri: DeepSeek, farklı vazifeler için ağının belirli alt kümelerini aktifleştirerek verimliliği artıran MoE (Mixture-of-Experts) mimarisini temel alıyor. Buna karşılık ChatGPT, misyonları tüm ağı üzerinden işleyen transformatör tabanlı bir mimari kullanıyor.
  • Tasarım Yaklaşımı: DeepSeek’in MoE tasarımı göreve özgü işlemeye olanak tanıyarak özelleşmiş alanlarda performansı potansiyel olarak artırabiliyor. ChatGPT’nin transformatör modeli geniş bir görev yelpazesinde çok taraflılık sunuyor lakin kaynak kullanımı açısından daha düşük verimliliğe sahip.

Performans

  • Hız ve Verimlilik: DeepSeek, modüler tasarımı sayesinde belirli vazifelerde daha hızlı cevap müddetleriyle ön plana çıkıyor. ChatGPT ise çeşitli vazifelerde dengeli performans sağlıyor, ancak özel alanlarda DeepSeek’in hızına ulaşamayabiliyor.
  • Yanıt Doğruluğu ve Derinliği: ChatGPT karmaşık ve incelikler içeren sorguları ele alarak detaylı ve bağlam açısından zengin yanıtlar sunma kabiliyetine sahip. DeepSeek belirli alanlarda tatmin edici performans gösterse de, ChatGPT’nin daha geniş bağlamlarda sağladığı derinlikten mahrum olabilir.

Kullanım Örnekleri

  • DeepSeek’in Uzmanlığı ve ChatGPT’nin Çok Yönlülüğü: DeepSeek, kodlama ve mantıksal sorun çözme gibi teknik misyonlarda başarılı olmayı amaçlıyor. ChatGPT ise yaratıcı metinler, beyin fırtınası ve genel bilgi alma için uygun çok taraflılık sunuyor.
  • Özel Vazifeler (Kodlama, Araştırma, Yaratıcı Yazma Gibi): DeepSeek’in özel modülleri kodlama ve teknik araştırma için hassas yardım sunmakta. Öte yandan ChatGPT’nin geniş eğitim verileri, yazma ve genel araştırma dahil olmak üzere çeşitli ve yaratıcı misyonları desteklemekte.

Özelleştirme

  • Ne Kadar Özelleştirilebilir?: DeepSeek daha fazla özelleştirme potansiyeli sunarken teknik uzmanlık gerektiriyor ve giriş engelleri daha yüksek olabilir. ChatGPT daha kullanıcı dostu özelleştirme seçenekleri sunarak daha geniş bir kitle için erişim sağlıyor. İkisi arasındaki seçim, kullanıcının özel gereksinimlerine ve teknik yeteneklerine bağlı.
  • Özel Çözümler: DeepSeek, açık kaynaklı iskeleti nedeniyle özel tahliller için daha fazla esneklik sağlamakta. Bu da onu özel uyarlamalar arayan kullanıcılar için tercih noktası haline getiriyor.

Maliyet ve Erişilebilirlik

  • Erişilebilirlik: DeepSeek ücretsiz ve açık kaynaklı, aynı zamanda sınırsız erişim sunuyor. ChatGPT ise abonelik ve API hizmetleri aracılığıyla erişilebilen gelişmiş özelliklerle ücretsiz ve ücretli seçenekler içeriyor.

Kullanıcı Deneyimi

  • Sezgisellik: ChatGPT, gösterişli ve kullanıcı dostu bir arayüz sunarak geniş bir kitle tarafından erişilebilir olmasını sağlıyor. DeepSeek ise güçlü olmasına rağmen, etkili bir şekilde gezinmek için daha fazla teknik uzmanlık gerektirebilir.
  • Alışma ve Benimseme: ChatGPT’nin sezgisel tasarımı sayesinde öğrenmek daha kolay. DeepSeek’in özelleştirme yetenekleri, özellikle teknik geçmişi olmayanlar için işleri birazcık zorlaştırabilir.

Etik Dertler ve Gizlilik

Ortaya tüm dünya tarafından kullanılan bir platform çıktığında haliyle bazı kişiler zımnilik ve etik konular için endişe duyabiliyor. DeepSeek, IP adresleri ve aygıt bilgileri gibi verileri topluyor. Haliyle bazı kişiler de bu konuda çekimser davranıyor.

OpenAİ, GDPR (Genel Veri Koruma Tüzüğü) standartlarını karşılamak için veri anonimleştirme, şifreleme, kullanıcı onayı düzenekleri ve açık bir saklılık siyaseti uygulamakta. Ancak kapsamlı veri toplama (kullanıcı girdileri, çerezler, konum verileri) ve veri işlemede tam şeffaflık ihtiyacı gibi zorluklar devam etmekte.

Doğrusu, söz konusu saklılık olduğunda ne ABD ne de Çin kaynaklı tahlillere tam manasıyla güvenemeyiz. Buna tüm şirketler dahil. ABD medyası, kapalılık odaklı kişilerin ChatGPT’ye bağlı kalmaya devam edebileceğini söylüyor. Bunu söylemeleri de gayet doğal.

TikTok gibi DeepSeek de Çin merkezli bir şirket. Wired‘ın belirttiği gibi, istendiği takdirde datalarınızı Çin hükümetiyle paylaşmakla yükümlü. X’te ayrıca DeepSeek’in Tayvan, Uygur Türkleri ve Tiananmen Meydanı gibi Çin’in tartışmalı kabul edeceği konular hakkında aldatıcı veya yanlış bilgiler sunduğuna dair paylaşımlar da var.

Tüm maddeler bittiğine göre, bir de ayrıntıları tablolu olarak toparlayalım:

DeepSeek ChatGPT
Eğitim Yöntemi Göreve özgü işleme Genel amaçlı eğitim
Tepki Hızı Belirli misyonlarda daha hızlı Görevler arasında tutarlılık
Tepki Doğruluğu Teknik alanlarda güçlü Karmaşık sorgularda daha iyi
En İyi Kullanım Alanları Kodlama, teknik, araştırma Yaratıcı müelliflik, genel araştırma
Optimizasyon Seçenekleri Yüksek özelleştirme olanağı. Belirli uygulamalar için yüksek özelleştirme Varsayılan ayarlarda sınırlı özelleştirme
Maliyet Yapısı Ücretsiz ama bilgiye duyarlı Ücretsiz ve abonelik seçenekleri
Kullanım Kolaylığı Teknik marifetler gerektirebilir Kullanıcı dostu tasarım
Öğrenme Eğrisi Uzman olmayanlar için daha zor Kolay
Ölçeklenebilirlik Verimli kaynak kullanımıyla yüksek oranda ölçeklenebilir Ölçeklenebilir ancak kaynak yoğun
Etik Konular GDPR uyumluluğu ve veri toplama konusunda kaygılar var Eğitim verileri ve GDPR ile ilgili telaşlar var
Güçlü Yönleri Verimli, açık kaynaklı Çok yönlü
Zayıf Yönleri Taraflı Güncelliğini yitirmiş, taraflı

Spesifik soruları her iki robota da sorarak sonuçları kendiniz karşılaştırabilirsiniz. Genel olarak bakılırsa, DeepSeek ve ChatGPT yöneltilen sorulara küçük farklılıklarla bir arada neredeyse aynı cevapları veriyor. Ancak DeepSeek’in büyük bir avantajı var: iletileşme sınırı yok.

DeepSeek ile tüm gün sohbet edebilirsiniz, ChatGPT ise bir süre sonra ücretli yükseltme isteyecek. Bunun nedeni, ChatGPT’nin veri merkezi maliyetlerinin epeyce yüksek olması. Zati Çinli platformun en can alıcı yanı da bu. Maliyetleri çok düşük.

Şimdi DeepSeek-R1 ve ChatGPT’nin matematik sorunlarını çözme, kodlama ve genel bilgi sorularını yanıtlama gibi farklı misyonları nasıl yerine getirdiğine bakalım. Aşağıdaki tabloda yer alan test sonuçlarıyla her modelin güçlü ve zayıf istikametlerine göz atabilirsiniz.

DeepSeek R1

ChatGPT

Matematik

%90 doğruluk (GPT-4o’nun üzerinde)

Gelişmiş kıyaslamalarda %83 doğruluk

Kodlama

Mantık bulmacalarında %97 başarı oranı

En üst seviye hata ayıklama (Codeforces’ta %89)

Mantık

RL odaklı adım adım açıklamalar

Üstün çok adımlı sorun çözme

Çok Modlu Görevler

Yalnızca metin odaklı

Metin ve fotoğraf girdi desteği

Bağlam Penceresi

128 bin token

200 bin token

DeepSeek, yenilikçi MoE mimarisi sayesinde uygun maliyet, yüksek performans ve daha iyi cevap müddetleri sunabiliyor. Açık kaynak yaklaşımı şeffaflık ve erişilebilirlik sağlarken, kapalı kaynak modellerle kıyaslanabilir sonuçlar elde edebiliyor.

DeepSeek büyük ölçüde büyük veri kümelerine dayanıyor, bu da veri kapalılığı ve kullanım tasalarına yol açmakta. Ayrıca daha küçük ekipler için fizibilitesini sınırlayan önemli dağıtım kaynakları gerektiriyor.

Ek olarak, işlem hızı güzelleştirilmiş olsa da hala optimizasyona ihtiyaç var. Medyadaki raporlar ve yapay zeka topluluğu içindeki tartışmalar, DeepSeek’in siyasi önyargı sergilediğine dair telaşları artırdı.

ChatGPT çok taraflılığı ve güçlü bağlamsal anlayışı ile bilinen bir model. Yani içerik oluşturma, müşteri desteği ve beyin fırtınası gibi hususlarda hayli iyi. Entegrasyon kolaylığı ve daima güncelleme alması ise diğer artıları.

ChatGPT güçlü sonuçlar verse de sınırlamaları var. Bilgi birikimi yeniliğini yitirebilir, yanlış bilgi üretebilir ve eğitim datalarından kaynaklanan önyargıları yansıtabilir. Diğer yandan nüanslı anlayış, sağduyulu muhakeme ve gerçek zamanlı güncellemeler sağlama konularında da zorlanmakta.

DeepSeek’in bu kadar popüler olmasının arkasındaki nedeni merak mı ediyorsunuz? ChatGPT’nin Kasım 2023’te piyasaya sürülmesinden bu yana, Amerikan Aİ şirketleri daha büyük, daha güçlü, daha geniş, daha fazla güç ve kaynak yoğun büyük dil modelleri oluşturmaya odaklandı. OpenAİ, Microsoft, Anthropic ve Google gibi şirketler, daha uygun maliyetli ve enerji tasarruflu dil modelleri inşa etmeye çalışmak yerine milyarlarca dolar kaynak ayırarak teknolojilerinin ilerlemesini istediler.

Bir örnek olarak, xAİ CEO’su Elon Musk’ın sadece 2024 yılında yapay zeka teşebbüsleri için kişisel olarak 10 milyar dolardan para harcadığı tahmin ediliyor. OpenAİ ve ortakları, ABD genelinde yeşil enerji tesislerinin ve Aİ veri merkezlerinin inşasını büyük ölçüde hızlandıracak 500 milyar dolarlık Project Stargate girişimini duyurdu. CEO Sundar Pichai’ye göre Google, Gemini platformunu 2025 yılı boyunca ölçeklendirmeye öncelik vermeyi planlıyor ve bu hedef doğrultusunda bu yıl milyarlarca dolar harcaması bekleniyor. Meta, Ocak ayı ortasında yaptığı açıklamayla bu yıl yapay zeka gelişimi için 65 milyar dolar kadar harcama yapacağını duyurdu.

DeepSeek tüm dünyaya aslında bunların hiçbirine gerek olmadığını gösterdi. Çok daha düşük maliyetlerle aslında aynı şeyleri yapmak mümkündü. Son aylarda Amerikan iktisadını canlandırmaya yardımcı olan ve ve NVİDİA gibi şirketlerini daha zengin hale getiren “yapay zeka patlaması” bir aldatmacadan mı ibaretti?

Bunun yanında ABD, geçtiğimiz yıl Çin’e olan öncü GPU sevkiyatlarını yasaklamıştı. Böylelikle tek hakim güç olmak, bazı şeyleri kontrol etmek istiyorlardı. DeepSeek en azından şimdilik planları alt üst etmiş gibi görünüyor, ABD’nin yapay zekada gerçekten lider olup olmadığı sorgulanıyor.

Aralık ayı sonunda ücretsiz ve açık kaynaklı dil modelini tanıtan DeepSeek, bunun sadece iki ay içinde, 6 milyon doların altında bir maliyetle geliştirildiğini iddia etmişti. Platformu kullanan kullanıcılar da genel olarak sonuçlardan memnun kaldı.

6 milyon dolar, söylediğimiz gibi aynı işi ortaya koymak için milyarlarca dolar harcayan Batılı şirketler için bir çerez parası. Şirket geçtiğimiz hafta, birçok üçüncü taraf testinde OpenAİ’ın son modelinden daha iyi performans gösterdiği bildirilen bir muhakeme modeli yayınladı.

Diğer Teknoloji Haberleri İçin Tıklayın / Bursa Haber – Bursa Gündem – Bursa Gündem Haber – Bursa Haberleri – Bursa Son Dakika 

Bizi İnstagram’da Takip Edebilirsiniz / @BursaGündemHaber

Bizi X’de Takip Edebilirsiniz / @BursaGündemHbr

Bizi Facebook’da Takip Edebilirsiniz / @BursaGündemHaber

Bizi Youtube’da Takip Edebilirsiniz / @BursaGündemHaber

Bizi Linkedin’de Takip Edebilirsiniz / @BursaGündemHaber 

YORUMLAR

s


En az 10 karakter gerekli

Sıradaki haber:

Baştan Sona: İşlemci Çeşitleri ve Özellikleri Neler?

HIZLI YORUM YAP