38,2057$% 0.27
44,1665€% 1.51
4.194,98%2,91
6.902,00%2,75
27.525,00%2,75
3.420,77%2,82
9.454,59%1,47
DOLAR 38,2057
EURO 44,1665
ALTIN 4.194,98
BİST 100 9.454,59
İmsak 02:00
Çinli bir teşebbüs tarafından geliştirilen ve ChatGPT’yi tahtından indiren DeepSeek sohbet robotu dünyayı kasıp kavuruyor. Sırf teknoloji dünyası değil, çöken paylarla birlikte finans dünyası da bu yapay zekayı konuşuyor.
Doğrusu DeepSeek kısa sürede çok şeyi değiştirdi. ABD Başkanı Donald Trump yeni yapay zeka hakkında ilk yorum yapanlardan oldu. NVİDİA’nın hisseleri çakıldı, şirket sözcülerinden açıklamalar geldi. Meta’nın işvereni Mark Zuckerberg, DeepSeek’e bir cevap bulmak için bir ekip kurmak için harekete geçti. Elon Musk, DeepSeek’in iddialarını bu kadar düşük maliyetle gerçekten yapıp yapamayacağını sorgulamaya başladı.
Çin’in yeni yapay zeka sohbet robotu uzun süreler konuşulacak gibi görünüyor. Peki DeepSeek abartıldığı kadar başarılı mı? ChatGPT yerine DeepSeek kullanmaya başlamalı mıyız? Aslında bunun tam yanıtı sizde. İkisinin de başarılı ve başarısız olduğu taraflar var. Her insanın ihtiyacı, sorduğu sorular ve istekleri farklı. Kimisi diyor ki ChatGPT hala önde, kimisi diyor ki DeepSeek çok iyi işler çıkarıyor.
DeepSeek, Nisan 2023’te ana şirketi High-Flyer için bir yapay zeka laboratuvarı olarak kurulan Çinli bir yapay zeka girişimi. Şirketin tam ismi ise Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd. şeklinde.
Mayıs ayında DeepSeek kendi başına bir şirket (High-Flyer yatırımcı olarak kaldı) haline geldi ve DeepSeek-V2 modeli tanıtıldı. V2, ByteDance, Tencent ve Baidu gibi diğer önde gelen Çinli yapay zeka firmalarıyla aynı düzeyde performans sunuyordu, ancak çok daha düşük bir işletme maliyeti vardı.
Şirketin ismi böyle lakin teknoloji dünyasında modellerin ismi de “DeepSeek” olarak lanse ediliyor. Basit bir tabirle DeepSeek, “çıkarım zamanlı hesaplama” olarak bilinen ve “her sorgu için modellerin ilgili kısımlarını kullanan” açık kaynaklı büyük bir dil modeli. Bu sayede maliyet ve hesaplama gücünden tasarruf sağlanabiliyor.
DeepSeek, sohbet robotları ChatGPT, Gemini ve Claude’un yapabildiği her şeyi yapabiliyor. Buna metin, ses, görüntü ve video oluşturma da dahil. Dahası, DeepSeek’in Janus Pro olarak isimlendirilen yeni çok modlu model ailesinin, bir çift sanayi kıyaslamasında DALL-E 3’ün yanı sıra PixArt-alpha, Emu3-Gen ve Stable Diffusion XL’den daha iyi performans gösterdiği bildiriliyor. o1’e rakip olan DeepSeek-R1, karmaşık muhakeme vazifelerini yerine getirmek için özel olarak tasarlanmış olup, sorunlara adım adım tahliller üretmekte ve bir sorunu çözerken muhakeme sürecini adım adım açıkladığı “mantıksal düşünce zincirleri” oluşturabilmekte.
Yapay zeka alanındaki çalışmalarına devam eden şirket, Aralık 2024’te V3 sürümünü piyasaya sürdü. V3‘ün 671 milyar parametreli bir model olduğu ve eğitilmesinin 2 aydan kısa sürdüğü bildirildi. Dahası, Jeffries’in yakın zamanda yaptığı bir tahlile göre DeepSeek’in “eğitim maliyeti sırf 5,6 milyon dolar (2 dolar/800 saat kiralama maliyeti varsayıldığında).
Bu ne anlama geliyor? Meta’nın geliştirdiği Llama modeline harcadığı paranın %10’undan daha az miktarda kaynak tüketildi. Google, Microsoft, xAİ ve OpenAİ gibi diğer ABD merkezli şirketler ise Aİ modellerini eğitmek için yüz milyonlarca ve hatta milyarlarca dolar harcadı, harcıyor. Yani Çinli teşebbüsün harcadığı ölçü rakiplerinin yanında devede kulak kalır.
DeepSeek, büyük miktarda datayı işlemeyi ve eğitim, kodlama veya araştırma gibi belirli alanlarda doğru, yüksek kaliteli dil çıktıları üretmeyi amaçlayan gelişmiş bir açık kaynaklı yapay zeka eğitim dili modeli olarak piyasaya giriş yaptı.
Burada insan benzeri metinleri etkili bir şekilde anlamak ve üretmek için NLP (Natural Language Processing) kullanılıyor. Çinli araştırmacılardan oluşan bir ekip tarafından açık kaynaklı yapay zekayı teşvik etmek amacıyla geliştirildi. GPT-4 ve Claude-3.5-Sonnet gibi kapalı kaynak sistemlerine rakip olan, kaynak açısından verimli bir model. Şimdi temel özelliklerine bakalım:
Zaten yakından tanıyorsunuz lakin kısaca özet geçelim. ChatGPT, bir araştırma kuruluşu olan OpenAİ tarafından insan benzeri metinler üretmek ve bağlamı anlamak için oluşturulmuş popüler bir yapay zeka dil modeli. Ayrıca NLP’nin doğru cevap vermesine ve çeşitli profesyonel misyonlara ve kişisel kullanım durumlarına yardımcı olmasına olanak tanımakta.
Generative Pre-trained Transformer (GPT) çerçevesi üzerine inşa edilen bu model, soruları yanıtlamak, detaylı yanıtlar sağlamak, ayrıca profesyonel ve kişisel projeleri etkili bir şekilde desteklemek için büyük veri kümelerini işleyerek çalışıyor. Temel özelliklerine bakacak olursak:
DeepSeek | ChatGPT | |
---|---|---|
Model Mimarisi | Verimlilik için Mixture-of-Experts (MoE) yapısı | Çok taraflılık için transformatör tabanlı model |
Eğitim Maliyeti | 12 milyon dolar | 500 milyon dolar veya daha fazla |
Performans | Belirli misyonlar için optimize edilmiş, güçlü mantıksal dökümler | Alanlar arasında çok yönlü ve tutarlı |
Gerçek Dünya Uygulaması | Teknik sorun çözme ve alan özelindeki vazifeler için ideal | Genel bilgi ve yaratıcı misyonlar için başarılı |
Hız | Optimize edilmiş kaynak kullanımı sayesinde daha hızlı | Görevin büyüklüğüne bağlı olarak ortalama hız |
Doğal Dil Çıktısı | Bağlamsal, yapılandırılmış ve görev odaklı | Konuşma dili ve kullanıcı dostu |
Entegrasyon Kolaylığı | Kurumsal tahliller için esnek | Daha geniş kullanım durumları için basit |
Teknoloji ve Mimari
Performans
Kullanım Örnekleri
Özelleştirme
Maliyet ve Erişilebilirlik
Kullanıcı Deneyimi
Etik Dertler ve Gizlilik
Ortaya tüm dünya tarafından kullanılan bir platform çıktığında haliyle bazı kişiler zımnilik ve etik konular için endişe duyabiliyor. DeepSeek, IP adresleri ve aygıt bilgileri gibi verileri topluyor. Haliyle bazı kişiler de bu konuda çekimser davranıyor.
OpenAİ, GDPR (Genel Veri Koruma Tüzüğü) standartlarını karşılamak için veri anonimleştirme, şifreleme, kullanıcı onayı düzenekleri ve açık bir saklılık siyaseti uygulamakta. Ancak kapsamlı veri toplama (kullanıcı girdileri, çerezler, konum verileri) ve veri işlemede tam şeffaflık ihtiyacı gibi zorluklar devam etmekte.
Doğrusu, söz konusu saklılık olduğunda ne ABD ne de Çin kaynaklı tahlillere tam manasıyla güvenemeyiz. Buna tüm şirketler dahil. ABD medyası, kapalılık odaklı kişilerin ChatGPT’ye bağlı kalmaya devam edebileceğini söylüyor. Bunu söylemeleri de gayet doğal.
TikTok gibi DeepSeek de Çin merkezli bir şirket. Wired‘ın belirttiği gibi, istendiği takdirde datalarınızı Çin hükümetiyle paylaşmakla yükümlü. X’te ayrıca DeepSeek’in Tayvan, Uygur Türkleri ve Tiananmen Meydanı gibi Çin’in tartışmalı kabul edeceği konular hakkında aldatıcı veya yanlış bilgiler sunduğuna dair paylaşımlar da var.
Tüm maddeler bittiğine göre, bir de ayrıntıları tablolu olarak toparlayalım:
DeepSeek | ChatGPT | |
Eğitim Yöntemi | Göreve özgü işleme | Genel amaçlı eğitim |
Tepki Hızı | Belirli misyonlarda daha hızlı | Görevler arasında tutarlılık |
Tepki Doğruluğu | Teknik alanlarda güçlü | Karmaşık sorgularda daha iyi |
En İyi Kullanım Alanları | Kodlama, teknik, araştırma | Yaratıcı müelliflik, genel araştırma |
Optimizasyon Seçenekleri | Yüksek özelleştirme olanağı. Belirli uygulamalar için yüksek özelleştirme | Varsayılan ayarlarda sınırlı özelleştirme |
Maliyet Yapısı | Ücretsiz ama bilgiye duyarlı | Ücretsiz ve abonelik seçenekleri |
Kullanım Kolaylığı | Teknik marifetler gerektirebilir | Kullanıcı dostu tasarım |
Öğrenme Eğrisi | Uzman olmayanlar için daha zor | Kolay |
Ölçeklenebilirlik | Verimli kaynak kullanımıyla yüksek oranda ölçeklenebilir | Ölçeklenebilir ancak kaynak yoğun |
Etik Konular | GDPR uyumluluğu ve veri toplama konusunda kaygılar var | Eğitim verileri ve GDPR ile ilgili telaşlar var |
Güçlü Yönleri | Verimli, açık kaynaklı | Çok yönlü |
Zayıf Yönleri | Taraflı | Güncelliğini yitirmiş, taraflı |
Spesifik soruları her iki robota da sorarak sonuçları kendiniz karşılaştırabilirsiniz. Genel olarak bakılırsa, DeepSeek ve ChatGPT yöneltilen sorulara küçük farklılıklarla bir arada neredeyse aynı cevapları veriyor. Ancak DeepSeek’in büyük bir avantajı var: iletileşme sınırı yok.
DeepSeek ile tüm gün sohbet edebilirsiniz, ChatGPT ise bir süre sonra ücretli yükseltme isteyecek. Bunun nedeni, ChatGPT’nin veri merkezi maliyetlerinin epeyce yüksek olması. Zati Çinli platformun en can alıcı yanı da bu. Maliyetleri çok düşük.
Şimdi DeepSeek-R1 ve ChatGPT’nin matematik sorunlarını çözme, kodlama ve genel bilgi sorularını yanıtlama gibi farklı misyonları nasıl yerine getirdiğine bakalım. Aşağıdaki tabloda yer alan test sonuçlarıyla her modelin güçlü ve zayıf istikametlerine göz atabilirsiniz.
DeepSeek R1 |
ChatGPT |
|
---|---|---|
Matematik |
%90 doğruluk (GPT-4o’nun üzerinde) |
Gelişmiş kıyaslamalarda %83 doğruluk |
Kodlama |
Mantık bulmacalarında %97 başarı oranı |
En üst seviye hata ayıklama (Codeforces’ta %89) |
Mantık |
RL odaklı adım adım açıklamalar |
Üstün çok adımlı sorun çözme |
Çok Modlu Görevler |
Yalnızca metin odaklı |
Metin ve fotoğraf girdi desteği |
Bağlam Penceresi |
128 bin token |
200 bin token |
DeepSeek, yenilikçi MoE mimarisi sayesinde uygun maliyet, yüksek performans ve daha iyi cevap müddetleri sunabiliyor. Açık kaynak yaklaşımı şeffaflık ve erişilebilirlik sağlarken, kapalı kaynak modellerle kıyaslanabilir sonuçlar elde edebiliyor.
DeepSeek büyük ölçüde büyük veri kümelerine dayanıyor, bu da veri kapalılığı ve kullanım tasalarına yol açmakta. Ayrıca daha küçük ekipler için fizibilitesini sınırlayan önemli dağıtım kaynakları gerektiriyor.
Ek olarak, işlem hızı güzelleştirilmiş olsa da hala optimizasyona ihtiyaç var. Medyadaki raporlar ve yapay zeka topluluğu içindeki tartışmalar, DeepSeek’in siyasi önyargı sergilediğine dair telaşları artırdı.
ChatGPT çok taraflılığı ve güçlü bağlamsal anlayışı ile bilinen bir model. Yani içerik oluşturma, müşteri desteği ve beyin fırtınası gibi hususlarda hayli iyi. Entegrasyon kolaylığı ve daima güncelleme alması ise diğer artıları.
ChatGPT güçlü sonuçlar verse de sınırlamaları var. Bilgi birikimi yeniliğini yitirebilir, yanlış bilgi üretebilir ve eğitim datalarından kaynaklanan önyargıları yansıtabilir. Diğer yandan nüanslı anlayış, sağduyulu muhakeme ve gerçek zamanlı güncellemeler sağlama konularında da zorlanmakta.
DeepSeek’in bu kadar popüler olmasının arkasındaki nedeni merak mı ediyorsunuz? ChatGPT’nin Kasım 2023’te piyasaya sürülmesinden bu yana, Amerikan Aİ şirketleri daha büyük, daha güçlü, daha geniş, daha fazla güç ve kaynak yoğun büyük dil modelleri oluşturmaya odaklandı. OpenAİ, Microsoft, Anthropic ve Google gibi şirketler, daha uygun maliyetli ve enerji tasarruflu dil modelleri inşa etmeye çalışmak yerine milyarlarca dolar kaynak ayırarak teknolojilerinin ilerlemesini istediler.
Bir örnek olarak, xAİ CEO’su Elon Musk’ın sadece 2024 yılında yapay zeka teşebbüsleri için kişisel olarak 10 milyar dolardan para harcadığı tahmin ediliyor. OpenAİ ve ortakları, ABD genelinde yeşil enerji tesislerinin ve Aİ veri merkezlerinin inşasını büyük ölçüde hızlandıracak 500 milyar dolarlık Project Stargate girişimini duyurdu. CEO Sundar Pichai’ye göre Google, Gemini platformunu 2025 yılı boyunca ölçeklendirmeye öncelik vermeyi planlıyor ve bu hedef doğrultusunda bu yıl milyarlarca dolar harcaması bekleniyor. Meta, Ocak ayı ortasında yaptığı açıklamayla bu yıl yapay zeka gelişimi için 65 milyar dolar kadar harcama yapacağını duyurdu.
DeepSeek tüm dünyaya aslında bunların hiçbirine gerek olmadığını gösterdi. Çok daha düşük maliyetlerle aslında aynı şeyleri yapmak mümkündü. Son aylarda Amerikan iktisadını canlandırmaya yardımcı olan ve ve NVİDİA gibi şirketlerini daha zengin hale getiren “yapay zeka patlaması” bir aldatmacadan mı ibaretti?
Bunun yanında ABD, geçtiğimiz yıl Çin’e olan öncü GPU sevkiyatlarını yasaklamıştı. Böylelikle tek hakim güç olmak, bazı şeyleri kontrol etmek istiyorlardı. DeepSeek en azından şimdilik planları alt üst etmiş gibi görünüyor, ABD’nin yapay zekada gerçekten lider olup olmadığı sorgulanıyor.
Aralık ayı sonunda ücretsiz ve açık kaynaklı dil modelini tanıtan DeepSeek, bunun sadece iki ay içinde, 6 milyon doların altında bir maliyetle geliştirildiğini iddia etmişti. Platformu kullanan kullanıcılar da genel olarak sonuçlardan memnun kaldı.
6 milyon dolar, söylediğimiz gibi aynı işi ortaya koymak için milyarlarca dolar harcayan Batılı şirketler için bir çerez parası. Şirket geçtiğimiz hafta, birçok üçüncü taraf testinde OpenAİ’ın son modelinden daha iyi performans gösterdiği bildirilen bir muhakeme modeli yayınladı.
Diğer Teknoloji Haberleri İçin Tıklayın / Bursa Haber – Bursa Gündem – Bursa Gündem Haber – Bursa Haberleri – Bursa Son Dakika
Bizi İnstagram’da Takip Edebilirsiniz / @BursaGündemHaber
Bizi X’de Takip Edebilirsiniz / @BursaGündemHbr
Bizi Facebook’da Takip Edebilirsiniz / @BursaGündemHaber
Bizi Youtube’da Takip Edebilirsiniz / @BursaGündemHaber
Bizi Linkedin’de Takip Edebilirsiniz / @BursaGündemHaber
Baştan Sona: İşlemci Çeşitleri ve Özellikleri Neler?