DOLAR

33,9008$% 0.03

EURO

37,6352% -0.04

GRAM ALTIN

2.809,88%0,81

ÇEYREK ALTIN

4.610,00%0,88

TAM ALTIN

18.383,00%0,88

ONS

2.577,74%0,76

BİST100

9.685,49%1,73

İmsak Vakti a 05:13
Bursa AÇIK 24°
  • Adana
  • Adıyaman
  • Afyonkarahisar
  • Ağrı
  • Amasya
  • Ankara
  • Antalya
  • Artvin
  • Aydın
  • Balıkesir
  • Bilecik
  • Bingöl
  • Bitlis
  • Bolu
  • Burdur
  • Bursa
  • Çanakkale
  • Çankırı
  • Çorum
  • Denizli
  • Diyarbakır
  • Edirne
  • Elazığ
  • Erzincan
  • Erzurum
  • Eskişehir
  • Gaziantep
  • Giresun
  • Gümüşhane
  • Hakkâri
  • Hatay
  • Isparta
  • Mersin
  • istanbul
  • izmir
  • Kars
  • Kastamonu
  • Kayseri
  • Kırklareli
  • Kırşehir
  • Kocaeli
  • Konya
  • Kütahya
  • Malatya
  • Manisa
  • Kahramanmaraş
  • Mardin
  • Muğla
  • Muş
  • Nevşehir
  • Niğde
  • Ordu
  • Rize
  • Sakarya
  • Samsun
  • Siirt
  • Sinop
  • Sivas
  • Tekirdağ
  • Tokat
  • Trabzon
  • Tunceli
  • Şanlıurfa
  • Uşak
  • Van
  • Yozgat
  • Zonguldak
  • Aksaray
  • Bayburt
  • Karaman
  • Kırıkkale
  • Batman
  • Şırnak
  • Bartın
  • Ardahan
  • Iğdır
  • Yalova
  • Karabük
  • Kilis
  • Osmaniye
  • Düzce
a
SON DAKİKA

DOLAR 33,9008

EURO 37,6352

ALTIN 2.809,88

BİST 100 9.685,49

İmsak 05:13

24°

Openaı’dan Criticgpt: Gpt-4’ün Kusurlarını Gpt-4 Bulacak

ad826x90
openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 0 S3mTPRYp OpenAI, ChatGPT tarafından üretilen koddaki yanlışları belirlemek için tasarlanmış yeni bir yapay zeka modeli olan CriticGPT‘yi tanıttı. CriticGPT, insanların büyük dil modeli (LLM) çıktılarını daha doğru hale getirmelerine yardımcı olan “insan geri bildirimi üzerine destekli öğrenme” (RLHF) sürecinde hataları tespit etmelerine yardımcı olacak.

OpenAI, ChatGPT tarafından oluşturulan programlama kodunu inceleyen insan eğitmenlere yardımcı olmak için CriticGPT’yi geliştirdiklerini söylüyor. Firma, ChatGPT kodunu gözden geçirmek için CriticGPT’den yardım alan insanların, yardım almayanlardan %60 oranında daha iyi performans gösterdiklerini belirtiyor.

GPT-4’ün yanılgıları GPT-4’e emanet

openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 1 LslyvUPW CriticGPT, ChatGPT’ye güç veren aynı GPT-4 ailesine dayanıyor. Yeni araç kodu analiz ediyor ve mümkün kusurlara işaret ederek, insanların aksi takdirde fark edilmeyebilecek kusurları tespit etmesini kolaylaştırıyor. Araştırmacılar CriticGPT’yi kasıtlı olarak eklenmiş hatalar içeren kod örneklerinden oluşan bir veri kümesi üzerinde eğiterek çeşitli kodlama yanlışlarını tanımayı ve işaretlemeyi öğrettiler.
openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 2 116p5kA1 Temelinde böylesi bir araca ihtiyaç duyulmasının felsefi de bir istikameti bulunuyor. Daha önce de bahsettiğimiz gibi RLHF müddetinde insanlar yapay zekaların yanılgılarını tespit ederek ince ayarlamaların yapılmasını sağlıyor. Fakat ChatGPT veya diğer yapay zekalar geliştikçe yaptıkları yanılgılar da giderek azalıyor veya fark edilemeyecek nüanslarda gerçekleşiyor. Bu noktada da insanların işini zorlaştırıyor. Çünkü model, geri bildirim sağlayan şahıstan daha bilgili hale doğru ilerliyor. OpenAI, temelinde bu zorluğu aşmak için ChatGPT yanıtlarındaki yanlışlıkları vurgulayan eleştiriler yazmak üzere CriticGPT’yi oluşturdu.
openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 3 b6AwEMXg Yeni modelin eleştirileri, eğitmenler tarafından doğal yanlışları içeren olayların yüzde 63’ünde (yukarıda bahsedilen istatistik) ChatGPT’nin kendisi tarafından üretilenlere tercih edildi. Bunun nedeni kısmen yeni eleştirmenin daha az “nitpick” (yardımcı olmayan küçük şikayetler) üretmesi ve daha az sıklıkla halüsinasyon olarak görmesi.

OpenAI aynı zamanda Force Sampling Beam Search (FSBS) ismini verdikleri yeni bir teknik de geliştirdi. Bu yol en basit haliyle CriticGPT’nin daha detaylı kod incelemeleri yazmasına yardımcı oluyor. Araştırmacılar FSBS ile CriticGPT’nin sıkıntıları ararken ne kadar kapsamlı olacağını ayarlayabiliyor, aynı zamanda gerçekte var olmayan problemleri ne sıklıkla uydurabileceğini de kontrol edebiliyor.

İlginç bir bulgu da var

OpenAI, kod üzerindeki deneylere ek olarak, LLM eleştirmenlerinin genel yardımcı vazifelerde nasıl performans gösterdiğini de araştırdı ve ilginç bir şekilde CriticGPT’nin yeteneklerinin kodun ötesine geçtiğini keşfetti. OpenAI, daha önce insanlar tarafından kusursuz olarak değerlendirilen ChatGPT eğitim verilerinin bir alt kümesinde CriticGPT’yi test etti. İlginç bir şekilde CriticGPT, buradaki vakaların yüzde 24’ünde kusurlar buldu. OpenAI, bunun CriticGPT’nin kod dışı vazifelere genelleme potansiyelini gösterdiğini ve dikkatli insan değerlendirmesinin bile gözden kaçırabileceği ince yanılgıları yakalama yeteneğini vurguladığını düşünüyor.

CriticGPT kusursuz değil

En nihayetinde CriticGPT modeli de GPT-4 üzerinde inşa edilmiş bir yapay zeka. Bu nedende diğer tüm modeller gibi CriticGPT’nin de bazı sınırlamaları bulunuyor. Bu sınırlamaların başında modelin halen halüsinasyon görmesi geliyor. CriticGPT daha dar ve kaliteli bir veri kümesinde eğitilse de modellerin en doğal çalışma prensipleri nedeniyle daha az yapıyor olsa bile halüsinasyonlardan kurtulamıyor. Haliyle bunlar da insanların yanlış etiketlemeler yapmasına neden oluyor. Şayet bu konuda daha fazla bilgi almak istiyorsanız aşağıdaki içeriğimizi kesinlikle okuyunuz: 

Bununla birlikte CriticGPT, oldukça kısa olan ChatGPT yanıtları üzerinde eğitildi. Bu da uzun ve karmaşık vazifeleri değerlendirmede performansını düşürüyor. Ayrıca bazen kusurlar tek bir yerde olmayabiliyor. CriticGPT, muhakkak bir yerde tespit edilebilen yanılgıları belirlemede epey iyi olsa da gerçek dünyadaki kusurlar bir karşılığın birçok kısmında olabiliyor. Ek olarak OpenAI, CriticGPT’nin bir yere kadar yardımcı olabileceğini söylüyor. Bir görev veya karşılık son derece karmaşıksa, model yardımı alan bir uzman bile bunu doğru bir şekilde değerlendiremeyebilir.

YORUMLAR

s

En az 10 karakter gerekli

Sıradaki haber:

Youtube Premium İçin Yeni Abonelik Planları Geliyor

HIZLI YORUM YAP