Anasayfa / Teknoloji / Openaı’dan Criticgpt: Gpt-4’ün Kusurlarını Gpt-4 Bulacak

Bursa Gündem Haber
Teknoloji
Openaı’dan Criticgpt: Gpt-4’ün Kusurlarını Gpt-4 Bulacak

228 kez okunmuştur Yayınlanma Tarihi: 28 Haziran 2024 17:24 - Güncelleme Tarihi: 28 Haziran 2024 17:24 228 28 Haziran 2024

Openaı’dan Criticgpt: Gpt-4’ün Kusurlarını Gpt-4 Bulacak

BEĞENDİM

ABONE OL

News

openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 0 S3mTPRYp

OpenAI, ChatGPT tarafından oluşturulan programlama kodunu inceleyen insan eğitmenlere yardımcı olmak için CriticGPT’yi geliştirdiklerini söylüyor. Firma, ChatGPT kodunu gözden geçirmek için CriticGPT’den yardım alan insanların, yardım almayanlardan %60 oranında daha iyi performans gösterdiklerini belirtiyor.

GPT-4’ün yanılgıları GPT-4’e emanet

openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 1 LslyvUPW

openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 2 116p5kA1

openaidan criticgpt gpt 4un kusurlarini gpt 4 bulacak 3 b6AwEMXg

OpenAI aynı zamanda Force Sampling Beam Search (FSBS) ismini verdikleri yeni bir teknik de geliştirdi. Bu yol en basit haliyle CriticGPT’nin daha detaylı kod incelemeleri yazmasına yardımcı oluyor. Araştırmacılar FSBS ile CriticGPT’nin sıkıntıları ararken ne kadar kapsamlı olacağını ayarlayabiliyor, aynı zamanda gerçekte var olmayan problemleri ne sıklıkla uydurabileceğini de kontrol edebiliyor.

İlginç bir bulgu da var

OpenAI, kod üzerindeki deneylere ek olarak, LLM eleştirmenlerinin genel yardımcı vazifelerde nasıl performans gösterdiğini de araştırdı ve ilginç bir şekilde CriticGPT’nin yeteneklerinin kodun ötesine geçtiğini keşfetti. OpenAI, daha önce insanlar tarafından kusursuz olarak değerlendirilen ChatGPT eğitim verilerinin bir alt kümesinde CriticGPT’yi test etti. İlginç bir şekilde CriticGPT, buradaki vakaların yüzde 24’ünde kusurlar buldu. OpenAI, bunun CriticGPT’nin kod dışı vazifelere genelleme potansiyelini gösterdiğini ve dikkatli insan değerlendirmesinin bile gözden kaçırabileceği ince yanılgıları yakalama yeteneğini vurguladığını düşünüyor.

CriticGPT kusursuz değil

En nihayetinde CriticGPT modeli de GPT-4 üzerinde inşa edilmiş bir yapay zeka. Bu nedende diğer tüm modeller gibi CriticGPT’nin de bazı sınırlamaları bulunuyor. Bu sınırlamaların başında modelin halen halüsinasyon görmesi geliyor. CriticGPT daha dar ve kaliteli bir veri kümesinde eğitilse de modellerin en doğal çalışma prensipleri nedeniyle daha az yapıyor olsa bile halüsinasyonlardan kurtulamıyor. Haliyle bunlar da insanların yanlış etiketlemeler yapmasına neden oluyor. Şayet bu konuda daha fazla bilgi almak istiyorsanız aşağıdaki içeriğimizi kesinlikle okuyunuz:

Bununla birlikte CriticGPT, oldukça kısa olan ChatGPT yanıtları üzerinde eğitildi. Bu da uzun ve karmaşık vazifeleri değerlendirmede performansını düşürüyor. Ayrıca bazen kusurlar tek bir yerde olmayabiliyor. CriticGPT, muhakkak bir yerde tespit edilebilen yanılgıları belirlemede epey iyi olsa da gerçek dünyadaki kusurlar bir karşılığın birçok kısmında olabiliyor. Ek olarak OpenAI, CriticGPT’nin bir yere kadar yardımcı olabileceğini söylüyor. Bir görev veya karşılık son derece karmaşıksa, model yardımı alan bir uzman bile bunu doğru bir şekilde değerlendiremeyebilir.