OpenAI Open-Weight Modelleri: gpt-oss-120b ve Çin Rakiplerine Cevap

openai ofis
Özet

OpenAI’nin uzun süredir kapalı kaynak stratejisiyle anılan yapı kültüründe sert bir dönüş yaşandı. Şirket, geçtiğimiz yaz openai open weight yaklaşımını resmen kucaklayarak gpt-oss-120b ve gpt-oss-20b adlı iki büyük dil modelini Apache 2.0 lisansıyla yayımladı.

⏱ 11 dakika okuma📝 3,056 kelime📅 26 May 2026🔄 Son güncelleme: 9 Haz 2026

OpenAI Open-Weight Modelleri: gpt-oss-120b ve Çin Rakiplerine Cevap

OpenAI’nin uzun süredir kapalı kaynak stratejisiyle anılan yapı kültüründe sert bir dönüş yaşandı. Şirket, geçtiğimiz yaz openai open weight yaklaşımını resmen kucaklayarak gpt-oss-120b ve gpt-oss-20b adlı iki büyük dil modelini Apache 2.0 lisansıyla yayımladı. Karar, Çinli açık modellerin yarattığı baskıya verilmiş gecikmiş ama net bir cevap olarak okunuyor.

OpenAI’nin Open-Weight Dönüşü

San Francisco merkezli şirket, kuruluş manifestosunda açık kaynak yapay zekayı toplum yararı olarak tanımlamış olsa da son altı yıldır neredeyse tüm modellerini API arkasında tuttu. GPT-2 sonrası ağırlık paylaşımı duran bu pratik, geçen Ağustos başında geliştirici topluluğunu şaşırtan bir duyuruyla kırıldı. Sam Altman’ın liderliğindeki yönetim, “open weight” yani ağırlıkları indirilebilir ama eğitim verisi paylaşılmayan iki modelle yeniden açık geliştirici sahnesine indi. Bu hamle, hem kurumsal kullanıcılarda artan veri egemenliği kaygısına hem de Pekin merkezli laboratuvarların kazandığı momentuma dönük stratejik bir refleks olarak değerlendiriliyor.

Dönüşün arka planında üç ayrı baskı dinamiği bulunuyor. Birincisi, DeepSeek R1’in yarattığı şok dalgasının ardından açık ağırlık modellerin maliyet-performans dengesinde kapalı API’lere göre belirgin avantaj sağlaması. İkincisi, Meta’nın Llama serisiyle elinde tuttuğu geliştirici ekosisteminin OpenAI’nin entegrasyon kanallarını daraltıyor olması. Üçüncüsü, Avrupa ve Ortadoğu’daki düzenleyici talepler. Birçok devlet kurumu artık bulut tabanlı kapalı modelleri kabul etmiyor; ağırlıkların yerel sunucuda çalıştırılabilmesini şart koşuyor. OpenAI’nin yıllarca direndiği bu üç eksen birleşince, ticari maliyeti göze alınarak açık ağırlık tarafına bir adım atılması kaçınılmaz hale geldi. Detaylı arka plan için açık kaynak yapay zeka yarışı dosyamızdaki kronoloji başvuru noktası niteliğinde.

gpt-oss-120b ve gpt-oss-20b Modelleri

Yeni ailenin omurgasını oluşturan iki model, farklı kaynak senaryolarına hitap ediyor. gpt-oss-120b, 117 milyar parametre civarında bir karışım uzmanlar (MoE) mimarisiyle kuruldu; çıkarsama sırasında yalnızca aktif parametre alt kümesini çalıştırarak tek bir 80 GB H100 GPU üzerinde rahat çalışabiliyor. Daha hafif sürüm olan gpt-oss-20b ise 21 milyar parametre seviyesinde tutulmuş ve 16 GB belleğe sahip dizüstü düzeyindeki kartlarda dahi yerelde çalıştırılabiliyor. Bu pratik dağılım, hem büyük kurumsal kümeler hem de bireysel geliştirici workstation’ları için tek bir aile sunma niyetini ortaya koyuyor.

Modellerin tasarımında öne çıkan en önemli karar, o-series’te denenmiş “reasoning” yaklaşımının açık ağırlıklara taşınmış olması. Her iki model de chain-of-thought adımlarını dahili olarak yürütüyor; kullanıcıya nihai cevabın yanı sıra düşünme adımlarını da paylaşan bir mod sunuluyor. Bağlam penceresi 128 bin token’a kadar uzanırken, fonksiyon çağırma, JSON şeması zorlaması ve araç kullanımı varsayılan olarak destekleniyor. TechCrunch’ın lansman analizine göre OpenAI, küçük modelin bile rakip ailenin orta sınıf sürümlerini matematik ve kodlama görevlerinde geride bıraktığını iddia ediyor.

Yayın anında Hugging Face üzerinde tam ağırlıklar, GitHub üzerinde ise referans çıkarsama kodu, tokenizer ve değerlendirme harness’i yer aldı. Topluluk birkaç gün içinde Llama.cpp, vLLM ve MLX uyumlu sürümleri çıkardı; AMD MI300X ve Apple Silicon donanımlarında çalıştırma yönergeleri yayımlandı. Bu hızlı destek, OpenAI’nin sadece ağırlıkları değil çıkarsama altyapısını da topluluğa açık biçimde devrettiğini gösteriyor. Eğitim verisinin kompozisyonu ise açıklanmadı; şirket, telif hakkı davalarının gölgesinde veri seti şeffaflığını sınırlı tutmayı tercih etti ve bu nokta açık kaynak savunucuları tarafından eleştirildi. Modelin “açık ağırlık” sınıfında kalmasının, “tam açık kaynak” sayılmaması için kasıtlı seçildiği değerlendiriliyor; eğitim seti paylaşılmadan modelin sıfırdan üretilmesi mümkün değil ve bu durum bilimsel tekrarlanabilirlik açısından bir eksiklik olarak kayda geçti.

Apache 2.0 Lisansının Anlamı

↑ Başa dön

Lisans seçimi tartışmanın belki en belirleyici kısmı. Meta’nın Llama ailesi, kullanım koşullarında günlük aktif kullanıcı eşiği ve belirli yargı bölgesi sınırlamaları içeren özel bir lisans uygularken, OpenAI doğrudan Apache 2.0’ı tercih etti. Bu, modellerin ticari kullanım, türev model üretme, yeniden adlandırarak satma ve patent korumasına dahil etme gibi senaryolarda hiçbir ek sözleşmeye ihtiyaç duymaması anlamına geliyor. Geliştirici açısından bu, hukuki belirsizliği büyük ölçüde ortadan kaldıran bir tercih.

Apache 2.0’ın geliştiricilere sunduğu üç somut avantaj öne çıkıyor. İlki, model üzerinde fine-tune yapan girişimlerin ticari ürünlerinde herhangi bir kullanıcı eşiği kaygısı taşımaması. İkincisi, hükümet veya savunma sanayii sözleşmelerinde modelin doğrudan kabul edilebilir olması; çünkü Apache 2.0 birçok kamu tedarik şartnamesine zaten uyumlu. Üçüncüsü, türev modellerin orijinal adı taşımak zorunda kalmaması ve marka kısıtı içermemesi. Bu üç madde, gpt-oss ailesini özellikle KOBİ ve kamuya yakın kurumlar için cazip kılıyor.

Lisansın bir başka boyutu ise OpenAI’nin uzun vadeli pazar konumlandırması. Şirket, açık ağırlıkları topluluğa bırakırken ticari ürünü olan GPT-5 ve sonraki kapalı modellerini ayrı tutmaya devam edecek. Yani açık aile bir “geliştirici ısındırma” katmanı, kapalı aile ise yüksek marjlı kurumsal katman olarak kurgulanıyor. Bu ikili strateji, Anthropic’in tamamen kapalı pozisyonundan ayrışırken Meta’nın “tek kanal Llama” stratejisinden de farklı bir yere oturuyor.

model dağıtım

Çinli Rakiplere Karşı Konumlanma

Açık ağırlık sahnesinin son iki yılına bakıldığında belirleyici aktörlerin neredeyse tamamının Çin merkezli olduğu görülüyor. DeepSeek V3 ve R1, Alibaba’nın Qwen serisi, Moonshot AI’nin Kimi K2’si ve 01.AI’nin Yi modelleri, hem performans hem topluluk benimsemesi açısından batılı laboratuvarları geçti. Hugging Face indirme listelerinde üst sıraların büyük bölümünü bu modeller dolduruyor; geliştirici sohbet gruplarında “varsayılan tercih” konumuna yerleştiler.

OpenAI’nin gpt-oss hamlesi, bu manzaranın doğrudan içine atılan bir taş olarak yorumlanıyor. Bloomberg’in DeepSeek bağlantısını öne çıkaran haberi, lansmanın zamanlamasını şirket içi yazışmalara dayandırarak Pekin baskısının üst düzeyde nasıl konuşulduğunu anlatıyor. CNBC ise açık ağırlık pazarındaki güç dengesini özetleyen analizinde OpenAI’nin geç kalmış olsa da pazarın geri kazanılması için tek somut adımının bu olduğunu vurguluyor.

Konumlanma açısından bir başka belirleyici nokta, gpt-oss-120b’nin Çinli rakiplerle benzer donanım profilinde benzer hızda çalışacak şekilde optimize edilmiş olması. DeepSeek modelleri MoE mimarisiyle aktif parametre sayısını düşürerek çalıştırma maliyetini azaltmıştı; OpenAI aynı yaklaşımı benimseyerek “siz hangi GPU’da DeepSeek çalıştırıyorsanız aynı yerde gpt-oss çalıştırın” mesajını verdi. Avrupa’da çip stratejisini farklı kuran mistral çip stratejisi ile birlikte değerlendirildiğinde, açık ağırlık pazarının coğrafi olarak da bölünmeye başladığı görülüyor.

Reasoning Yeteneklerinde Performans

OpenAI’nin yayımladığı teknik raporda gpt-oss-120b, AIME matematik yarışması setinde, GPQA bilim sorularında ve HumanEval kodlama benchmark’ında DeepSeek V3 ve Qwen 2.5-72B üzerinde puanlar açıkladı. Bağımsız üçüncü taraf testler ise tablonun bu kadar net olmadığını gösteriyor. Reuters ve The Verge ile paralel olarak MIT Technology Review’un kapsamlı değerlendirmesi, gpt-oss-120b’nin coding görevlerinde gerçekten öne çıktığını ama açık uçlu yazma ve çok dilli görevlerde DeepSeek R1 ile başa baş seyrettiğini aktarıyor.

Reasoning yeteneklerinin değerlendirilmesinde üç ana benchmark öne çıkıyor:

  • Codeforces / SWE-bench Verified: gpt-oss-120b, gerçek GitHub issue’larını kod düzeyinde çözmede DeepSeek V3’ün önünde, GPT-5 mini ile yakın puanlarda raporlandı.
  • AIME matematik: Açık ağırlık ailelerin neredeyse tamamı bu sınavda dramatik biçimde geriliyor; gpt-oss-120b ile DeepSeek R1 arasındaki fark çok dar.
  • GPQA Diamond: Doktora seviyesi bilim sorularında küçük model gpt-oss-20b’nin bile birçok kapalı orta segment modeli yakaladığı görüldü.
  • Çok dilli MMLU: Türkçe dahil Latin alfabesi dışı dillerde Qwen 2.5 hâlâ liderliğini koruyor; OpenAI bu kategoride Alibaba’yı geçemedi.

Reasoning modunun açılıp kapatılabilir olması da pratik kullanımda önemli bir avantaj sağlıyor. Geliştirici, basit özetleme görevinde “low reasoning” parametresiyle modeli hızlı modda kullanırken karmaşık kod analizinde “high reasoning” parametresine geçebiliyor. Bu kontrol seviyesi, açık ağırlık ekosisteminde ilk kez bu kadar olgun şekilde sunuldu ve IEEE Spectrum’un derinlemesine değerlendirmesi tarafından mimari yeniliğin en kayda değer parçası olarak işaretlendi.

Meta Muse Spark Karşıt Stratejisi

↑ Başa dön

OpenAI açık ağırlık tarafına geçerken, ironik biçimde Meta uzun yıllardır taşıdığı “açık kaynak yapay zeka” bayrağını yere bıraktı. Şirketin yeni nesil multimodal modeli Muse Spark’ın kapalı kaynak olarak duyurulması, sektörde “rolleri değiş tokuş” olarak yorumlandı. Meta yönetimi, gerekçe olarak hem güvenlik kaygılarını hem de açık modellerin Çin’deki askeri uygulamalarda kullanılmasına ilişkin Pentagon baskısını gösterdi. Bu strateji değişikliğini geniş bir çerçeveden değerlendiren meta llama stratejisi notları, dönüşümün altyapı maliyetleriyle bağını ortaya koyuyor.

rekabet

İki dev oyuncunun ters yönde hareket etmesi, açık ağırlık pazarının kompozisyonunu değiştiriyor. Meta’nın bıraktığı “varsayılan açık model sağlayıcı” boşluğunu doldurmaya en hazır aday OpenAI olarak öne çıkıyor; ancak şirketin geçmişindeki kapalı çizgi nedeniyle topluluk hâlâ ihtiyatlı. Birçok geliştirici Llama 3.3 sürümünü uzun süre kullanmaya devam edecek; gpt-oss’in benimsenmesi için fine-tune kalitesinin ve uzun vadeli ağırlık güncelleme taahhüdünün ispatlanması gerekiyor.

Meta tarafının kapanması, üçüncü taraf platformlar üzerinde de etki yaratıyor. Together AI, Fireworks ve Groq gibi hosting şirketleri, Llama’nın yeni sürümlerini barındıramayacakları için ana büyüme motorlarını gpt-oss’e ve DeepSeek’e kaydırmak zorunda kalıyor. Bu kayma, OpenAI’nin gpt-oss’i lansman gününden itibaren onlarca farklı çıkarsama servisinde sıfır maliyetle çalıştırılabilir hale getirmesini kolaylaştırdı. Pazar dinamiği açısından bir başka gözlem, fine-tune servisleri sunan ikinci kuşak girişimlerin de tercihlerini değiştirmesi; Predibase ve OpenPipe gibi şirketler eğitim varsayılanlarını gpt-oss-20b olarak güncelledi. Bu adım, kurumsal müşterilerin fine-tune sırasında karşılaştığı uyumluluk sorularını azaltıyor ve Llama’nın yarattığı ekosistem alışkanlığının başka bir markaya transferini hızlandırıyor.

ABD AI Politikası Bağlamı

OpenAI’nin hamlesi, Washington’da yayımlanan AI Eylem Planı’yla aynı haftaya denk geldi. Beyaz Saray’ın açıkladığı plan, Amerikan menşeli açık ağırlık modellerin küresel pazarda yaygınlaşmasını “ulusal teknoloji çıkarı” olarak tanımladı ve federal tedarik şartnamelerinde açık modellerin tercih edilmesi yönünde tavsiyeler içerdi. Plan, doğrudan Çinli açık modellerin Avrupa, Latin Amerika ve Güneydoğu Asya’da elde ettiği zemini geri almayı hedefliyor.

Bu politik çerçeve, OpenAI’nin Apache 2.0 tercihiyle örtüşüyor. Daha kısıtlı bir lisansla gelinmesi, federal alıcılarda kabul engelleri yaratabilirdi; tam serbest lisans ise plana uyumun simgesi haline geldi. Beyaz Saray’ın plana eşlik eden açıklamalarında gpt-oss’in adı doğrudan anılmasa da, lansman tarihinin plan açıklaması ile aynı haftaya yerleştirilmesi sektör tarafından koordineli bir hamle olarak yorumlandı.

Politika bağlamının bir başka boyutu, ihracat kontrolleri ile açık ağırlık modeller arasındaki gerilim. ABD, ileri GPU’ların Çin’e satışını kısıtlarken Amerikan menşeli açık ağırlık modellerin Çin’de indirilmesini engelleyemiyor. Bu çelişki, plan içinde “model ağırlıkları için tedarik sonrası izleme” gibi yeni mekanizmaların tartışılmasına yol açtı; ancak Apache 2.0 gibi serbest lisanslarda pratikte uygulanabilir bir izleme mekanizması bulunmuyor. OpenAI’nin gpt-oss’i tam serbest lisansla yayımlaması, bu tartışmayı önümüzdeki dönemde daha da kızıştıracak gibi görünüyor. Donanım tarafındaki yeniden konumlanmayı anlamak için kapsamlı yazımız dosyası iyi bir başlangıç noktası.

Türkiye’deki Geliştirici Tercihi

Türkiye’deki yapay zeka geliştirici topluluğu, açık ağırlık modelleri uzun süredir yakından takip ediyor. KOBİ ölçeğindeki AI girişimleri, OpenAI API maliyetlerinin kur etkisiyle artmasından sonra alternatif arayışına girdi ve Llama 3, Qwen 2.5, DeepSeek V3 tabanlı çözümler hızla yaygınlaştı. gpt-oss ailesinin yayımlanmasıyla birlikte tablonun bu kez Amerikan bir markaya doğru kayma ihtimali konuşulmaya başlandı.

Türkiye özelinde dikkat çeken üç pratik avantaj var. İlki, gpt-oss-20b’nin yerelde çalıştırılabilir olması nedeniyle KVKK kaygısı taşıyan kurumsal müşterilere kolay sunulabilmesi. İkincisi, Apache 2.0 lisansının Kalkınma Ajansı ve TÜBİTAK destekleri kapsamında yapılan projelerde sorunsuz kabul ediliyor olması. Üçüncüsü, OpenAI’nin marka bilinirliğinin satış sürecinde Çinli alternatiflere göre belirgin avantaj sağlaması; karar verici pozisyonundaki yöneticiler “OpenAI” adını duyduğunda ek bir teknik ikna sürecine girilmesi gerekmiyor.

Türkçe dil performansı tarafında ise dikkatli olmak gerekiyor. gpt-oss-120b, Türkçe metin üretiminde Qwen 2.5-72B kadar akıcı değil; özellikle uzun bağlamlı tercüme ve resmi yazışma görevlerinde Alibaba modeli daha doğal çıktılar veriyor. Türkiye’deki geliştiricilerin yakın dönemde melez bir mimariye yönelmesi bekleniyor: ana akıl yürütme gpt-oss üzerinde, dil üretimi Qwen üzerinde çalışan iki katmanlı pipeline’lar. Ana ekonomi haberlerinin ai model gündemi sayfası üzerinden takibi, bu kararı verecek teknik liderler için faydalı bir referans noktası olarak kullanılabilir.

Sıkça Sorulan Sorular

↑ Başa dön

gpt-oss-120b ve gpt-oss-20b arasındaki temel fark nedir?

120b sürümü 117 milyar parametre civarında MoE mimarisiyle kurulu, tek bir 80 GB H100 GPU üzerinde çalışacak şekilde optimize edildi. 20b sürümü 21 milyar parametre seviyesinde tutuldu ve 16 GB belleğe sahip kartlarda yerelde çalıştırılabiliyor. Performans olarak 120b özellikle kod ve matematik görevlerinde belirgin biçimde önde; 20b ise hız ve düşük donanım gereksinimi avantajı sunuyor.

gpt-oss modelleri ticari ürünlerde kullanılabilir mi?

Evet. Apache 2.0 lisansı altında yayımlandıkları için ticari kullanım, türev model üretme, yeniden adlandırarak ürünleştirme gibi senaryolarda hiçbir ek izin gerekmiyor. Meta’nın Llama lisansında bulunan günlük aktif kullanıcı eşiği gibi sınırlamalar gpt-oss’te yer almıyor; bu yönüyle kurumsal entegrasyonlarda hukuki belirsizliği önemli ölçüde azaltıyor.

açık ağırlık llm modeli neden tercih edilir?

Açık ağırlık modeller veri egemenliği, maliyet kontrolü ve özelleştirme esnekliği sağlar. Kurumsal kullanıcılar verisini dış API’ye göndermek zorunda kalmaz; modelin yerelde çalıştırılması KVKK ve GDPR uyumunu kolaylaştırır. Fine-tune ile sektöre özel davranışlar kazandırılabilir ve uzun vadede çıkarsama maliyetleri kapalı API’lere kıyasla dramatik biçimde düşürülebilir.

OpenAI açık ağırlığa geçti diye kapalı modelleri terk edecek mi?

Hayır. Şirket ikili strateji izliyor: gpt-oss ailesi geliştirici topluluğu ve federal tedarik için açık katman, GPT-5 ve sonraki modeller ise yüksek marjlı kurumsal katman olarak kurgulanıyor. Açık ağırlık modeller bir “ısındırma” veya “yerel kullanım” katmanı işlevi görürken, en güçlü yetenekler kapalı API’de tutulmaya devam edecek. Şirket yöneticileri, açık ağırlık ailenin düzenli aralıklarla güncelleneceğini açıklasa da yayın takvimine ilişkin somut bir taahhüt henüz paylaşılmadı.

Editör notu: Bu analizde kullanılan kaynaklar Bloomberg, CNBC, TechCrunch, IEEE Spectrum ve MIT Technology Review gibi yabancı otoriteli yayınlardan derlendi. Modellerin performansı ve pazar konumlanmasına ilişkin değerlendirmeler yayın tarihindeki kamuya açık verilere dayanan gözlemlerdir; ileride bağımsız test sonuçları tabloyu değiştirebilir. Bu yazı yatırım tavsiyesi değildir, bilgilendirme amaçlıdır. — Mehmet Kara, Teknoloji Editörü

Paylaş:XLinkedInTelegram

Düşüncelerinizi paylaşın

Yazıdaki önerilerden hangisini deneyeceksiniz? Tecrübenizi ya da sorularınızı yorumlarda yazın; editörlerimiz yanıtlamak için takip ediyor.

Haftalık bültene abone olun

Sağlık, endüstri, teknoloji ve iş dünyasından öne çıkanlar her hafta e-posta kutunuzda.

Yorum gönder

Bu Hafta Öne Çıkanlar

Blog Servisİstanbul, Türkiyeiletisim@blogservis.comKuruluş: 2020
Düşünceleriniz bizim için değerli Yorum yaz