Yapay Zeka Bulut Çiplerinde Fiyat Hareketi: H200 Düşüşü ve Anthropic Trainium Anlaşması
Yapay zeka çip fiyat dengesi son aylarda yön değiştirdi. H200 saatlik kira ücreti üç haftalık dönemde yüzde kırk geriledi, H100 yıllık sözleşmeler ters yönde tırmandı ve Anthropic art arda imzaladığı yüz milyar dolar ölçekli anlaşmalarla bulut ekonomisini yeniden çizdi.
Yapay Zeka Bulut Çiplerinde Fiyat Hareketi: H200 Düşüşü ve Anthropic Trainium Anlaşması
Yapay zeka çip fiyat dengesi son aylarda yön değiştirdi. H200 saatlik kira ücreti üç haftalık dönemde yüzde kırk geriledi, H100 yıllık sözleşmeler ters yönde tırmandı ve Anthropic art arda imzaladığı yüz milyar dolar ölçekli anlaşmalarla bulut ekonomisini yeniden çizdi. Bu yazı söz konusu hareketleri tek başlıkta toparlıyor.
H200 Kira Fiyatında Üç Haftada Yüzde Kırk Düşüş
Mayıs ayının ilk haftalarında Bloomberg Terminal üzerinde takip edilen H200 saatlik kira fiyatları, üç haftalık dilimde yüzde kırk seviyesinde geriledi. Bilgikripto ve Bloomberg verilerine göre kısa vadeli sözleşmelerde saatlik fiyat 2,50 dolar ile 10,60 dolar arasında geniş bir bant oluşturdu. Aradaki uçurum coğrafi konumdan, elektrik tarifesinden ve sağlayıcının yedek kapasite stratejisinden besleniyor.
Bant aralığının alt ucunda Kuzey Avrupa ve İskandinav bölgesindeki neocloud sağlayıcıları yer alıyor. Bu firmalar düşük elektrik maliyetini ve yenilenebilir enerji kontratlarını avantaja çevirip yüzde otuz iki ile yüzde otuz beş arasında brüt marjla saatlik 2,50 dolar civarında fiyat veriyor. Üst ucu ise Kuzey Amerika kıyısındaki hiperölçek operatörlerin perakende fiyatları tutuyor. Aradaki dört kat fark, kurumsal alıcının coğrafi arbitrajı ne kadar değerlendirebileceğini doğrudan belirliyor.
Düşüşün arkasındaki temel sebep arz tarafında yaşanan rahatlama. Önceki dönemde sevkiyat kuyrukları altı ile dokuz ay arasındaydı. Geçtiğimiz çeyrekte teslim edilen yeni partiler ve eski H100 envanterinin H200 hattına çevrilmesiyle birlikte spot piyasaya akan saatlik kapasite belirgin biçimde arttı. Talep tarafında ise büyük modellerin eğitimi için yapılan rezervasyonların önemli bir kısmı uzun vadeli kontratlara taşındı, spot havuzu boşaldı. Sektörün yapay zeka çipi pazarı dinamiklerini izleyenler için bu rahatlama, son on iki ayın en belirgin ayarlamalarından biri sayılıyor.
H100 Saatlik Fiyatın Çift Karakteri
H200 spot tarafı yumuşarken H100 sözleşmeli tarafı sertleşti. Bir yıllık kira fiyatı ekim ayında saatlik 1,70 dolar seviyesindeyken mart ayında 2,35 dolara yükseldi. Yaklaşık yüzde kırklık artış, küçük ve orta ölçekli sağlayıcıların finansman maliyetlerini yansıttı. Faiz oranlarının yüksek seyretmesi ve donanım kredilerinin yenilenmesi, sabit dönem kontratlarına doğrudan baskı yaptı.
Spot tarafa bakıldığında coğrafi ayrışma daha net görülüyor. Doğu yakasında saatlik fiyat 5,76 dolar seviyesinde dengelendi. Batı yakasında ise yoğun talep ve kıyı bölgelerindeki elektrik darboğazları nedeniyle saatlik fiyat 6,80 dolara çıktı. İki rakam arasındaki bir dolarlık fark, on bin GPU saatlik bir eğitim koşusunda on bin doları aşan tasarruf demek. Bu nedenle yeni nesil eğitim kümeleri kontrat imzalamadan önce hangi bölgede kira çekeceğini ayrı bir karar olarak ele alıyor.
SemiAnalysis’in saha bazlı endeksi de aynı eğilimi doğruluyor. SemiAnalysis GPU kira kapasitesi raporu, on iki aylık dönemde sözleşmeli H100 fiyatının nasıl açıldığını şehir şehir kıyaslıyor. Rapor, donanım yaşının üçüncü yılına yaklaşmasına rağmen eğitim talebinin bu çipi piyasada tutmaya devam ettiğini ortaya koyuyor. H100 hâlâ envantere giren her yeni neocloud için referans varlık konumunda.
TCO Modelinin Gizli Maliyetleri
Saatlik liste fiyatı yalnızca buzdağının görünen kısmı. SemiAnalysis’in yayımladığı TCO modeli, neocloud sağlayıcılarının saatlik 1,525 dolar seviyesinde bir maliyet eşiği taşıdığını gösteriyor. Bu rakam donanım amortismanını, finansman giderlerini, veri merkezi kirasını, elektriği, soğutmayı ve ağ giderlerini birleştiriyor. Hiperölçek operatörlerinin müşteriye yansıttığı fiyat ise saatlik 2 ile 3 dolar arasında değişen bir prim taşıyor. Aradaki fark hizmet seviyesinden, yönetilen yazılım katmanından ve kurumsal destekten kaynaklanıyor.
Kurumsal alıcılar bu rakamları okurken iki ayrı katmanı ayırt etmek zorunda. Bir tarafta sade bare-metal kiralayan ve kümeyi kendisi yöneten teknik ekipler için neocloud modeli avantajlı. Diğer tarafta yönetilen Kubernetes, otomatik checkpoint ve yedekli ağ omurgası bekleyen kurumlar için hiperölçek primi makul bir sigorta olarak görülüyor.

Aşağıdaki tablo, hâlihazırda piyasada görülen başlıca fiyat aralıklarını derliyor.
| Sınıf | Tip | Saatlik Aralık (USD) | Not |
|---|---|---|---|
| H200 | Spot | 2,50 – 10,60 | Coğrafyaya bağlı geniş bant |
| H100 | 1 yıl sözleşmeli | 1,70 – 2,35 | Faiz baskısı belirleyici |
| H100 | Spot, Doğu Yakası | 5,76 | Talep dengeli |
| H100 | Spot, Batı Yakası | 6,80 | Elektrik darboğazı |
| Neocloud TCO | Borç dâhil | 1,525 | SemiAnalysis modeli |
| Hiperölçek | Yönetilen | 2,00 – 3,00 üzeri prim | Kurumsal SLA |
Maliyet analizinde göz ardı edilen üçüncü kalem ise ağ trafiği. Eğitim kümeleri terabit seviyesinde InfiniBand trafiği üretiyor ve sağlayıcılar bu trafiği bazen ayrı kalemde faturalıyor. Spot saatlik 2,50 dolar görünen bir teklif, ağ ve depolama kalemleri eklendiğinde 4 dolar seviyesine çıkabiliyor. Bu nedenle kurumsal teklif karşılaştırmalarında brüt liste fiyatına değil, hizmet aylık toplamına bakmak doğru tercih sayılıyor.
Anthropic ve AWS Trainium Yüz Milyar Anlaşması
Anthropic, nisan ayında AWS ile yapılan görüşmelerin sonucunda on yıllık ve yüz milyar doları aşan bir altyapı sözleşmesi imzaladı. Anlaşmanın merkezinde Amazon’un kendi tasarımı Trainium2 çipleri yer alıyor. AWS, Indiana eyaletindeki yeni veri merkezi kampüsünü beş yüz bin Trainium2 ünitesi konuşlandıracak şekilde planladığını duyurdu. Bu büyüklük, tek bir lokasyonda yığılan en yüksek özel hızlandırıcı kapasitelerinden birini temsil ediyor.
Sözleşmenin teknik tarafı ilginç. Trainium2, Nvidia çiplerine kıyasla farklı bir bellek topolojisi kullanıyor ve büyük dil modeli eğitiminde belirli operasyonlarda enerji verimliliği avantajı sağlıyor. Anthropic, Claude ailesinin eğitim hattını çoklu hızlandırıcı mimarisine taşıyarak tek bir tedarikçiye bağımlılığı düşürmeyi amaçlıyor. AWS açısından ise anlaşma, hızlandırıcı tasarımındaki yıllık yatırımı uzun vadede amortisman edebilecek tek bir kotlatif müşteri anlamına geliyor.
Anlaşmanın finansman boyutu, sektördeki çip girişim yatırımları akışını da yeniden şekillendiriyor. Yatırımcılar, modeli geliştiren şirketlerin doğrudan hızlandırıcı tedarikçilerine ortak olmaya başlamasıyla birlikte tedarik zincirinin ucuna yatırım yapma motivasyonunu tazeledi. Bu eğilim, Nvidia merkezli ekosistemin yanında AWS Trainium, Google TPU ve özel ASIC tasarımları için ikinci bir sermaye katmanı oluşturdu.
Anthropic Google İki Yüz Milyar Dolar Hamlesi
AWS sözleşmesinden önce, kasım ayında Anthropic ile Google arasında imzalanan beş yıllık altyapı anlaşmasının değeri yüz milyar dolardan iki yüz milyar dolara çıkartıldı. Sözleşmenin omurgasında Google’ın yedinci nesil TPU mimarisi yer alıyor. Bu büyüklükteki bir genişletmenin tek seferde duyurulması, model şirketlerinin önümüzdeki beş yıllık eğitim ve servis ihtiyaçlarını şimdiden kilitlemeye başladığını gösteriyor.
Google tarafında anlaşma, TPU yatırımının ana müşteri tabanını dış dünyaya açma stratejisinin bir parçası. Şirket uzun süredir TPU kapasitesinin önemli kısmını iç kullanım için ayırıyordu. Anthropic anlaşması ile birlikte TPU kapasitesinin ticari müşteriye açılan oranı belirgin biçimde yükseldi. CNBC’nin Nvidia GPU, Google TPU ve AWS Trainium karşılaştırması, üç mimari arasındaki performans ve fiyat farklarını detaylı biçimde özetliyor.
Anthropic’in Microsoft ile yürüttüğü görüşmeler de gündemde. Şirket üç büyük bulut sağlayıcısının üçüyle eş zamanlı altyapı sözleşmesi yürüten ilk model üreticisi olma yolunda ilerliyor. Bu çoklu tedarikçi stratejisi, hem fiyat müzakeresinde elini güçlendiriyor hem de kapasite kıtlığı yaşandığında modelin servis sürekliliğini güvence altına alıyor. Yatırımcılar açısından ise bu yapı, model şirketinin uzun vadeli ölçek planı için bir sigorta poliçesi anlamı taşıyor.
Cerebras ve Inference-as-a-Service Yükselişi
Eğitim tarafında Nvidia ve özel ASIC üreticileri rekabet ederken, çıkarım yani inference tarafında Cerebras farklı bir konum aldı. Şirketin sunduğu inference-as-a-service paketi, büyük dil modellerini saniyede yüksek token üretim hızlarıyla servis ediyor. Cerebras, wafer ölçekli tek çip mimarisi sayesinde küçük ve orta ölçekli modellerde dakikalar süren yanıtları saniyelere indirebildiğini gösteriyor.
Bu yaklaşım kurumsal kullanıcı için iki tarafı kesen bıçak. Bir tarafta düşük gecikme hızı, gerçek zamanlı asistan uygulamaları için belirleyici. Diğer tarafta tek tedarikçiye bağlı olmak ve farklı modelleri taşımanın sınırları kurumların ikinci bir sağlayıcı bulundurmasını teşvik ediyor. Sektörde “inference karması” diye anılan bu pratikte iş yükü gecikmeye hassasiyetine göre Cerebras, Groq ve klasik GPU sağlayıcıları arasında bölüştürülüyor.
Inference fiyatlamasının kendisi de hızla evriliyor. Saatlik GPU kirası yerine bin token başına ücretlendirme yaygınlaşıyor. Bu modelde maliyet, modelin parametre sayısına ve istek başı ortalama yanıt uzunluğuna doğrudan bağlanıyor. Token bazlı fiyatlama, kurumsal alıcının kapasiteyi önceden satın almak yerine kullandıkça ödemesine olanak tanıyor. Bu yapı küçük ekipler için giriş eşiğini düşürdü; tahmin edilebilirlik isteyen büyük kurumlar ise yine sabit kapasite sözleşmesini tercih etmeye devam ediyor. IEEE Spectrum’un GPU fiyat analizi, eğitim ve çıkarım maliyetlerinin neden farklı eğrilerde hareket ettiğini iyi açıklayan kaynaklardan biri olarak öne çıkıyor.
Inference tarafının diğer önemli boyutu enerji. Tek bir istek için harcanan elektrik miktarı eğitim koşusuna kıyasla küçük olsa da, milyonlarca eş zamanlı isteğin yığılması veri merkezi yük profilini hızla değiştiriyor. Bu yüzden büyük servis sağlayıcıları çıkarım kümesini düşük enerji maliyetli bölgelere taşıma eğiliminde. Cerebras gibi tek wafer mimarileri ise klasik GPU kümelerine göre belirli iş yüklerinde watt başına daha çok token üretebildiğini iddia ediyor. Bu iddianın kurumsal alıcı için anlamı, faturanın yalnızca saatlik kira değil aynı zamanda elektrik kaleminden de besleniyor olması.
Meta Nebius On İki Milyar Özel Kapasite
Hızlandırıcı pazarındaki başka bir sürpriz hamle Meta cephesinden geldi. Şirket, Nebius ile on iki milyar dolarlık özel kapasite anlaşması imzaladı. Sözleşmenin teslim takvimi önümüzdeki iki yıla yayılmış durumda ve fiili kapasite akışı önümüzdeki çeyreklerden itibaren başlıyor. Bu anlaşma, Meta’nın kendi veri merkezlerine yaptığı yatırımın yanında dış sağlayıcılardan tedarik ettiği özel kapasitenin de büyüdüğünü gösteriyor.

Nebius açısından sözleşme, halka arz sonrası şirketin önündeki en büyük tek müşteri bağlantısı oldu. Şirket bilanço döneminde bu anlaşmanın gelecek dönem gelir görünürlüğünü ne ölçüde sabitlediğini paylaştı. Sektörde “anchor müşteri” denilen bu yapı, neocloud sağlayıcılarının yatırımlarını borç piyasasında finanse ederken kullandığı ana teminat hâline geliyor. Nvidia çeyrek bilançosu üzerinden yapılan analizler, bu tür uzun vadeli sözleşmelerin tedarikçi tarafına yansıyan gelir akışını da büyüttüğünü ortaya koyuyor.
SemiAnalysis’in yayımladığı ClusterMAX değerlendirmesi, bu tür özel kapasite anlaşmalarının operasyonel kalitesini ölçen ilk bağımsız çerçeveyi sunuyor. SemiAnalysis ClusterMAX değerlendirme sistemi, sağlayıcıları uptime, ağ kalitesi, depolama hızı ve müşteri desteğine göre derecelendiriyor. Kurumsal alıcı için bu derecelendirme, listede beliren her saatlik fiyatın gerçek bir hizmet seviyesine karşılık gelip gelmediğini sorgulayan bir filtre işlevi görüyor.
Kurumlar İçin Maliyet Stratejisi
Yapay zeka çip fiyat hareketleri kurumsal alıcı tarafında üç katmanlı bir karar sürecini zorunlu kılıyor. İlk katman iş yükünün karakterini belirlemek. Eğitim koşusu mu, çıkarım servisi mi, batch işlem mi sorusunun yanıtı doğrudan farklı sağlayıcılara yönlendiriyor. İkinci katman sözleşme süresi. Spot saatlik fiyat üç haftada yüzde kırk düştüğü için kısa vadeli iş yükleri spot tarafa yöneliyor; eğitim koşuları ise birden fazla yıla yayılan rezervasyonla kilitleniyor.
Üçüncü katman coğrafi seçim. Doğu yakası ile batı yakası arasındaki dolar farkı, Kuzey Avrupa ile Kuzey Amerika arasındaki dört kat fark ve elektrik kontratları kurumsal alıcı için ciddi bir arbitraj alanı oluşturuyor. Bunun yanına veri yerelliği regülasyonu eklendiğinde tablo daha da karmaşık hâle geliyor. Aşağıdaki dört madde, hâlihazırda kurumların maliyet planlamasında benimsediği temel kontrol noktalarını özetliyor.
- Eğitim koşularını uzun vadeli rezervasyona, kısa vadeli denemeleri spot havuzuna ayır.
- Sözleşmede yalnızca saatlik fiyatı değil ağ trafiği ve depolama kalemini ayrıca müzakere et.
- İkinci tedarikçi olarak farklı bir hızlandırıcı mimarisi tutmaya çalış; Trainium, TPU ve GPU arasında iş yükü dağıtımı şok absorberi işlevi görüyor.
- SemiAnalysis ClusterMAX ve Bloomberg Terminal GPU endeksini kontrat öncesinde karşılaştır.
Stratejinin yumuşak tarafında ise insan kaynağı var. Kümeyi yönetebilecek SRE ekibinin maliyeti, neocloud ve hiperölçek tercihi arasındaki primi büyük ölçüde belirliyor. Şirket içinde küme yönetebilecek ekip varsa neocloud avantajlı; yoksa hiperölçek primi mantıklı bir sigorta olarak öne çıkıyor. Bu kararı verirken bu konudaki yazımız tarafındaki mevcut sözleşmelerin koşulları da masaya yatırılmalı, çünkü ağ çıkışı ve depolama uyumu eğitim kümesinin verimini doğrudan etkiliyor.
Kurumsal bütçeleme tarafında bir başka belirleyici nokta, taahhüt seviyesinin esnekliğini doğru oturtmak. Üç yıllık sabit kontrat saatlik fiyatı düşürürken, talep tahmininde sapma olursa kullanılmayan kapasite bilançoda batık maliyete dönüşüyor. Bu nedenle finansal kontrolörler son aylarda kademeli rezervasyon modeline yöneliyor; yüzde altmış kapasite uzun vadeli sözleşmeyle, yüzde yirmisi orta vadeli, geri kalanı spot piyasayla dengeleniyor. Bu üçlü yapı, fiyatın yön değiştirdiği üç haftalık pencerelerde şirketin ortalama maliyetini stabilize etmesini sağlıyor.
Son olarak izleme altyapısı. Bloomberg Terminal üzerinde canlı GPU fiyat endeksi takip eden kurumlar, müzakereye girmeden önce son dört haftalık ortalama, oynaklık ve coğrafi dağılım verilerini elde tutuyor. Bu tip içgörü, sözleşme görüşmesinde sağlayıcıya karşı objektif bir dayanak sunuyor ve liste fiyatı ile gerçek piyasa fiyatı arasındaki açığı görünür kılıyor. Yapay zeka çip fiyat takibinin standart kurumsal pratiğe yerleştiği bu dönemde, müzakere masasına verisiz oturmak ciddi maliyet farkı doğurabiliyor.
Sıkça Sorulan Sorular
Yapay zeka çip fiyat hareketi neden bu kadar dalgalı?
Hızlandırıcı arzı sevkiyat döngülerine, finansman maliyetlerine ve büyük model şirketlerinin uzun vadeli rezervasyonlarına bağlı. Bu üç değişkenden ikisi aynı anda değiştiğinde fiyat üç hafta gibi kısa bir sürede çift haneli yüzdelerde hareket edebiliyor. Spot piyasası bu hareketi en hızlı yansıtan katman.
H200 ile H100 arasındaki saatlik fiyat farkı kimin için anlamlı?
Büyük dil modeli eğitimi yapan ekipler için H200’ün yüksek bellek bant genişliği eğitim süresini kısaltıyor ve toplam maliyeti düşürüyor. Daha küçük modeller veya ince ayar koşuları için H100 yeterli kalıyor. Spot fiyat farkını saatlik değil, koşunun toplam saatine çevirerek karşılaştırmak gerekiyor.
Anthropic neden aynı anda birden çok bulut sağlayıcısıyla sözleşme yapıyor?
Tek tedarikçiye bağımlı kalmak hem fiyat müzakeresinde elini zayıflatıyor hem de kapasite kıtlığında modelin servis sürekliliğini riske atıyor. AWS, Google ve Microsoft hattındaki üç ayrı sözleşme şirkete arz çeşitlemesi ve uzun vadeli ölçek güvencesi sağlıyor.
Neocloud sağlayıcıları hiperölçek operatörlere göre neden daha ucuz?
Neocloud şirketleri genellikle yönetilen yazılım katmanı sunmuyor; müşterilere bare-metal ya da hafif sanallaştırılmış sunucu veriyor. Veri merkezi konumlarını düşük elektrik tarifesine göre seçiyorlar ve yönetim maliyetini dar tutuyorlar. Hiperölçek primi büyük ölçüde yönetilen hizmet ve kurumsal destek bedelini yansıtıyor.
Yapay zeka çip fiyat takibini günlük yapmak mantıklı mı?
Eğitim koşuları aylar süren yatırımlar olduğu için günlük dalgalanma yerine haftalık ortalamalara bakmak daha sağlıklı. Bloomberg Terminal canlı endeksi ve SemiAnalysis raporları haftalık ortalamayı net biçimde sunuyor. Kontrat görüşmesi öncesinde son dört haftalık ortalamayı referans almak yaygın pratik.
Önümüzdeki dönem hızlandırıcı pazarında üç çizgi belirleyici olacak. Birinci çizgi, model şirketlerinin uzun vadeli rezervasyonlarının spot havuzundan ne kadar kapasite çekeceği. İkinci çizgi, Trainium ve TPU gibi özel ASIC’lerin Nvidia merkezli mimarinin yanında ikinci kemer kuracak biçimde olgunlaşıp olgunlaşamayacağı. Üçüncü çizgi ise neocloud sağlayıcılarının borç finansman koşullarının ne yöne evrileceği. Bu üç çizginin kesiştiği noktada yapay zeka çip fiyat eğrisi şekillenmeye devam edecek. Daha geniş sektör tablosunu izlemek isteyenler için teknoloji haberleri sayfası güncel takvimi sürekli güncelliyor.
Editör notu: Bu yazıdaki rakamlar SemiAnalysis, Bloomberg, CNBC ve IEEE Spectrum gibi yabancı otoriteli kaynaklara dayanıyor. Aktarılan değerlendirmeler piyasada dolaşan kamu raporları ve şirket açıklamaları üzerinden derlenmiş gözlemlerdir; spot piyasa kısa sürede değişebilir. Bu yazı yatırım tavsiyesi değildir, bilgilendirme amaçlıdır. — Mehmet Kara, Teknoloji Editörü



Düşüncelerinizi paylaşın
Yazıdaki önerilerden hangisini deneyeceksiniz? Tecrübenizi ya da sorularınızı yorumlarda yazın; editörlerimiz yanıtlamak için takip ediyor.