DeepSeek, Güç Tüketiminde Yeni Bir Seviyeye Ulaşıyor
Çin menşeli ve ChatGPT’ye rakip olarak gösterilen DeepSeek, güncellenmiş R1 AI modeli ile dikkatleri üzerine çekiyor. Yapılan yeni haberlere göre, DeepSeek’in güncellenmiş modeli tek bir GPU üzerinden çalışabilecek seviyeye geldi ve güç tüketiminde yeni bir dönemi başlatabilir. DeepSeek-R1-0528-Qwen3-8B modelinin piyasaya sürülmesiyle, şirket belirli benchmark testlerinde benzer modelleri geride bıraktığını söylüyor.
Alibaba’nın Qwen3-8B modelinden esinlenerek geliştirilen yeni R1 versiyonu, Google’ın Gemini 2.5 Flash modeline göre AIME 2025 testinde daha iyi performans sergiledi. Aynı zamanda Microsoft’un Phi 4 modeliyle HMMT matematik beceri testinde benzer başarıyı elde etti.
Ufaltılmış modeller genellikle tam boyutlu modellere kıyasla daha az yetenekli olabilir ancak performanslarıyla öne çıkabiliyorlar. Ayrıca bu ufaltılmış modellerin hesaplama açısından daha az kaynak gerektirdiği biliniyor.
Qwen3-8B’nin çalışması için 40 GB – 80 GB RAM’e sahip bir GPU gerekiyor. Tam boyutlu yeni R1 modeli ise yaklaşık on iki adet 80 GB GPU gerektiriyor. DeepSeek-R1-0528-Qwen3-8B modeli, ticari kullanıma açık bir MIT lisansı altında sunuluyor ve birçok dağıtıcı tarafından API aracılığıyla kullanılabiliyor.