-
Claude ile Pizza Siparişi, WordPress’ten AI Atağı ve Canva’yla AI Tasarım Dönemi
- 2025/04/13
- 再生時間: 31 分
- ポッドキャスト
-
サマリー
あらすじ・解説
Bu haftaki podcast’te yapay zeka dünyasında yine dopdolu bir gündemle karşınızdayız. Geçtiğimiz hafta benchmark’larda GPT-4o ve Grok’ı geride bıraktığı iddia edilen LLaMA 4’ün aslında pek de başarılı olmadığı ortaya çıktı. LM Arena’daki ikinci sıranın doğruluğu sorgulanırken, topluluk tarafından modelin genel olarak beğenilmediğini görüyoruz.
Yazılımcıları ilgilendiren önemli bir gelişmeyle devam ediyoruz: VS Code’a Agent Mode özelliği geldi. Bu yenilik, özellikle Cursor gibi yapay zeka destekli kod editörlerine ciddi bir rakip olarak görülüyor.
Araştırma dünyasında ise “Test Time Training” adlı bir paper dikkat çekti. Bu teknik sayesinde, geleneksel video modellerinin üretebildiği 5-10 saniyelik içerikler artık bir dakikaya kadar uzatılabiliyor. Hatta Tom & Jerry tarzı uzun animasyonlar üretildi bile.
ElevenLabs, yapay zekaların dış dünya ile etkileşimini sağlayan MCP protokolünü resmi olarak destekleyen sunucularını duyurdu. Paylaştıkları videoda Claude’a verilen bir prompt ile, ElevenLabs’teki ses klonu pizzacıyı arıyor ve sipariş veriyor. Sadece bir prompt ile gerçekleşen bu işlem, AI ajanlarının günlük hayatımıza ne kadar entegre olduğunu gözler önüne seriyor.
Amazon’un yeni video modeli Nova Reel ise 6 saniyeden 2 dakikaya kadar video üretebiliyor. Ancak bu gelişme pek ilgi görmedi çünkü herkes benzer şeyleri yapıyor. Higgsfield AI gibi daha etkileyici örneklerin dikkat çekmeye devam ettiğini görüyoruz.
Amazon ayrıca Nova Sonic adında yeni bir speech-to-speech modeli tanıttı. Sesli uygulamalar için alternatif olabilecek bu model, sesli iletişimde yeni kapılar aralayabilir. Tencent’in tanıttığı Actalker ise dudak senkronizasyonu konusunda başarılı örnekler sunuyor; herhangi bir fotoğrafı konuşan bir yüze dönüştürebiliyor.
WordPress de yapay zeka yarışına katıldı. Artık Lovable ve v0 benzeri bir araçla, sadece prompt yazarak site üretmek mümkün. Dünyadaki sitelerin %40'ının WordPress ile yapılmış olduğu düşünüldüğünde bu gelişme oldukça önemli.
Google, agent'ların birbirleriyle iletişim kurmasını sağlayan Agent 2 Agent protokolünü duyurdu. MCP’den farklı olarak, Claude, Gemini ve ChatGPT gibi modellerin birbirleriyle iletişim kurabileceği bir yapı sunuyor. Henüz pratik bir demo görmemiş olsak da, bu protokol zamanla ilgi görebilir.
Google DeepMind ayrıca Vertex AI için Lyria adında yeni bir müzik üretme modeli geliştirdi. Aynı zamanda Firebase Studio ile v0 ve Lovable gibi platformlara rakip olacak yeni bir araç sundu ancak ilk tepkiler pek olumlu değil.
Adobe de Photoshop için agent tabanlı düzenleme sistemleri geliştiriyor. Canva da yapay zeka destekli tasarım araçları ve fotoğraf düzenleme özellikleriyle yarışa katıldı. Video ve fotoğraf düzenleme işlerindeki bu dönüşüm, AI'ın yaratıcı alanları tamamen devralacağının işareti olabilir.
Unitree’nin G1 robotları bu kez ringe çıktı: Boks yapan robotlar oldukça eğlenceli olsa da, evimize ne zaman girecekleri hâlâ belirsiz.
Pika’nın “Twists” özelliği ile videolardaki karakterleri veya objeleri sadece prompt yazarak değiştirebiliyoruz. Kahve içen kedilerden Transformers’a dönüşen arabalar artık sadece birkaç kelime uzağımızda.
ChatGPT’nin memory özelliği artık geçmiş tüm konuşmaları hatırlıyor. Bu sayede her seferinde aynı bilgileri tekrar etmek zorunda kalmadan, daha doğal ve kişisel bir diyalog kurulabiliyor.
ElevenLabs, profesyonel ses klonlama sürecini basitleştirdi. Sadece tarayıcıdan ses kaydı yaparak kendi ses klonunuzu oluşturabiliyorsunuz. Bilim kurgu sahnelerinden çıkma bu teknoloji artık hayatımızın bir parçası.
Son olarak, Canva AI etkinliğinde "Canva Code" gibi yeni üretken AI araçları tanıttı. Prompt’la tasarım üretimi ve AI Photo Editor ile görsel düzenleme, gelecekte tasarım süreçlerini tamamen yapay zekaya bırakabileceğimizin sinyallerini veriyor.