• Sıradaki Yapay Zeka Aracı

  • 著者: Ozgur Ozer
  • ポッドキャスト

Sıradaki Yapay Zeka Aracı

著者: Ozgur Ozer
  • サマリー

  • Yapay zeka dünyasındaki gelişmeleri aktardığımız podcast
    Ozgur Ozer
    続きを読む 一部表示

あらすじ・解説

Yapay zeka dünyasındaki gelişmeleri aktardığımız podcast
Ozgur Ozer
エピソード
  • OpenAI'dan GPT-4.1 ve o3, TED Konuşması Yapan Robot ve Maraton Koşan Robotlar
    2025/04/20

    Bu hafta OpenAI’ın yeni modellerinden, etkileyici video üretim araçlarına ve robotlarla ilgili dikkat çeken gelişmelere değindik.

    ByteDance’in (TikTok’ın çatı şirketi) geliştirdiği Seaweed adlı küçük boyutlu ama yüksek performanslı text-to-video modelini konuştuk. Bu model sayesinde, gelecekte TikTok üzerinden video üretmek veya var olan videoları anında düzenlemek mümkün olabilir ve hatta bu tür modelleri internet bağlantısı olmadan akıllı telefonlarımızda bile çalıştırabiliriz.

    Robot dünyasında ise bir geliştiricinin Unitree G1 robotunu modifiye edip itfaiyeciye dönüştürmesini, uzaktan yangın söndüren bu robotun gelecekte tehlikeli işleri devralabilecek robotlara ilham olabileceğini tartıştık. Ayrıca, Çin’de yapılan ilk robot yarı maratonu ve Tayland’da devreye alınan robot polislerle robot teknolojilerinin gerçek dünyadaki kullanım örneklerini ele aldık.

    Netflix’in bazı bölgelerde test etmeye başladığı yapay zeka destekli film arama özelliği sayesinde, artık film adından ziyade bir prompt yazarak arama yapabileceğiz. Özellikle "gelecekte geçen distopik filmler" gibi tematik aramalarla çok daha anlamlı öneriler almak mümkün hale gelecek.

    Google DeepMind’ın, yunus seslerini modelleyen DolphinGemma adlı yeni yapay zeka modelini ve iki dalgıcın yunuslarla yaptığı deneyleri konuştuk. Ayrıca, Google’ın yeni akıllı gözlüklerinde entegre edilen Gemini Live ile gerçek zamanlı olarak nesneleri ve soruları takip eden etkileyici demoyu değerlendirdik.

    OpenAI’ın yeni GPT-4.1 modeliyle birlikte 1 milyon token desteği ve önceki modele göre kodlamada %20 daha iyi performans sunduğuna değindik. OpenAI, aynı zamanda o3 ve o4-mini gibi gelişmiş modellerini ve Codex CLI adlı terminal ajanını duyurdu. o3 modelinin fotoğraflardan yer bulma konusundaki popülerliğini ve gerçek dünya denemelerindeki başarısını kendi deneyimlerimizle tartıştık.

    Kling’in aksiyon sahneleriyle öne çıkan 2.0 sürümü, Krisp AI'ın canlı aksan temizleme özelliği ve Grok’ın yeni hafıza fonksiyonları bu haftanın öne çıkan yenilikleri arasındaydı. Alibaba’nın Wan 2.1 modeliyle iki fotoğraf arasını otomatik olarak video haline getirme teknolojisi ve Tencent’in Frame Pack özelliğiyle laptop’ta bile sonsuz uzunlukta video üretilmesini mümkün kılan yeniliklerini değerlendirdik.

    Krea AI’ın Stage özelliğiyle prompt’tan 3 boyutlu dünyalar oluşturmak ve Luma AI’a gelen yeni kamera açısı desteği sayesinde daha sinematik videolar üretmek de gündemimizdeydi. Tüm bunlara ek olarak, robotlar ve yapay zekaların moda, polislik ve eğlence gibi çok farklı alanlardaki çarpıcı kullanım örnekleriyle, AI teknolojisinin hayatımıza nasıl hızla entegre olduğunu örneklerle ele aldık.

    Ve elbette, haftanın en dikkat çekici olaylarından biri olarak Neo isimli robotun TED sahnesine çıkarak gerçekleştirdiği etkileyici konuşmayı da izledik. YouTube’da yayınlandığı anda gündeme oturan bu konuşma, robotların artık sadece iş gücüne değil, sahnelere de adım attığını gösterdi.

    続きを読む 一部表示
    30 分
  • Claude ile Pizza Siparişi, WordPress’ten AI Atağı ve Canva’yla AI Tasarım Dönemi
    2025/04/13

    Bu haftaki podcast’te yapay zeka dünyasında yine dopdolu bir gündemle karşınızdayız. Geçtiğimiz hafta benchmark’larda GPT-4o ve Grok’ı geride bıraktığı iddia edilen LLaMA 4’ün aslında pek de başarılı olmadığı ortaya çıktı. LM Arena’daki ikinci sıranın doğruluğu sorgulanırken, topluluk tarafından modelin genel olarak beğenilmediğini görüyoruz.

    Yazılımcıları ilgilendiren önemli bir gelişmeyle devam ediyoruz: VS Code’a Agent Mode özelliği geldi. Bu yenilik, özellikle Cursor gibi yapay zeka destekli kod editörlerine ciddi bir rakip olarak görülüyor.

    Araştırma dünyasında ise “Test Time Training” adlı bir paper dikkat çekti. Bu teknik sayesinde, geleneksel video modellerinin üretebildiği 5-10 saniyelik içerikler artık bir dakikaya kadar uzatılabiliyor. Hatta Tom & Jerry tarzı uzun animasyonlar üretildi bile.

    ElevenLabs, yapay zekaların dış dünya ile etkileşimini sağlayan MCP protokolünü resmi olarak destekleyen sunucularını duyurdu. Paylaştıkları videoda Claude’a verilen bir prompt ile, ElevenLabs’teki ses klonu pizzacıyı arıyor ve sipariş veriyor. Sadece bir prompt ile gerçekleşen bu işlem, AI ajanlarının günlük hayatımıza ne kadar entegre olduğunu gözler önüne seriyor.

    Amazon’un yeni video modeli Nova Reel ise 6 saniyeden 2 dakikaya kadar video üretebiliyor. Ancak bu gelişme pek ilgi görmedi çünkü herkes benzer şeyleri yapıyor. Higgsfield AI gibi daha etkileyici örneklerin dikkat çekmeye devam ettiğini görüyoruz.

    Amazon ayrıca Nova Sonic adında yeni bir speech-to-speech modeli tanıttı. Sesli uygulamalar için alternatif olabilecek bu model, sesli iletişimde yeni kapılar aralayabilir. Tencent’in tanıttığı Actalker ise dudak senkronizasyonu konusunda başarılı örnekler sunuyor; herhangi bir fotoğrafı konuşan bir yüze dönüştürebiliyor.

    WordPress de yapay zeka yarışına katıldı. Artık Lovable ve v0 benzeri bir araçla, sadece prompt yazarak site üretmek mümkün. Dünyadaki sitelerin %40'ının WordPress ile yapılmış olduğu düşünüldüğünde bu gelişme oldukça önemli.

    Google, agent'ların birbirleriyle iletişim kurmasını sağlayan Agent 2 Agent protokolünü duyurdu. MCP’den farklı olarak, Claude, Gemini ve ChatGPT gibi modellerin birbirleriyle iletişim kurabileceği bir yapı sunuyor. Henüz pratik bir demo görmemiş olsak da, bu protokol zamanla ilgi görebilir.

    Google DeepMind ayrıca Vertex AI için Lyria adında yeni bir müzik üretme modeli geliştirdi. Aynı zamanda Firebase Studio ile v0 ve Lovable gibi platformlara rakip olacak yeni bir araç sundu ancak ilk tepkiler pek olumlu değil.

    Adobe de Photoshop için agent tabanlı düzenleme sistemleri geliştiriyor. Canva da yapay zeka destekli tasarım araçları ve fotoğraf düzenleme özellikleriyle yarışa katıldı. Video ve fotoğraf düzenleme işlerindeki bu dönüşüm, AI'ın yaratıcı alanları tamamen devralacağının işareti olabilir.

    Unitree’nin G1 robotları bu kez ringe çıktı: Boks yapan robotlar oldukça eğlenceli olsa da, evimize ne zaman girecekleri hâlâ belirsiz.

    Pika’nın “Twists” özelliği ile videolardaki karakterleri veya objeleri sadece prompt yazarak değiştirebiliyoruz. Kahve içen kedilerden Transformers’a dönüşen arabalar artık sadece birkaç kelime uzağımızda.

    ChatGPT’nin memory özelliği artık geçmiş tüm konuşmaları hatırlıyor. Bu sayede her seferinde aynı bilgileri tekrar etmek zorunda kalmadan, daha doğal ve kişisel bir diyalog kurulabiliyor.

    ElevenLabs, profesyonel ses klonlama sürecini basitleştirdi. Sadece tarayıcıdan ses kaydı yaparak kendi ses klonunuzu oluşturabiliyorsunuz. Bilim kurgu sahnelerinden çıkma bu teknoloji artık hayatımızın bir parçası.

    Son olarak, Canva AI etkinliğinde "Canva Code" gibi yeni üretken AI araçları tanıttı. Prompt’la tasarım üretimi ve AI Photo Editor ile görsel düzenleme, gelecekte tasarım süreçlerini tamamen yapay zekaya bırakabileceğimizin sinyallerini veriyor.

    続きを読む 一部表示
    31 分
  • OpenAI’ın 40 Milyar Dolarlık Yatırımı, Midjourney V7 ile Sınırları Zorlayan Görseller ve Zapier’ın MCP Entegrasyonu
    2025/04/06

    Bu haftaki podcast’te yapay zeka dünyasındaki çarpıcı gelişmeleri ve heyecan verici yenilikleri ele aldık. İlk olarak, Figure robotun yayınladığı yeni video ile BMW'nin ABD'deki fabrikasında humanoid robotların aktif olarak çalıştığını konuştuk. Artık gerçek fabrikalarda gerçek robotlar görev alıyor ve bu durum Figure'ü humanoid robotlar alanında lider konuma getiriyor.

    Runway’in yeni video modeli Gen-4, tutarlı karakterler üretebilme kabiliyetiyle sinema ve kısa film üretiminde devrim yaratacak gibi görünüyor. Karakterlerin tutarlılığı sayesinde artık yapay zeka destekli kısa filmler üretmek mümkün hale geliyor.

    Bizi en çok etkileyen modellerden biri de Higgsfield AI oldu. Sinematik kamera açılarıyla etkileyici videolar üretebilen bu model, yapay zekadan ziyade profesyonel bir stüdyonun elinden çıkmış hissi veriyor. Kamera etrafında dönme, hızlı zoom gibi gelişmiş hareketleriyle sektörde yeni bir standart belirliyor.

    Luma AI’ın video üretim platformu Dream Machine’e eklenen “Camera Motion Concepts” özelliğiyle artık 20 farklı kamera hareketi prompt ile tanımlanabiliyor. Higgsfield AI ile benzerlik gösteren bu özellik, video üretiminde yaratıcı kontrolü artırıyor.

    OpenAI, teknoloji tarihinin en büyük yatırımlarından biri olan 40 milyar dolarlık fonlama aldı. Bu yatırımla birlikte GPT-5’in yolda olduğu ve GPT-4o’nun görsel üretim modelinin yeni versiyonunun da yakında tanıtılacağı konuşuluyor.

    Elon Musk ise Optimus robotunun yeni bir videosunu paylaştı. Boston Dynamics’in 30 yılda geldiği noktaya Optimus’un 3-4 yılda ulaşması, bu alandaki gelişmenin hızını gözler önüne serdi.

    Zapier’in duyurduğu MCP Server (Model Context Protocol) sayesinde yapay zekalar dış dünyaya bağlanabiliyor. Claude bu protokolü halihazırda destekliyor; yakında ChatGPT’ye de MCP desteği geldiğinde, e-postaları okuma, WhatsApp mesajlarına cevap verme gibi görevler doğrudan AI üzerinden gerçekleştirilebilecek.

    Midjourney V7’nin yayınlanmasıyla birlikte, özellikle insan ve doğa fotoğraflarındaki gerçekçilik seviyesi bir kez daha sınırları zorladı. Yapay zeka ile gerçek arasındaki farkı ayırt etmek artık neredeyse imkansız.

    Microsoft’un 50. yıl kutlamasında üç CEO – Bill Gates, Steve Ballmer ve Satya Nadella – Copilot ile sohbet etti. Copilot’ın mizahi yorumları izleyenleri güldürürken, teknolojinin geldiği noktayı da sergiledi.

    Son olarak, Meta’nın açık kaynak olarak yayınladığı LLaMA 4 modeli ile birlikte Meta AI deneyimi artık WhatsApp, Instagram ve Facebook gibi platformlardan erişilebilir hale geliyor. Henüz Türkiye’de aktif olmasa da bu özellikler sayesinde yapay zeka artık sosyal medya kullanıcılarının günlük hayatına doğrudan entegre olabilecek.

    続きを読む 一部表示
    19 分

Sıradaki Yapay Zeka Aracıに寄せられたリスナーの声

カスタマーレビュー:以下のタブを選択することで、他のサイトのレビューをご覧になれます。