Robotların Dili Olsaydı
'Yeni keşifleri tartışma alanı' oluşturuyorum.
Yeni ve heyecanlı bir süreç için iletişim kurabiliriz.Örneğin insanlarla konuşarak diyalog kurmalarını istiyoruz. Bunu yaparken de yüz ve bedenlerindeki jest ve mimikleri kullanmalarını hedefliyoruz. Robotlar ve üç boyutlu karakterler her ne kadar fiziksel olarak birbirlerinden farklı olsalar da kullandığımız yapay zeka algoritmaları birbirine çok benziyor.Duyguları olan metaverse alemlerinin sanal karakterleri ve sosyal robotlar geliyor. Bunlarla ilgili açıklamalar yazacağım. Takipte kalalım.
3D nesneler yaratan üretimsel yapay zeka modeli geliştiricisi Luma AI
Bilgisayarlı görü (computer vision) girişimi Luma AI, a16z'nin (Andreessen Horowitz) liderliği üstlendiği yatırım turunda 43 milyon dolar yatırım aldı. Tura Amplify, Matrix, Nvidia ve adı açıklanmayan birkaç melek yatırımcı da katıldı.
Luma, insanların akıllı telefon kameralarını kullanarak başka herhangi bir donanım olmadan nesnelerin 3D resimlerini oluşturmalarına olanak tanıyordu. Girişim şimdi bu konsepti geliştiriyor ve planının bir parçası olarak 3 binden fazla Nvidia A100 grafik işlem biriminden oluşan güçlü bir küme oluşturduğunu söylüyor. Kurucu ortak ve CTO Alex Yu, bu kümenin dünyayı görebilen ve anlayabilen, gösterebilen ve açıklayabilen ve nihayetinde dünyayla etkileşime girebilen yeni yapay zeka modellerini eğitmek için kullanılacağını söylüyor.
Optimus Gen2
Tesla, insansı Optimus robotunun önemli ölçüde yenilenen prototipini tanıttı. Hız, el becerisi ve dengede onu fütüristik işlevlere yaklaştıran büyük iyileştirmeler.
Optimus Gen-2, hareketliliği artırmak için 20 kilodan fazla kaybederken, yeni ayaklar ve yumuşak hareketlerle yürüme hızını %30 artırır.
Parmak sensörleri aynı zamanda hassas nesne manipülasyonuna da olanak tanıyor; Optimus demoda bir yumurtayı hassas bir şekilde işleyebiliyor.
Daha esnek bir boyun, entegre elektronikler ve dokunsal geri bildirime sahip daha hızlı eller gibi iyileştirmeler, insanın avantajlarını kopyalamayı amaçlıyor.
Aynı zamanda çoğu insandan daha iyi dans edebilir; gerçek zamanlı çekim boyunca gösterilen süper yumuşak hareketlerle.
Elon ve Co: Bu Optimus yükseltmesiyle gerçekten şaşırtıcı bir ilerleme kaydettik; insansı robotlar, daha önce yalnızca filmlerde hayal edilen çok modlu, hiper yetenekli robotlara adım adım yaklaşıyor.
OpenAI'ın yeni "AGI Robot"u.
OpenAI CEO'su Sam Altman, yapay zekanın bir gün dünyayı yeniden şekillendirecek ve bozacak kadar güçlü olacağı endişelerinin abartılı olduğunu söylüyor.
Altman, Bloomberg tarafından İsviçre'nin Davos kentindeki Dünya Ekonomik Forumu'nda düzenlenen bir konuşmada "Dünyayı hepimizin düşündüğünden çok daha az değiştirecek ve iş yerlerini hepimizin düşündüğünden daha az değiştirecektir" dedi.
Altman, özellikle yapay genel zekaya veya AGI'ye atıfta bulunuyordu. Bu terim insanlarla aynı seviyede ya da bir adım daha yukarıda görevleri tamamlayabilen bir AI biçimine atıfta bulunmak için kullanılır.
AGI'nin uygunca yakın bir gelecekte geliştirilebileceğini söyledi.
Şirketinin ChatGPT sohbet botunun 2022'nin sonlarında halka açık hale getirilmesinden sonra ana akıma girdiği Altman, AI şüphecilerinin teknolojinin toplumu ne derece ele geçireceği konusundaki endişelerini hafifletmeye çalıştı.
Mart ayında OpenAI'nin GPT-4 modelinin tanıtımından önce Altman, teknolojistleri potansiyelinden aşırı heyecanlanmamaları için uyardı ve insanların muhtemelen hayal kırıklığına uğrayacağını söyledi.
Altman, StrictlyVC ile Ocak ayında yaptığı bir röportajda "İnsanlar hayal kırıklığına uğramak için yalvarıyorlar ve olacaklar" dedi.
Gerçek bir yapay genel zekaya sahip değiliz ve bu bizden beklenen şey.
2015 yılında kurulan OpenAI'nin belirtilen misyonu AGI'ye ulaşmaktır.
Microsoft tarafından desteklenen ve özel pazar değerlendirmesi 100 milyar dolara yaklaşan şirket, teknolojinin güvenli bir şekilde tasarlanmasını istediğini söylüyor.
Altman, yapay zekâ'nın birçok ekonomistin korktuğu ölçekte işleri henüz değiştirmediğini söyledi ve teknolojinin zaten üretkenlik için inanılmaz bir araç haline geldiği bir noktaya ulaştığını ekledi.
Kobilerin İş Süreçlerindeki Yapay Zekalı Akıllı Dostu: Joule
ChatGPT’nin yaklaşık 1 yıl önce tüm dünyanın kullanımına açılmasıyla “yapay zeka devrimi”başladı. Ardından diğer teknoloji devleri kendi kurumsal kimliklerine, vizyonlarına ve pazar paylarına göre yeni nesil yapay zeka trendine ayak uydurdu. Büyük ölçekli firmaların yanısıra KOBİ’lere hitap eden Alman yazılım devi SAP’i ise, kararlı adımlarla bekleyerek geçtiğimiz günlerde yapay zekalı Joule asistanını duyurdu.
Joule iş dünyası için, ölçek farketmeksizin işletmeler için ne anlama gelecek? Joule, SAP’nin kurumsal bulut çözüm portföyünün tamamında yer alacak ve SAP’nin çözüm portföyünün yanısıra, üçüncü taraf kaynaklardan da proaktif ve bağlamsal içgörüler sağlayacak. Joule, birden fazla sistemde yer alan verileri hızlı bir şekilde sıralayarak ve bir bağlama oturtarak, daha akıllı içgörüler oluşturup insanların işlerini daha hızlı halletmesine, güvenli ve mevzuatla uyumlu bir şekilde daha iyi iş sonuçları elde etmesine olanak tanıyacak.
İnsan kaynaklarından finansa, tedarik zincirinden satın alma ve müşteri deneyimine kadar SAPuygulamaları ve SAP Business Technology Platform’un (SAP BTP) içine yerleştirilecek. Çalışanlar için akıllı bir iş arkadaşı gibi konumlanacak Joule, kullanıcıların öğrenmek veya çözümlemek istedikleri bir sorunu ifade etmek için sade bir dille sorular soracak. Ayrıca çözülmesi istenen bir sorunu tanımlayacak çalışanlar, SAP portföyü ve üçüncü taraf kaynaklardan alınan zengin iş verileri, metinler, görseller ve içgörülerden elde edilen akıllı yanıtlar alabilecek.
Örneğin bir üretici satış performansını daha iyi anlamak için Joule’den yardım istediğinde Joule,düşük performans gösteren bölgeleri belirleyecek. Üreticinin incelemesine yönelik potansiyel düzeltmeler sunmak için, diyelim ki bir tedarik zinciri sorununda, ortaya çıkan diğer veri kümelerine bağlantı verip otomatik olarak tedarik zinciri sistemine bağlanmanızı sağlayacak. Joule, tüm SAP çözümleri için sürekli olarak yeni senaryolar sunacak. Örneğin İK’da tarafsız iş tanımlarının yazılmasına ve amaca uygun mülakat soruları oluşturulmasına yardımcı olacak.
Bu dev yazılım şirketine göre küresel yapay zeka pazarı ve buna bağlı olarak organizasyonlarda şöyle değişimler olacak: “ABD merkezli pazar araştırma ve veri sağlayıcı şirketi IDC; yazılım, donanım ve hizmetler de dahil olmak üzere, küresel çapta yapay zeka pazarının 2022-2026 döneminde yüzde 18,6 yıllık bileşik büyümeyle 2026’da 900 milyar dolara ulaşacağını öngörüyor. Diğer yandan, IDC’nin SAP sponsorluğunda yürüttüğü bir diğer araştırma, 2025’e kadar dijital ekonomiyi önceliklendiren şirketlerin yüzde 80’inin çok işlevli yeteneklere ve kendi kendine öğrenme özelliklerine sahip gelişmiş kurumsal uygulamalara ihtiyaç duyacağını gösteriyor. Öğrenen sistemler dediğimizde, yolumuz yapay zekayla kesişiyor. “
Samsung'un Yeni Robotu Ballie:
Samsung Electronics, CES'te ev tipi robotunu duyurdu. Bowling topu büyüklüğünde ve önceki versiyonuna göre gelişmiş özelliklerle donatılmış. Ballie, bir seferde 2-3 saat dayanan bir pil ömrüne sahip. Mekansal lidar sensörü ile odaları dolaşabilir ve engellerden kaçınabilir.
🎥 İki lensli 1080p projektörü sayesinde, Ballie film izlemek, video görüşmeleri yapmak ve ikinci bir PC monitörü olarak kullanılabiliyor. Projeksiyon, duvar mesafesi ve aydınlatma koşullarına göre otomatik olarak ayarlanabiliyor.
📍 Kişilerin duruşunu ve yüz açılarını algılayarak projeksiyon açısını optimale ayarlayabiliyor. Ses komutları veya metin mesajları ile kontrol edilebiliyor.
💡 Akıllı ışıkları kontrol edebilen Ballie, dahili kızılötesi verici sayesinde klima ve eski TV'ler gibi 'akıllı olmayan' cihazlarla da etkileşim kurabiliyor.
🏡 Evdeki akıllı cihazların konumunu belirleyerek bir kat planı çıkarabilir ve bu sayede, yakındaki kişilere göre işlevlerini kişiselleştirebilir. Bitkileri sulama gibi ev işleri için otomatik hatırlatıcılar, uzaktan tıbbi hizmetlere erişim gibi diğer özellikleri de bulunuyor.
🔒 Ancak, bu kadar hayatı kolaylaştıran fonksiyonları olan bir robotun yaratabileceği gizlilik sorunları ve mahremiyet ile ilgili hassasiyetler beni düşündürüyor. Acaba bu teknolojik gelişmeler, kişisel verilerimizin güvenliği konusunda ne gibi riskler taşıyor?
🐕 Evde güzel bir arkadaş olabilir ama köpekler bu küçük robota fazla heyecanlanabilir .
İleti veya sesli olarak kullanılan Ballie, basit işleri yerine getirebiliyor. Ballie, sahip olduğu projeksiyon sayesinde akıllı cihazlardan video transferi sağlıyor. Videoyu yere, duvara veya farklı bir noktaya yansıtabiliyorsunuz. Bunun dışında kızılötesi sensörler robotun kumanda ile çalışan aygıtların denetilmesini sağlıyor. Örnek olarak Ballie’e seslenerek klimanın çalışmasını isteyebilirsiniz. Ballie’nin özellikleri sadece bunlarla sınırlı değil. Ballie’nin evde değilken ne yaptığını izleyebilirsiniz. Ballie’nin daha birçok avantajlı özelliği, tüketiciler için fazlasıyla cazip diyebiliriz.
Xreal Air 2 Ultra
Xreal Air 2 Ultra ile 3D filmler arasında gezinebiliyor, dijital nesnelerle oynayabiliyorsunuz. Aynı şekilde doğal el hareketlerini kullanarak sanal bir alanda odadaki akıllı cihazları kontrol edebiliyorsunuz. Hemen hemen her telefona, bilgisayara ve hatta oyun konsoluna takılabilen Xreal Air 2 Ultra, 120 inçlik özel bir ekrana sahip. Cihazın fiyatlandırması henüz açıklanmamış olsa da; cihazı Apple Vision Pro'nun uygun fiyatlı bir alternatifi olarak konumlanacağını düşünmek mümkün.
Rabbit R-1
Tüketici teknolojisi odaklı yapay zeka girişimi Rabbit, 10 milyon dolar yatırım aldığını sizlere aktarmıştık. Sizin yerinize çeşitli görevleri yerine getirebilen Rabbit R1, sizin adınıza uygulamaları kullanmayı öğreniyor. Böylece sesli komutlarla yönetebildiğiniz cihaz, telefonunuzdaki uygulamaları sizin yerinize yönetiyor. Cihazların ilk partisi tükendi ancak ikinci parti için ön siparişte bulunabiliyorsunuz. 199 dolardan satışa sunulan Rabbit R1'ın herhangi bir abonelik ücreti bulunmuyor. Cihazın Mart ayının ortalarında kullanıcılarla buluşması bekleniyor.
Google’ın yeni video yapay zeka aracı: Lumiere
Google, basit metinlerle beş saniyelik gerçekçi videolar oluşturabilen yapay zekâ modeli Lumiere’i tanıttı. Yeni YZ destekli video oluşturucu şirketin şimdiye kadar geliştirdiği en iyi ürünlerden biri ancak bu durum daha inandırıcı deepfake'lerin artmasına yol açabilir.
Lumiere'i bu kadar gelişmiş yapan şey, videoyu bir seferde üretebilen mimarisi. Önceki YZ modelleri videoları kare kare oluşturuyordu. Lumiere teorik olarak teknik uzmanlığa gerek olmadan video oluşturmayı ve düzenlemeyi kolaylaştıracak.
Gördüğümüz kadarıyla ‘evde ukulele çalan panda’ veya ‘plajda hızlandırılmış gün batımı’ gibi istemlerle ayrıntılı fotogerçekçi videolar yaratabiliyor.
İşin en can alıcı noktası ise düzenleme yetenekleri... Lumiere bir görüntünün hedeflenen kısımlarını canlandırabiliyor ve görüntü istemlerindeki alanları ‘video inpainting’ ile doldurabiliyor. Örneğin bir kadının elbisesini değiştirmek gibi metin istemleriyle videonun belirli bölümlerini düzenleyebiliyor.
Yapılan açıklamada, “Öncelikli hedefimiz acemi kullanıcıların görsel içerik oluşturmasını sağlamak. Bununla birlikte, teknolojimizle sahte veya zararlı içerik oluşturmak için kötüye kullanım riski var ve güvenli bir kullanım sağlamak için kötü niyetli kullanımı tespit etmek üzere araçlar geliştirmenin çok önemli olduğuna inanıyoruz” deniliyor. Bahsedilmeyen şey ise Google'ın hâlihazırda geliştirdiği ve uygulamaya koyduğu söylenen araçlar.
Geçtiğimiz Mayıs ayında Google I/O'da şirket güvenlik ve sorumluluk önlemlerini ön plana çıkardı. Google DeepMind, Ağustos ayında SynthID adlı bir yapay zekâ filigran aracının beta sürümünü piyasaya sürdü. Kasım ayında YouTube, kullanıcıları videoların yapay zekâ tarafından üretilip üretilmediğini açıklamayı zorunlu kılan bir politika duyurdu.
Bu noktada Lumiere sadece bir araştırma ve tüketiciye yönelik bir araç olarak nasıl ya da ne zaman kullanılabileceğinden bahsedilmiyor. Ancak ‘yapay zekâ konusunda cesur olmak en başından itibaren sorumlu olmak demektir’ diyen bir şirket için (başlangıcın araştırmayı da içerdiğini varsayarsak) bu durum Lumiere ekibinin şaşırtıcı bir ihmali gibi görünüyor.Bakınız.
Google’ın yeni nesil yapay zeka modeli Lumiere , nesnelerin bir videoda nerede olduğunu (uzay) ve aynı anda nasıl hareket edip değiştiklerini (zaman) çözen Space-Time-U-Net veya STUNet adı verilen yeni bir yayılma modelini kullanıyor . Ars Technica,bu yöntemin Lumiere’in daha küçük sabit kareleri bir araya getirmek yerine videoyu tek bir süreçte oluşturmasına olanak tanıdığını bildirdi.
Lumiere, istemden bir temel çerçeve oluşturmakla başlar. Daha sonra STUNet çerçevesini kullanarak, birbirine akan daha fazla kare oluşturmak ve kesintisiz hareket görünümü yaratmak amacıyla o çerçeve içindeki nesnelerin nereye hareket edeceğini tahmin etmeye başlar. Lumiere ayrıca Stable Video Diffusion’daki 25 kareye kıyasla 80 kare üretiyor.
Yayınlanan video, Google’ın video oluşturma ve düzenleme araçlarının sadece birkaç dakika içinde bomboş bir ekrandan gerçekçi videolar oluşturabildiğini gösteriyor. Ayrıca Google; Runway, Stable Video Diffusion veya Meta’s Emu gibi rakiplerin halihazırda işgal ettiği alanlarda da söz sahibi olabilecek gibi duruyor . Kitlesel pazara sunulan ilk metinden videoya platformlardan biri olan Runway, geçen yıl Mart ayında Runway Gen-2’yi piyasaya sürdü ve daha gerçekçi görünümlü videolar sunmaya başladı. Bakınız.
Runway-Google Lumiere Kıyaslaması ve Genel Performans
Google, Lumiere sitesine klipler ve istemler koydu, bir websitesi ise benzer özellikleri bulunan başka bir yaratıcı yapay zeka modeli ola Runaway’den aynı istemlerde bulunarak sonuçları Google Lumiere ile kıyasladı.