Bu sayfa, OpenAI tarafından piyasaya sürülen ChatGPT’nin, yapay zeka alanında rekabeti bir üst seviyeye taşıdığından bahsetmektedir. Google, vizyon-dil-eylem (VLA) modeli olan Robotics Transformer 2 (RT-2) teknolojisi ile eğitildiğini duyurmuştur. Bu teknoloji, robotların çevrelerindeki olayları algılamasına ve görevleri daha hızlı ve verimli bir şekilde yerine getirmesine olanak sağlamaktadır.
Google, RT-2’nin yapay zeka sohbet botları Bard, ChatGPT ve Claude 2’ye güç veren büyük dil modellerine dayandığını açıklamıştır. Vincent Vanhoucke, Google DeepMind’ın robotik başkanı, RT-2’nin temelinde Google Bard gibi büyük dil modelleri kullanıldığını ve robot eylemlerinin çıktılarını doğrudan alabilmek için internet üzerindeki metin ve görüntü verilerinin işlendiğini belirtmiştir.
Meta’nın yapay zeka modeli Llama 2 artık ücretsiz olarak kullanılabilmektedir. Poe isimli bir araç ile Meta’nın dilini test etmek mümkündür. Ancak Vanhoucke, yapay zeka kullanarak robotların çevrelerindeki dünyayı anlamak ve algılamak için sohbet robotlarından daha karmaşık bir yapıya sahip olduğunu ifade etmiştir. Sohbet yazılımları belirli bir konu hakkında metinleri özümsemeli ve insanlar için anlaşılır bir şekilde düzenlemelidirken, robotların gerçek anlamda çevrelerini algılayıp anlamaları gerekmektedir.
Google, çevrimiçi bulunan görüntü verilerini kullanarak RT-2 ile robotların çöp gibi nesneleri hızlı bir şekilde tanıyıp alıp atabileceğini iddia etmektedir. Endüstriyel robot endüstrisinin değeri şu anda 30 milyar dolar olup 2030’a kadar 60 milyar dolara ulaşması beklenmektedir (Grand View Research verilerine göre). Bu teknoloji, endüstriyel robotların daha akıllı ve etkili bir şekilde kullanılmasına katkı sağlamaktadır.