Google’ın yeni yapay zeka modeli Gemini AI, kısa süre önce ChatGPT’ye bir alternatif olarak tanıtıldı. Google, GPT modellerine yanıt olarak geliştirdiği Gemini AI‘nin özellikle GPT-4’ü her alanda geçtiğini iddia etti ve çeşitli demo videoları paylaştı. Bu videolardan biri, Gemini’nin multimodal yeteneklerini sergileyen altı dakikalık bir gösteriydi. Ancak, bu videonun gerçek olmadığı, aslında “kurgulanmış” olduğu ortaya çıktı. Google, videoda gösterilen gecikme sürelerinin azaltıldığını ve çıktıların kısaltıldığını kabul etti. Bu durum, video altındaki açıklama kısmında belirtilmişti.
Really happy to see the interest around our “Hands-on with Gemini” video. In our developer blog yesterday, we broke down how Gemini was used to create it. https://t.co/50gjMkaVc0
We gave Gemini sequences of different modalities — image and text in this case — and had it respond… pic.twitter.com/Beba5M5dHP
— Oriol Vinyals (@OriolVinyalsML) December 7, 2023
Bu pratik, teknoloji şirketleri tarafından demo videolarında sıkça kullanılıyor. Google DeepMind‘daki bir yöneticinin açıklamasına göre, videodaki komutlar ve çıktılar gerçek, ancak kısa tutulmuş. Google, Gemini’nin çok modlu kullanıcı deneyimlerine dair bir fikir vermek ve geliştiricileri ilhamlandırmak için bu videoyu hazırlamış. Gemini, görüntü ve metinleri işleyerek yanıt veriyor ve Google, bu modelin yeteneklerini çeşitli zorluklarda test etmek için demoyu hazırladığını belirtiyor. Bu, Gemini’nin videoda gösterildiği gibi anlık tepkisellikle çalışmadığı anlamına geliyor.
Google, Gemini’yi en gelişmiş yapay zeka modeli olarak tanımlıyor ve bu modelin temel özelliği “multimodal” olması, yani farklı türdeki girdileri işleyebilmesi. ChatGPT ve benzerleri bu özelliği eklentiler aracılığıyla sunarken, Gemini bu özelliği temel bir yetenek olarak sunuyor. Gemini’nin gerçek potansiyelini anlamak için, Google’ın bir beta sürümü başlatması ve insanların gerçek dünya koşullarında bu modeli deneyimlemeleri faydalı olabilir.