Meta, Emu adındaki görüntü oluşturma aracının bir evrimi olan Emu Video’yu tanıttı ve bu, teknoloji devinin AI üretimi filmlere doğru ilerlediğini gösteriyor olabilir. Emu Video, bir başlık resmi veya açıklamalı bir fotoğrafa dayanarak dört saniyelik animasyonlu klipler oluşturmak için tasarlandı.
Yeni ortaya çıkan Emu Edit, kullanıcılara oluşturulan klipleri düzenlemek için bir AI modeli sunarak Emu Video’yu tamamlıyor. Kullanıcılar, istedikleri düzenlemeleri doğal dil kullanarak belirtebilir ve Emu Edit bu değişiklikleri uygulayarak, AI üretilen içerikleri keşfedenler için sorunsuz ve kullanıcı dostu bir düzenleme deneyimi sağlar.
Meta’nın Emu Video’su
Meta’nın üretken AI alanındaki girişimi, kısa bir süre içinde görüntü oluşturmaktan video oluşturmaya hızlı bir evrim geçirdi.
Meta Connect’te yapılan duyuruda, şirketin temel modeli olarak Emu, Instagram için AI görüntü düzenleme araçları ve Meta AI içindeki Imagine özelliği de dahil olmak üzere çeşitli üretken AI deneyimlerinde rol oynuyor.

Emu Video, Emu modelini kullanıyor ve yayılım modellerine dayalı bir metinden-videoya üretim yaklaşımına dayanıyor. Bu birleşik mimari, yalnızca metin, yalnızca görüntü ve metin ile görüntünün bir kombinasyonu dahil olmak üzere çeşitli girdilere yanıt veriyor.
Süreç iki adıma bölünmüştür: metin istemine dayalı görüntüler oluşturmak ve ardından hem metin hem de oluşturulan görüntüye dayalı videolar oluşturmak. Bu “faktörleşmiş” veya bölünmüş yaklaşım, video üretim modellerinin eğitim verimliliğini artırıyor.
Önceki modeller karmaşık kaskadlar gerektirirken, Meta’nın yaklaşımı saniyede 16 kare ile 512×512 dört saniyelik videolar üretmek için yalnızca iki yayılım modeli kullanıyor.
İnsan değerlendirmeleri, Meta’nın video üretimlerine güçlü bir tercih gösteriyor ve kullanıcılar, bu modeli kalitesi ve metin istemine sadakati nedeniyle önceki çalışmalara göre tercih ediyor, teknoloji devinin iddiasına göre.
Emu Edit
Ayrıca, Meta, görüntü manipülasyon görevlerini basitleştiren yeni bir yaklaşım olan Emu Edit’i tanıttı ve görüntü düzenlemeye gelişmiş yetenekler ve hassasiyet sağladı. Emu Edit, yerel ve genel düzenleme, arka plan kaldırma ve ekleme, renk ve geometri dönüşümleri ve daha fazlası gibi görevleri kapsayan serbest formda düzenleme sunuyor.
Özellikle, Emu Edit, talimatlarla ilgili olmayan piksellerin dokunulmamış kalmasını sağlayarak hassas değişikliklere odaklanıyor.
Meta’nın Emu Edit’i, 10 milyon sentezlenmiş örnek içeren bir veri tabanı üzerine kurulmuş ve bu türünün en büyük veri tabanlarından biri olarak kabul ediliyor. Model, çeşitli görüntü düzenleme görevleri için hem niteliksel hem de niceliksel değerlendirmelerde mevcut yöntemlere göre üstün performans sergiliyor, Meta’ya göre.
Meta, mevcut çalışmanın temel bir araştırma olduğunu vurgularken, kullanım durumlarının çeşitliliği büyük. Emu Video ve Emu Edit gibi teknolojiler, kullanıcılara animasyonlu çıkartmalar, GIF’ler üretme veya sosyal medya içeriklerini geliştirme olanağı sunabilir ve bunu yaparken gelişmiş teknik becerilere ihtiyaç duymaz.
“Profesyonel sanatçılar ve animatörler için kesinlikle bir yerine geçmez, ancak Emu Video, Emu Edit ve onlar gibi yeni teknolojiler, bir sanat yönetmeninin yeni bir konsept üzerinde fikir yürütmesinden, bir yaratıcının en son makarasını canlandırmasına, en iyi arkadaşın benzersiz bir doğum günü selamını paylaşmasına kadar insanların kendilerini yeni yollarla ifade etmelerine yardımcı olabilir. Ve bizce bu kutlanmaya değer,” dedi Meta bir açıklamada.
En Son 18 Kasım 2023 01:09 tarihinde Emrah Aladağ Yazarı Tarafından Güncellendi.