OpenCV founders launch AI video startup to take on OpenAI and Google

OpenCV Kurucularından CraftStory: Yapay Zeka Video Üretiminde Sora ve Veo’ya Rakip OpenCV Kurucuları, CraftStory ile Uzun Süreli Yapay Zeka Video Üretiminde...

OpenCV Kurucularından CraftStory: Yapay Zeka Video Üretiminde Sora ve Veo’ya Rakip

OpenCV Kurucuları, CraftStory ile Uzun Süreli Yapay Zeka Video Üretiminde Sora ve Veo’ya Meydan Okuyor

OpenCV’nin kurucuları, CraftStory adlı yeni girişimleriyle OpenAI ve Google’a rakip olacak şekilde beş dakikaya kadar insan odaklı yapay zeka videoları üretebiliyor.

Önemli Noktalar

  • CraftStory, rakiplerinden farklı olarak 5 dakikaya kadar kesintisiz ve tutarlı yapay zeka videoları üretiyor.
  • Model 2.0, paralel difüzyon mimarisiyle video üretim süresini ve kalitesini artırıyor.
  • OpenCV kurucularının liderliğinde geliştirilen CraftStory, B2B odaklı uzun ve kaliteli eğitim ile ürün tanıtım videoları sunmayı hedefliyor.

Teknik Detaylar

CraftStory, OpenCV’nin kurucuları tarafından geliştirilen ve insan merkezli videolar üretmeye odaklanan yeni bir yapay zeka girişimi olarak öne çıkıyor. Şirketin Model 2.0 adlı sistemi, uzun metrajlı ve tutarlı video üretimi konusunda mevcut rakiplerinden (OpenAI’nın Sora ve Google’ın Veo modelleri dahil) önemli bir sıçrama sunuyor.

Rakip modeller genellikle 10 ila 25 saniyelik kısa video klipler üretebilirken, CraftStory’nin teknolojisi 5 dakikaya kadar sürekli ve uyumlu video performansları ortaya koyabiliyor. Bu, özellikle eğitim, pazarlama ve müşteri bilgilendirme alanlarında kısa yapay zeka videolarının yetersiz kaldığı noktalarda büyük bir ticari değer yaratma potansiyeli taşıyor.

Paralel Difüzyon Mimarisi ile Uzun Video Üretimi

CraftStory’nin başarısının temelinde paralel difüzyon mimarisi yatıyor. Geleneksel modeller, videoyu zaman ekseninde bir bütün olarak işleyip daha uzun videolar için daha büyük ağlar ve yüksek hesaplama gücü gerektirirken, CraftStory aynı anda birden fazla küçük difüzyon algoritmasını tüm video boyunca çalıştırıyor. Bu sayede, videonun sonundaki unsurlar başına etkide bulunabiliyor ve bir bölümdeki hata diğerine taşınmıyor.

Şirket, modelini internetten alınan veri yerine, profesyonel stüdyolarda yüksek kare hızıyla çekilmiş özel görüntülerle eğitti. Bu yaklaşım, özellikle hızlı hareketlerde detay kaybını önleyerek yüksek kalite sağlıyor.

Kullanım Süreci ve Özellikler

Model 2.0 şu anda video-to-video sistemi olarak çalışıyor. Kullanıcılar, animasyon yapmak istedikleri bir sabit görüntü ve bir kişinin hareketlerini içeren “driving video”yu yüklüyor. CraftStory, profesyonel oyuncularla kaydedilmiş hazır driving videoları sunuyor; oyuncular, hareket verileri kullanıldıkça gelir payı alıyor. Ayrıca kullanıcılar kendi görüntülerini de yükleyebiliyor.

Sistem, yaklaşık 15 dakikada düşük çözünürlüklü 30 saniyelik klipler üretebiliyor. Gelişmiş dudak senkronizasyonu ve jest uyum algoritmaları, konuşma ve duygusal tonun vücut diliyle uyumunu sağlıyor.

Finansman ve Rekabetçi Konum

CraftStory, Andrew Filev’in $2 milyonluk yatırımıyla hayata geçti. Filev, Wrike yazılım şirketini Citrix’e $2.25 milyara sattıktan sonra Zencoder AI şirketini yönetiyor. OpenAI gibi rakipler ise milyarlarca dolar fon topluyor (örneğin OpenAI son turda $6 milyar üzerinde yatırım aldı).

CraftStory ekibi, büyük sermayenin başarı için tek yol olmadığını savunuyor ve odaklanmış bir stratejiyle insan merkezli uzun video segmentlerine yoğunlaşıyor.

Bilgisayarlı Görü ve Uzmanlık Farkı

CraftStory’nin kurucusu Victor Erukhimov, bilgisayarlı görme alanındaki derin tecrübesi ile öne çıkıyor. Erukhimov, OpenCV’nin ilk geliştiricilerinden biri ve Intel’in desteğini çekmesinin ardından OpenCV’yi büyütmeye ve otomotiv güvenlik sistemlerine yönlendiren Itseez şirketini kurmuştu.

Filev, Erukhimov’un hareket, yüz dinamikleri ve zamansal tutarlılık konularındaki uzmanlığının, CraftStory’nin video üretim kalitesine doğrudan katkı sağladığını belirtiyor.

Kurumsal Odak: Eğitim ve Ürün Tanıtım Videoları

CraftStory, özellikle B2B pazara odaklanıyor; yazılım ve ürün şirketlerinin dakikalarca süren, tutarlı ve kaliteli eğitim videoları üretmesini hedefliyor. Kısa yapay zeka klipleri, karmaşık ürün özelliklerini anlatmakta yetersiz kalırken, CraftStory ile 5 dakikaya kadar yüksek kaliteli videolar üretilebiliyor.

Filev’e göre, küçük işletmelerin daha önce $20,000 ve iki ayda üretebildiği içerikler, dakikalar içinde ve çok daha düşük maliyetle hazırlanabilecek.

CraftStory ayrıca reklam ajanslarına da hızlı ve uygun maliyetli video üretimi imkanı sunuyor. Ajanslar, bir oyuncu ile kamera karşısında tek çekim yapıp, bu görüntüyü AI ile işleyerek final videoya dönüştürebiliyor.

Şirketin yol haritasında bir sonraki adım, doğrudan metinlerden uzun video üretebilen bir text-to-video modeli ve hareketli kamera senaryoları (örneğin “walk-and-talk” reklam formatları) desteği geliştirmek.

Pazar ve Rakipler

CraftStory, hızla büyüyen ve rekabetin yoğun olduğu bir pazara giriş yapıyor. OpenAI’nın Sora 2 modeli henüz genel kullanıma açılmasa da büyük ilgi görüyor; Google’ın Veo modeli ve Runway, Pika, Stability AI gibi rakipler farklı yeteneklerle video üretimi sunuyor.

Erukhimov, CraftStory’nin insan merkezli uzun videolara odaklanarak pazarda farklı bir niş hedeflediğini vurguluyor. Filev ise büyük şirketlerin genel amaçlı API sağlayıcıları olacağını, CraftStory gibi uzman oyuncuların ise belirli formatlarda üretim stüdyosu rolü üstleneceğini öne sürüyor.

Model 2.0 şu anda app.craftstory.com/model-2.0 adresinde erken erişime açılmış durumda. Sınırlı fon ile büyük rakiplerle rekabet edip edemeyeceği belirsiz olsa da, CraftStory ekibi yapay zeka video üretiminin şirketlerin hikaye anlatımında yakında ana araç olacağına inanıyor.

Kaynak: venturebeat.com

Leave a Reply

Your email address will not be published. Required fields are marked *

Leave a comment
scroll to top