본문 바로가기
스타트업정보

[스타트업 정보] 중국의 생성적인 비디오 경쟁이 가열되고 있습니다

by 창업스타트업도우미 2024. 2. 6.

[스타트업 정보]  중국의 생성적인 비디오 경쟁이 가열되고 있습니다

 

월요일, 비디오 게임 제국과 채팅 앱 위챗으로 유명한 중국의 인터넷 대기업 텐센트는 깃허브에 자사의 오픈 소스 비디오 생성 모델인 다이나믹 크래프터의 새로운 버전을 공개했습니다. 이는 중국의 몇몇 거대 기술 회사들이 텍스트와 이미지 간 비디오 공간을 축소하기 위해 조용히 노력을 늘려왔다는 것을 상기시켜줍니다.

시중에 나와 있는 다른 생성 비디오 도구들처럼 DynamiCrafter는 확산 방법을 사용하여 캡션과 정지 영상을 몇 초 길이의 비디오로 바꿉니다. 기계 학습에서 확산 모델은 물리학의 자연 현상에서 영감을 받아 단순한 데이터를 더 복잡하고 사실적인 데이터로 변환시킬 수 있는데, 이는 입자가 고농도의 한 영역에서 저농도의 다른 영역으로 이동하는 방법과 유사합니다.

DynamiCrafter 2세대는 640×1024의 픽셀 해상도로 비디오를 생산하고 있는데, 이는 320×512개의 비디오를 특징으로 했던 지난 10월의 초기 출시보다 한 단계 업그레이드된 것입니다. DynamiCrafter의 뒤에 있는 연구팀이 발표한 학술 논문은 그것의 기술이 "더 일반적인 시각적 컨텐츠"에 이미지 애니메이션 기술의 적용 가능성을 넓힌다는 점에서 경쟁사들과 다르다고 지적했습니다

"주요 아이디어는 이미지를 생성 프로세스에 통합하여 텍스트에서 비디오로의 확산 모델의 모션 사전을 지침으로 활용하는 것입니다."라고 논문은 말합니다. 이에 비해 "전통적" 기술은 "주로 확률적 역학(예: 구름 및 유체) 또는 도메인별 모션(예: 사람의 머리카락 또는 신체 모션)으로 자연 장면을 애니메이션화하는 데 중점을 둡니다."

DynamiCrafter, Stable Video Diffusion(11월 출시)과 최근 하이프업된 Pika Labs를 비교한 데모(아래 참조)에서 텐센트 모델의 결과는 다른 모델보다 약간 더 애니메이션적으로 나타납니다. 선택된 샘플은 필연적으로 DynamiCrafter를 선호할 것이며, 제 초기 몇 번의 시도 후에 어떤 모델도 AI가 곧 본격적인 영화를 제작할 수 있을 것이라는 인상을 남기지 않습니다.

그럼에도 불구하고, 생성 비디오는 생성 텍스트 및 이미지 붐에 이어 AI 경쟁의 다음 초점으로 큰 기대를 받아왔습니다. 따라서 스타트업 및 기술 현직자들이 이 분야에 자원을 쏟아붓고 있을 것으로 예상됩니다. 중국에서도 예외는 아닙니다. 텐센트 외에도 틱톡의 모회사인 바이트댄스, 바이두 및 알리바바는 각각 비디오 확산 모델을 발표했습니다.

ByteDance의 MagicVideo와 Baidu의 UniVG 모두 GitHub에 데모를 게시했지만 둘 다 아직 대중에게 공개되지 않은 것으로 보입니다. Tencent와 마찬가지로 알리바바는 비디오 생성 모델 VGen을 오픈 소스로 만들었는데, 이 전략은 글로벌 개발자 커뮤니티에 도달하기를 희망하는 중국 기술 회사들 사이에서 점점 더 인기를 얻고 있습니다.
 
출처 : 테크크런치