오픈AI의 동영상 생성 인공지능 모델 ‘소라’는 최근 정식으로 출시되었으며, 다음과 같은 주요 특징과 기능들을 가지고 있습니다.
출시 및 가용성
- ‘소라’는 2024년 12월 9일(현지시간) 공식적으로 출시되었으며, 대부분의 국가에서 사용할 수 있습니다. 그러나 유럽, 영국, 및 유럽경제지역(EEA)은 현재 출시가 제외되어 있으며, 이들 지역에서의 정식 출시 일정은 미정입니다.
기능과 사용법
- ‘소라’는 이용자가 텍스트, 이미지, 또는 동영상 등을 입력하면 해당하는 동영상을 생성해주는 AI 모델입니다. 생성되는 동영상의 길이는 최대 20초까지 가능합니다.
- 사용자는 프롬프트(명령어)를 입력하여 원하는 장면을 만들 수 있으며, 기존 동영상을 확장하거나 빠진 프레임을 채우는 ‘스토리보드’ 기능도 제공됩니다.
기술과 성능
- ‘소라’는 ‘확산 트랜스포머(Diffusion Transformer)’ 아키텍처를 사용하며, ‘달리 3’의 캡션 기술로 데이터를 라벨링하여 정확도를 높였습니다. 이 모델은 인터넷 규모의 데이터를 학습하여 개발되었습니다.
- 생성된 동영상은 최대 1080p 해상도까지 지원되며, 영상 생성에는 약 1분 정도의 시간이 걸립니다.
이용 제한과 크레딧 시스템
- ‘소라’는 현재 챗GPT의 유료 이용자들, 즉 ‘챗GPT 플러스’와 ‘챗GPT 프로’ 구독자들에게 추가 비용 없이 제공됩니다.
- ‘챗GPT 플러스’ 이용자들은 매월 50개의 480p 또는 그 이하 해상도의 동영상을 생성할 수 있습니다.
- ‘챗GPT 프로’ 이용자들은 매월 500개의 최대 1080p 해상도의 동영상을 생성할 수 있습니다.
안전 정책
- 오픈AI는 ‘소라’에 엄격한 안전 정책을 적용했습니다. 미성년자 관련 콘텐츠, 성적인 콘텐츠, 딥페이크, 아티스트 스타일 복제 등이 금지되며, 외부 레드팀과 협력하여 위험성을 테스트했습니다. 특히, 에로틱한 영상이나 NSFW(Not Safe for Work) 콘텐츠 생성도 금지되었습니다.
추가 기능
- ‘소라’는 다양한 편집 기능을 제공합니다, 예를 들어, 생성한 영상을 자르는 ‘리컷(recut)’, 수정하는 ‘리믹스(remix)’, 다른 영상과 섞는 ‘블렌드(blend)’, 일정 구간을 반복하는 ‘루프(loop)’ 등이 포함됩니다.
이 새로운 기술은 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있는 능력으로 인해 예술가들로부터 일자리 위협을 받을 가능성이 있으며, 구글, 메타 등 경쟁자들에게도 영향을 미칠 것으로 예상됩니다.