작년에 Nano Banana는 Gemini의 지능을 이미지 생성 및 편집에 가져왔습니다. 그 이후로 수백만 명의 사람들이 오래된 사진을 복원하고, 스케치에서 디자인하고, 이전에는 불가능했던 방식으로 아이디어를 시각화하는 데 도움이 되었습니다. 처음부터 우리는 Gemini를 바닥부터 기본적으로 멀티모달이 되도록 구축했으며, 이제 우리는 다음 단계를 진행하고 있습니다.
우리는 Gemini의 추론 능력이 창작 능력을 만나는 Gemini Omni를 소개합니다. Omni는 모든 입력에서 비디오부터 시작하여 무엇이든 만들 수 있는 우리의 새로운 모델입니다. Omni를 사용하면 이미지, 오디오, 비디오 및 텍스트를 입력으로 결합하고 Gemini의 실제 세계 지식에 기반한 고품질 비디오를 생성할 수 있습니다. 또한 대화를 통해 비디오를 쉽게 편집할 수 있습니다.
오늘 우리는 Omni 가족의 첫 번째 모델인 Gemini Omni Flash를 Gemini 앱, Google Flow 및 YouTube Shorts에 출시합니다. 시간이 지남에 따라 이미지 및 오디오와 같은 출력 모달리티를 지원할 것입니다. Omni를 특별하게 만드는 것들은 다음과 같습니다:
대화를 통해 비디오 편집하기
Gemini Omni는 자연어로 비디오를 편집하는 더 쉬운 방법을 제공합니다. 모든 지시는 이전 지시를 기반으로 합니다. 캐릭터는 일관성을 유지하고, 물리 법칙은 유지되며, 장면은 이전에 무엇이 있었는지 기억합니다.
주변 세계를 변형하세요. 특정 항목을 변경하거나 모든 것을 변경하세요. 당신의 비디오는 당신이 직접 촬영할 수 없었던 것의 시작점이 됩니다.