AI·News
뒤로

Gemini Omni 소개

Introducing Gemini Omni

작년에 Nano Banana는 Gemini의 지능을 이미지 생성 및 편집에 가져왔습니다. 그 이후로 수백만 명의 사람들이 오래된 사진을 복원하고, 스케치에서 디자인하고, 이전에는 불가능했던 방식으로 아이디어를 시각화하는 데 도움이 되었습니다. 처음부터 우리는 Gemini를 바닥부터 기본적으로 멀티모달이 되도록 구축했으며, 이제 우리는 다음 단계를 진행하고 있습니다.

우리는 Gemini의 추론 능력이 창작 능력을 만나는 Gemini Omni를 소개합니다. Omni는 모든 입력에서 비디오부터 시작하여 무엇이든 만들 수 있는 우리의 새로운 모델입니다. Omni를 사용하면 이미지, 오디오, 비디오 및 텍스트를 입력으로 결합하고 Gemini의 실제 세계 지식에 기반한 고품질 비디오를 생성할 수 있습니다. 또한 대화를 통해 비디오를 쉽게 편집할 수 있습니다.

오늘 우리는 Omni 가족의 첫 번째 모델인 Gemini Omni Flash를 Gemini 앱, Google Flow 및 YouTube Shorts에 출시합니다. 시간이 지남에 따라 이미지 및 오디오와 같은 출력 모달리티를 지원할 것입니다. Omni를 특별하게 만드는 것들은 다음과 같습니다:

대화를 통해 비디오 편집하기

Gemini Omni는 자연어로 비디오를 편집하는 더 쉬운 방법을 제공합니다. 모든 지시는 이전 지시를 기반으로 합니다. 캐릭터는 일관성을 유지하고, 물리 법칙은 유지되며, 장면은 이전에 무엇이 있었는지 기억합니다.

주변 세계를 변형하세요. 특정 항목을 변경하거나 모든 것을 변경하세요. 당신의 비디오는 당신이 직접 촬영할 수 없었던 것의 시작점이 됩니다.

Last year, Nano Banana brought Gemini's intelligence to image generation and editing. Since then, it’s helped millions of people restore old photos, design from sketches and visualize ideas in ways that weren’t possible before. From the start we built Gemini to be natively multimodal from the ground up, and now we’re taking the next step.

We’re introducing Gemini Omni, where Gemini’s ability to reason meets the ability to create. Omni is our new model that can create anything from any input — starting with video. With Omni, you can combine images, audio, video and text as input and generate high-quality videos grounded in Gemini's real-world knowledge. You can also easily edit your videos through conversation.

Today, we’re rolling out the first model in the Omni family: Gemini Omni Flash, to the Gemini app, Google Flow and YouTube Shorts. In time we will support output modalities like image and audio. Here’s some of what makes Omni special:

Edit your videos through conversation

Gemini Omni gives you an easier way to edit video — with natural language. Every instruction builds on the last. Your characters stay consistent, the physics hold up and the scene remembers what came before.

Transform the world around you. Change specific things, or change everything. Your video becomes the starting point for something you never could have filmed yourself.

원문 보기 https://deepmind.google/blog/introducing-gemini-omni