상위 질문
타임라인
채팅
관점

제미나이 (언어 모델)

구글 딥마인드에서 개발한 대형 언어 모델 제품군 위키백과, 무료 백과사전

Remove ads

제미나이(영어: Gemini)는 구글 딥마인드에서 개발한 멀티모달 대규모 언어 모델 제품군이다. 텍스트, 코드, 이미지, 오디오, 비디오 등 다양한 유형의 정보를 통합적으로 처리하고 추론하도록 설계되었다.[1]

간략 정보 개발자, 발표일 ...
Remove ads

역사

초기 출시 및 전환 (2023-2024)

제미나이는 2023년 5월 10일 구글 I/O에서 처음 발표되었으며, 같은 해 12월 6일 Gemini 1.0이 공식 출시되었다. 1.0 제품군은 고성능 작업을 위한 울트라, 범용성을 갖춘 프로 온디바이스용 나노로 구성되었다. 특히 울트라 모델은 대규모 다중작업 언어 이해 벤치마크에서 90.0%의 점수를 기록하며, 인간 전문가(89.8%)의 성능을 넘어선 최초의 모델이 되었다.[2]

2024년 2월, 구글은 자사의 대화형 AI 서비스인 바드를 제미나이로 리브랜딩하고, Gemini Pro 모델을 탑재하여 서비스를 통합했다. 동시에, Mixture-of-Experts 아키텍처를 기반으로 한 Gemini 1.5 Pro를 발표했다. 이 모델은 최대 100만 토큰의 컨텍스트 창을 지원하여 기존 모델의 처리 용량을 크게 뛰어넘는 성능을 보였다.[3]

성능 고도화 (2025)

2025년 2월 5일, Gemini 2.0이 공개되었으며, 이는 기존 모델의 성능을 개선한 마이너 업데이트였다. 이어서 3월 26일, Gemini 2.5 제품군이 발표되며 성능이 한 단계 더 도약했다. 2.5 제품군은 추론 능력을 극대화한 2.5 Pro, 속도와 효율성에 중점을 둔 2.5 Flash, 그리고 이미지 생성에 특화된 2.5 Flash Image (NanoBanana)로 구성되어 다양한 요구사항에 대응할 수 있도록 설계되었다.[4]

Remove ads

주요 모델 및 기술적 특징

Gemini 2.5 Flash

기본 모델인 제미나이 2.5 플래쉬(Gemini 2.5 Flash)는 2.5 Pro의 핵심 아키텍처를 유지하면서도 속도와 비용 효율성을 극대화한 경량 모델이다. 낮은 지연 시간이 요구되는 실시간 대화형 애플리케이션이나 대규모 데이터 요약과 같은 작업에 적합하다. 멀티모달 기능을 지원하여 텍스트, 이미지, 오디오를 통합적으로 처리할 수 있다.

Gemini 2.5 Pro

상위 모델인 제미나이 2.5 프로(Gemini 2.5 Pro)는 복잡한 추론과 문제 해결에 최적화되어 있다. 특히 코딩, 수학, 과학 분야에서 강점을 보이며, 컨텍스트 창은 최대 200만 토큰까지 확장되어 방대한 양의 정보를 한 번에 처리하고 분석할 수 있다.[5] 이를 통해 단일 프롬프트 내에서 전체 코드베이스를 분석하거나 여러 장문의 문서를 비교·분석하는 등 고도의 작업이 가능하다.

이미지 생성 (나노바나나)

코드명 나노바나나(NanoBanana)로 알려진 이 모델은 이미지 생성 및 편집에 특화되어 있다. 나노바나나는 Gemini 2.5 Flash 모델에 기본으로 내장되어 있으며 사용자의 자연어 요청으로 정밀한 편집을 지원한다. 음란물 등의 생성은 금지하며, AI 생성 이미지에는 워터마크메타데이터 식별자를 삽입한다.[6] 주요 기술적 특징은 다음과 같다.

  • 캐릭터 일관성: 여러 이미지에 걸쳐 동일한 인물이나 객체의 외형적 특징을 일관되게 유지하는 기능이다.
  • 자연어 기반 인페인팅/아웃페인팅: 자연어 명령을 통해 이미지의 특정 부분을 수정하거나 배경을 확장하는 정밀한 편집이 가능하다.
  • SynthID: 구글 딥마인드가 개발한 디지털 워터마킹 기술로, 생성된 모든 이미지에 보이지 않는 워터마크를 삽입하여 AI 생성 콘텐츠임을 식별할 수 있도록 한다. 이는 허위 정보 확산을 방지하기 위한 기술적 장치이다.[7]

동영상 생성

2025년 7월부터 Veo 3 주요 기능이 제미나이 언어 모델에 통합되어 유료 모델인 제미나이 2.5 프로와 울트라에서 이미지를 바탕으로 한 동영상 생성 기능이 지원되었다. 영상 생성은 일 3회까지 가능하다.[8]

Remove ads

성능 평가

제미나이 모델들은 다양한 표준 벤치마크에서 최첨단(SOTA, State-of-the-Art) 성능을 기록했다.

  • MMLU (Massive Multitask Language Understanding): Gemini 1.0 Ultra가 90.0%의 점수를 기록하며 인간 전문가 수준을 넘어섰다.
  • GPQA (Graduate-Level Google-Proof Q&A): 전문가 수준의 복잡한 질문에 대한 추론 능력을 평가하는 GPQA 벤치마크에서 Gemini 2.5 Pro는 높은 정확도를 보이며 GPT-4o 등의 경쟁 모델을 능가했다.[5]
  • MATH (Measuring Mathematical Problem Solving): 고등 수학 문제 해결 능력 평가에서 2.5 Pro는 높은 점수를 기록하여 복잡한 수학적 추론 능력을 입증했다.
  • HumanEval: 파이썬 코드 생성 능력 평가에서 제미나이 모델들은 높은 통과율을 보이며 코딩 성능의 우수성을 증명했다.[2]

이러한 양적 평가 외에도, 제미나이는 긴 컨텍스트를 이해하고 요약하는 능력과 여러 형식의 데이터를 동시에 분석하는 멀티모달 추론 능력에서 기술적 우위를 보인다는 평가를 받는다. 다만, 다른 LLM과 마찬가지로 사실과 다른 정보를 생성하는 환각 현상이 발생할 수 있으며, 구글은 이를 보완하기 위해 답변의 신뢰도를 검증하는 '이중 확인(double-check)' 기능을 제공하고 있다.

사용 한도

제미나이는 요금제별로 사용 한도가 아래와 같이 정해져 있다. 제미나이 앱의 한도는 변경될 수 있으며 한도에 근접했을 때 알림이 제공된다.[9]

자세한 정보 요금제기능, 기본 ...

외부 링크

각주

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads