Gemini 2.5: Deep Think가 출시되었습니다.
2025년 8월 1일
Google AI Ultra 구독자를 대상으로 Gemini 앱에서 Deep Think를 출시하고, 일부 수학자에게 IMO 경연 대회에 출품된 Gemini 2.5 Deep Think 모델의 전체 버전을 사용할 수 있는 권한을 제공합니다.
Google AI Ultra 구독자 여러분, 이제 Gemini 앱에서 Deep Think를 이용하실 수 있습니다. 이 도구는 병렬 사고를 활용하여 복잡한 문제를 해결하며, 코딩이나 과학적 발견과 같은 분야에서 탁월한 성능을 발휘합니다. Gemini 앱의 프롬프트 바에서 Deep Think를 활성화하면 이용할 수 있습니다.
오늘, 저희는 Deep Think를 Google AI Ultra 구독자를 위한 Gemini 앱에서 사용할 수 있도록 했습니다. 이는 이 구독자에게만 독점적으로 제공되는 매우 뛰어난 AI 도구와 기능 라인업의 최신 제품입니다.
이번 새로운 릴리스에는 초기 신뢰 테스터들의 피드백과 연구 혁신이 반영되었습니다. 주요 벤치마크 개선 사항과 신뢰 테스터 피드백 측면에서 I/O에서 처음 발표된 모델에 비해 상당한 개선이 이루어졌습니다. 이 모델은 올해 국제수학올림피아드(IMO)에서 금메달을 획득한 모델의 변형입니다. 기존 모델은 복잡한 수학 문제를 추론하는 데 몇 시간이 걸렸지만, 오늘 릴리스된 모델은 내부 평가에 따르면 2025 IMO 벤치마크에서 브론즈 수준의 성능을 달성하면서도 일상적인 사용에서 더 빠르고 사용성이 향상되었습니다.
Deep Think는 창의적인 문제 해결에 강력한 도구가 될 수 있습니다.
Google AI Ultra 구독자 여러분께 Deep Think를 제공하는 동시에, 금메달을 획득한 Gemini 2.5 Deep Think 모델의 공식 버전을 소수의 수학자와 학자들에게 공유하고 있습니다. 이 모델이 그들의 연구와 탐구를 어떻게 향상시킬 수 있을지 기대하며, 여러분의 피드백을 바탕으로 Deep Think를 지속적으로 개선해 나갈 것입니다.
이번 릴리스는 더욱 유용하고 역량 있는 AI를 구축하려는 저희 사명에 있어서 중요한 진전을 나타내며, Gemini를 사용하여 인간 지식의 경계를 넓히려는 저희의 노력을 더욱 강화합니다.
사람들이 복잡한 문제를 해결하기 위해 다양한 관점을 탐구하고, 잠재적 해결책을 가늠하고, 최종 답을 다듬는 데 시간을 들이는 것처럼, 딥 씽크는 병렬적 사고 기법을 사용하여 사고 능력의 경계를 넓힙니다. 이러한 접근 방식을 통해 제미니는 여러 아이디어를 동시에 떠올리고 동시에 검토하며, 심지어 시간이 지남에 따라 여러 아이디어를 수정하거나 결합하여 최적의 답을 도출할 수 있습니다.
게다가 추론 시간이나 "사고 시간"을 늘리면 쌍둥이자리가 다양한 가설을 탐구하고 복잡한 문제에 대한 창의적인 해결책을 도출할 수 있는 시간이 더 많아집니다.
또한, 우리는 모델이 이러한 확장된 추론 경로를 활용하도록 장려하는 새로운 강화 학습 기법을 개발했으며, 이를 통해 Deep Think는 시간이 지남에 따라 더 뛰어나고 직관적인 문제 해결자가 될 수 있게 되었습니다.
Deep Think는 사람들이 창의성, 전략적 계획, 단계별 개선을 요구하는 다음과 같은 문제를 해결하는 데 도움을 줄 수 있습니다.
제미니 앱의 Deep Think 기능은 병렬적 사고 기술을 사용하여 더욱 세부적이고 창의적이며 사려 깊은 응답을 제공합니다.
Deep Think의 성능은 코딩, 과학, 지식 및 추론 능력을 측정하는 까다로운 벤치마크에서도 드러납니다. 예를 들어, 도구를 사용하지 않는 다른 모델과 비교했을 때, Gemini 2.5 Deep Think는 경쟁 코드 성능을 측정하는 LiveCodeBench V6와 과학 및 수학을 포함한 다양한 분야의 전문성을 측정하는 까다로운 벤치마크인 Humanity's Last Exam에서 최고 수준의 성능을 달성했습니다.
저희는 교육 및 배포 라이프사이클 전반에 걸쳐 제미니에 안전성과 책임감을 지속적으로 구축하고 있습니다. 테스트 결과, 제미니 2.5 딥씽크는 제미니 2.5 프로보다 콘텐츠 안전성과 어조 객관성이 향상된 것으로 나타났지만, 무해한 요청을 거부하는 경향이 더 컸습니다.
제미니의 문제 해결 능력이 향상됨에 따라, 우리는 국경 안전 평가와 중요한 역량 수준에 대한 계획된 완화 조치의 실행을 포함하여 복잡성이 증가함에 따라 발생하는 위험을 더 심층적으로 살펴보고 있습니다.
Gemini 2.5 Deep Think의 안전 결과에 대한 자세한 내용은 모델 카드에서 확인할 수 있습니다.
Google AI Ultra 구독자이신 경우, 오늘부터 Gemini 앱에서 Deep Think를 사용할 수 있습니다. 모델 드롭다운에서 2.5 Pro를 선택하고 프롬프트 바에서 "Deep Think"를 토글하면 하루에 정해진 프롬프트 세트를 사용할 수 있습니다. Deep Think는 코드 실행 및 Google 검색과 같은 도구와 자동으로 연동되며 훨씬 더 긴 응답을 생성할 수 있습니다.
또한, 우리는 앞으로 몇 주 안에 Gemini API를 통해 신뢰할 수 있는 테스터들에게 Deep Think를 도구 포함 및 미포함 상태로 출시하여 개발자와 기업 사용 사례에서의 Deep Think의 유용성을 더 잘 이해하기 위해 노력하고 있습니다.
연구부터 배포까지 스택의 거의 모든 계층에 걸쳐 있는 팀들이 Deep Think를 Gemini 앱 사용자를 위해 더욱 빠르고, 안정적이며, 사용자 친화적으로 만들기 위해 노력해 왔습니다. 여러분이 이 앱을 통해 무엇을 만들어낼지 기대됩니다.
