본문 바로가기

 

금융, 투자정보/주식, 투자 이야기

[미국주식] 구글 생성 AI 기술, 제미니 기능 및 활용방법 알아보기

by bo-info 2024. 7. 4.
반응형

구글의 차세대 AI 기술, 제미니를 알고 계신가요? 요즘 AI로 세계와 주식시장이 들썩이는데요. 구글이 새로운 AI모델 제미니를 출시한다고 합니다. 이 포스팅에서는 구글의 제미니의 다양한 모델, 기능, 앱, 비용, 경쟁력 그리고 미래 전망에 대해서 알아보겠습니다. 

 

구글 AI 기술, 제미니 알아보기

 

구글 AI 기술, 제미니란 무엇인가?

제미니는 구글의 AI 연구팀인 DeepMind와 Google Research에서 개발한 차세대 생성 AI 모델군입니다. 제미니는 텍스트뿐만 아니라 오디오, 이미지, 비디오 등의 다양한 종류의 데이터를 분석하고 생성할 수 있습니다. 이는 이전의 텍스트 기반인 AI 모델, LaMDA와 차별화됩니다. 

 

제미니 모델의 종류

제미니 모델은 네 가지 버전으로 나뉩니다. 

 

1. Gemini Ultra

가장 성능이 뛰어난 모델로, 복잡한 문제 해결과 과학적 분석까지 가능합니다.(가격 : 비공개)

 

2. Gemini Pro

Ultra의 하위 버전으로, 대부분의 AI 작업을 효율적으로 처리합니다. (가격 : 100만 입력 토큰 당 50센트, 100만 출력 토큰 당 1.5달러)

 

3. Gemini Flash

속도에 중점을 둔 Pro의 하위 버전으로, 텍스트 생성 작업에 최적화되어 있습니다. 

 

4. Gemini Nano

모바일 장치에서 오프라인으로 실행할 수 있는 최소한의 모델입니다. 삼성 갤럭시 S24등에서 일부기능을 지원하고 있습니다. 

 

 

제미니의 주요 기능

그럼, 제미니는 어떤 기능을 할 수 있을까요? 제미니는 멀티모달 작업을 수행할 수 있으므로, 텍스트뿐만 아니라 이미지 생성, 음성인식, 비디오 캡션 생성 등의 기능을 수행할 수 있습니다. 

 

예를 들어, 제미니 울트라는 물리학 문제를 단계별로 해결하고, 오류를 지적할 수 있으며, 관련 과학 논문을 식별하고 정보를 추출하여 차트를 최신 데이터로 업데이트할 수 있습니다. 

 

제미니 앱(구 Bard)과의 차이점

제미니 모델은 앱 버전인 Bard가 있는데요, 이와는 별개로 운영됩니다. 제미니 앱은 OpenAI의 ChatGPT처럼 챗봇과 대화하는 듯한 인터페이스로 구성된다고 합니다.

* 프런트엔드 : 사용자로부터 다양한 형태의 정보를 입력받는 것

 

 

제미니의 구글 앱 통합

제미니는 Gmail, Google Docs, Chrome, 개발자 도구 등 다양한 구글 앱과 서비스에 접목되고 있습니다. 이를 사용하려면 Google One AI Premium Plan을 구독해야 하며, 이는 Google Workspace앱에서도 제미니를 사용할 수 있게 해 줍니다.

 

예를 들어, Gmail에서 제미니는 이메일을 작성하거나 메시지 스레드를 요약할 수 있으며,  Google Docs에서는 콘텐츠를 만들고 아이디어의 브레인스토밍을 도울 수 있습니다. 

 

 

제미니의 활용 가능성

제미니 모델은 다양항 멀티모달 작업을 수행할 수 있기 때문에, 텍스트뿐만 아니라 음성, 이미지, 비디오로 확장해서 사용할 수 있습니다. 

 

제미니의 경쟁력

구글은 제미니가 비슷한 AI 기술 중에서, 현존 최고 수준의 성과를 보였다고 하는데요. 하지만 OpenAI의 GPT-4 모델과는 비슷한 수준이라고 합니다.

 

아직 제미니는 생성 AI 기술의 기본적인 문제점인 편향성과 '환각'(잘못된 정보를 생성하는 현상)을 해결하지 못한 상황이라고 하니 좀 더 발전을 기대해 봐야겠습니다.

 

 

제미니의 미래 전망

구글은 제미니 모델을 기반으로 한 다양한 새로운 기능을 출시할 계획이라고 합니다.

 

예를 들어 사용자 정의 챗봇인 Gems를 만들 수 있는 기능과, Gemini Live라는 심도 있는 음성대화 기능을 도입할 예정입니다. 이를 통해 제미니는 사용자의 실시간 음성 패턴을 이해하고 반응할 수 있으며, 주변환경을 사진이나 비디오로 인식하여 반응할 수 있게 됩니다. 

 

제미니는 멀티모달 기능 덕분에 텍스트, 이미지, 오디오, 비디오를 분석하고 생성할 수 있다고 하는데요. 따라서 학습보조, 과학논문 분석, 코드 생성 및 수정, 마케팅, 캠페인 분야 등에서도 활발히 활용할 수 있을 것 같습니다. 

 

구글은 제미니 모델의 성능과 적용 범위를 지속적으로 확장하고 있으므로, 관심 있는 분들은 한번 이용해 보는 것도 좋겠습니다. 

 

 

반응형

댓글