Gemini란?: Google의 새로운 AI 모델에 관한 모든 것

구글이 사상 가장 강력한 AI 모델을 출시했습니다. 쌍둥이 자리. 그녀는 무엇이며 무엇을 할 수 있습니까? 우리 기사의 모든 것에 대해.

Google은 수년간 자체 AI 도구를 개발해 왔습니다. OpenAI의 ChatGPT-3 공개 출시와 함께 세계에서 가장 인기 있는 검색 엔진을 운영하는 회사도 유사한 도구인 Bard를 만들었습니다. 하지만 이 도구는 Google이 허용할 수 없는 경쟁업체에게 여전히 패했습니다. 따라서 우리가 프레젠테이션 중에 알게 된 Google의 새로운 언어 모델인 Gemini를 최근 세계가 본 것은 놀라운 일이 아닙니다.

이는 거인의 이전 LLM(Large Language Model)을 개선할 뿐만 아니라 텍스트 처리, 그래픽 및 사운드 분야에서 완전히 새로운 가능성을 제공하도록 설계되었습니다.

그럼 새로운 Google Gemini 언어 모델을 자세히 살펴보겠습니다.

또한 흥미로운: OpenAI 프로젝트 Q*: 정의 및 프로젝트가 관심을 끄는 이유

콘텐츠

6. Google Bard의 Gemini: 무엇이 바뀔까요?

7. Google Pixel 스마트폰의 쌍둥이자리

8. Gemini는 GPT-4와 같은 다른 AI 모델과 어떻게 다릅니까?

9. 정확성과 공정성에 대한 우려

10. 미래는 쌍둥이자리와 함께

구글 제미니란 무엇인가요?

이는 텍스트뿐만 아니라 이미지, 동영상, 오디오까지 이해할 수 있는 Google의 새롭고 강력한 인공지능 모델입니다. 이 다중 모드 모델은 수학, 물리학 및 기타 영역에서 복잡한 작업을 수행할 수 있을 뿐만 아니라 다양한 프로그래밍 언어로 고품질 코드를 이해하고 생성할 수 있는 것으로 설명됩니다.

Gemini는 현재 Google Bard 및 Google Pixel 8과의 통합을 통해 제공되며 점차적으로 다른 Google 서비스에도 포함될 예정입니다.

"Gemini는 Google Research의 동료를 포함하여 Google 팀 전체의 대규모 공동 노력의 결과입니다." — Google DeepMind의 CEO이자 공동 창업자인 Dennis Hassabis는 말했습니다. "처음부터 다중 모드로 구축되었습니다. 즉, 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 다양한 유형의 정보를 일반화하고 원활하게 이해하고, 작동하고, 결합할 수 있습니다."

- 광고 -

또한 흥미로운 점: 우리가 AI라고 부르는 모든 것이 실제로 인공 지능은 아닙니다. 알아야 할 사항은 다음과 같습니다.

모델을 만든 사람은 누구인가요?

이미 짐작하셨겠지만 Gemini는 Google과 Google의 모회사인 Alphabet에 의해 만들어졌으며 현재까지 Google의 가장 발전된 AI 모델입니다. Google의 DeepMind 사업부도 개발에 상당한 기여를 했습니다. 개발에 얼마나 많은 직원이 참여했는지, 이를 위해 어떤 자금이 할당되었는지는 아직 알려지지 않았지만 Google의 역량을 알면 매우 많은 금액이 있음을 확신할 수 있습니다.

또한 흥미로운: Windows 12: 새로운 OS는 무엇일까요?

기회

위에서 언급했듯이 이는 다중 모드 모델입니다. 즉, 텍스트, 코드, 오디오, 이미지 및 비디오를 포함한 다양한 유형의 데이터를 이해하고, 작동하고, 결합할 수 있습니다. 기존 AI 시스템에 비해 더 나은 이해력, 사고력, 코딩 능력을 제공합니다.

모델의 주요 기능은 다음과 같습니다.

번역, 요약, 대화 등의 작업을 위한 자연어 처리
수학적 사고와 문제 해결
코드 및 문서 생성 능력
이미지, 오디오 및 비디오 이해
다양한 도메인에서의 멀티태스킹

보시다시피 기능은 다른 모델보다 우수합니다.

언어 이해력, 수학적 사고 및 코딩 테스트에서 Gemini Ultra는 GPT-4와 같은 모델보다 성능이 뛰어났습니다. 특히 MMLU(Massive Multitask Language Understanding) 테스트에서 인간 수준의 성능을 능가하는 최초의 모델로 90% 이상의 정확도를 달성했습니다.

대규모 언어 모델 연구에 대한 32개 학술 테스트에서 Gemini는 GPT-4를 능가했습니다. 30개 사례에서는 Google의 새로운 언어 모델이 경쟁사보다 우수했습니다. 이는 모델이 언어를 완전히 이해하는 능력을 보여줍니다.

또한 읽기: 인간 두뇌 프로젝트: 인간 두뇌를 모방하려는 시도

다른 버전이 있나요?

구글은 이 AI를 구글 데이터 센터부터 모바일 기기까지 모든 기기에서 작동할 수 있는 유연한 모델이라고 설명합니다. 이러한 확장성을 달성하기 위해 Gemini는 Nano, Pro 및 Ultra의 세 가지 버전으로 제공됩니다.

Gemini의 다양한 버전에 대해 더 자세히 이야기해 보겠습니다.

제미니 나노: 스마트폰, 특히 Google Pixel 8에서 작동하도록 설계되었습니다. 채팅 프로그램에서 답변을 제안하거나 텍스트를 요약하는 등 외부 서버에 연결하지 않고 인공지능에 의한 효율적인 처리가 필요한 작업을 수행하도록 설계되었습니다. 이 소형 장치 모델에는 약 6억 개의 매개변수가 있습니다.
제미니 프로: Google 데이터 센터에서 실행됩니다. Pro는 최신 버전의 Bard AI 챗봇과 함께 작동하도록 설계되었습니다. 빠른 응답 시간을 제공하고 복잡한 쿼리를 이해할 수 있습니다. 중형 모델은 약 100억 개의 매개변수를 가지고 있으며 Bard 대화형 AI의 핵심입니다. Pro는 Google Cloud를 통해 제공됩니다.
제미니 울트라: Ultra 버전은 아직 널리 사용 가능하지 않지만 Google에서는 이 버전을 "대형 언어 모델(LLM) 연구에 사용되는 널리 사용되는 학술 테스트 30개 중 32개에 대한 현재 최첨단 성능"을 능가하는 최고 성능 모델이라고 설명합니다. " 가장 크고 가장 강력한 버전인 Ultra는 1조 개 이상의 매개변수를 수신하게 됩니다. 데이터 센터에 위치하게 됩니다. Ultra는 기업용으로 적합합니다. 이 버전은 매우 복잡한 작업을 수행하도록 설계되었습니다. Google은 현재 테스트 단계가 끝난 후에 이를 출시할 계획입니다. 즉, 가장 강력한 버전은 아직 사용자에게 제공되지 않습니다.

또한 흥미로운: Google Bard AI: 알아야 할 모든 것

- 광고 -

쌍둥이자리에 어떻게 접근하나요?

Nano 및 Pro 버전의 AI는 이제 각각 Google Pixel 8 스마트폰 및 Bard 챗봇과 같은 Google 제품에서 사용할 수 있습니다. Google은 이를 검색 엔진, 광고, Gmail 이메일 서비스, Chrome 브라우저 및 기타 서비스에 통합할 계획입니다.

개발자와 기업 고객은 13년 2023월 일부터 Google AI Studio 및 Google Cloud Vertex AI의 Gemini API를 통해 Pro에 액세스할 수 있습니다. 개발자 Android AICore를 통해 Nano 버전 모델에 액세스할 수 있으며, 이는 초기 미리 보기에서 사용할 수 있습니다.

또한 읽기: Samsung Galaxy Flip5 대 Motorola Razr 40 Ultra: 두 요코준의 전투

Google Bard의 Gemini: 무엇이 바뀔까요?

프레젠테이션 중에 제공된 정보에 따르면 이 모델을 통해 Google Bard는 다음과 같이 더 복잡한 문제를 더 잘 처리할 수 있습니다.

“우리는 모델이 자연스럽게 다중 모드가 되고 처음부터 여러 모드에 대해 사전 훈련되도록 Gemini를 설계했습니다. 그런 다음 성능을 향상시키기 위해 더 많은 다중 모드 데이터를 추가하여 이를 개선했습니다. 그 결과, Gemini는 이전의 다중 모드 모델보다 훨씬 더 쉽게 이해하고 추론하며, 거의 모든 분야에서 최첨단 역량을 자랑합니다.

Gemini의 탁월한 다중 모드 기능은 복잡한 텍스트 및 시각적 정보를 이해하는 데 도움이 됩니다. 이는 거대한 데이터 세트에서 특정 정보를 추출할 때 특히 유용합니다. 수십만 개의 문서를 읽고 필터링하고 분석하여 정보의 본질을 추출하는 이 모델의 뛰어난 능력은 의심할 여지 없이 과학에서 금융에 이르기까지 다양한 분야에서 새롭고 번개처럼 빠른 발견에 기여할 것입니다."

프레젠테이션 중에 200만 개 이상의 기록이 포함된 복잡한 연구의 예가 시연되었으며 그 중 일부는 새로운 데이터에 따라 업데이트되어야 했습니다. 짐작하셨겠지만, 이 작업을 수동으로 수행하는 것은 시간이 많이 소요되므로 연구 작성자는 Gemini를 사용하여 입력을 받아 필요한 업데이트를 수행하는 코드를 준비했습니다. 좀 더 실제적인 또 다른 예는 Google의 언어 모델을 사용하여 수학 또는 물리학 문제를 설명하는 것입니다.

여기에 입력된 데이터는 학교 수업 과제의 사진/스캔이었습니다. 시스템은 거기에 저장된 그래픽과 텍스트를 처리한 다음 숙제의 어떤 부분이 올바르게 수행되었는지, 어떤 부분에 더 주의가 필요한지 표시할 수 있었습니다. 프레젠테이션에서는 사용자가 Gemini에게 작업을 설명하도록 반복적으로 요청할 수 있으며 이후의 각 시도는 더 간단한 언어로 설명되어야 함을 보여주었습니다. 물론 Gemini가 얼마나 정확하고 정확한지는 관심 있는 사람들이 확인하겠지만, 사진에서 직접 텍스트를 읽고 처리하는 능력은 인상적입니다. 프레젠테이션 중에 추가된 내용:

"Gemini는 텍스트, 이미지, 소리 등을 동시에 인식하고 이해하는 방법을 배웠습니다. 덕분에 그는 정보의 미묘한 차이를 더 잘 이해하고 복잡한 질문에 답할 수 있습니다. 특히 수학과 물리학과 관련된 주제를 설명하는데 효과적이어서 개인 숙제 도우미 역할도 할 수 있습니다.".

Google Pixel 스마트폰의 쌍둥이자리

Google은 또한 Gemini가 새로운 TPUv5 칩셋에 대해 '학습'하고 있으며 2024년 초에 Gemini Ultra를 출시할 계획이라고 자랑했습니다. 이 Ultra는 거대 음성 모델의 소비자 버전인 Bard Advanced를 사용하게 됩니다. Gemini Ultra는 현재 테스트 중이며 이미 엄선된 보안 전문가에게 제공되고 있습니다.

마지막으로 중요한 정보는 Google Pixel 8 스마트폰에 Gemini가 도입되었다는 점입니다. 이를 통해 무엇보다도 메신저의 Gboard 애플리케이션을 통해 빠른 답장을 생성할 수 있습니다. 첫 번째는 WhatsApp이지만 내년에는 이러한 솔루션이 통신과 관련된 다른 애플리케이션에도 나타날 것입니다. 그러나 이는 시작에 불과합니다. Google이 Pixel 8 스마트폰을 위한 많은 새로운 AI 도구를 발표했으며 향후 일부 기기에서도 사용할 수 있게 될 것이기 때문입니다. Android. 그러나 이는 추가 계획이며 현재로서는 세부 정보가 제공되지 않았습니다.

Gemini는 GPT-4와 같은 다른 AI 모델과 어떻게 다릅니까?

Google의 새로운 Gemini 모델은 현재까지 가장 크고 가장 발전된 AI 모델 중 하나로 보이지만 Ultra 모델의 출시로 확실히 결정될 것입니다. 현재 AI 챗봇을 사용하는 다른 인기 모델과 비교할 때 Gemini는 자체 다중 모드 기능이 눈에 띄는 반면, GPT-4와 같은 다른 모델은 진정한 다중 모드를 위해 플러그인 및 통합에 의존합니다.

정확성과 공정성에 대한 우려

Gemini는 인공 지능 기능 개발에 있어 큰 도약을 이루었지만 다른 주요 언어 모델과 동일한 단점을 가지고 있습니다. 우선 허위정보를 생성할 가능성이 크다. 편향은 또한 새로운 언어 모델에 사용할 수 있는 훈련 데이터를 기반으로 합니다. 현실 세계에 대한 제한된 이해도 언급할 가치가 있습니다. Google은 새로운 Gemini 모델이 실수를 할 수 있고 증거에 기반하지 않은 사실을 제공하며 상식과 모순될 수 있음을 인정합니다.

특히 아직 완전히 탐색되지 않은 새로운 기능을 갖춘 Gemini Ultra의 경우 더 많은 테스트가 필요합니다. Google은 잠재적인 피해를 최소화하기 위해 Gemini를 신중하게 평가하기 위해 최선을 다하고 있습니다.

또한 흥미로운: 모든 약 Microsoft 부조종사: 미래인가 아니면 잘못된 길인가?

미래는 쌍둥이자리와 함께

Google의 Gemini 출시는 AI 개발의 새로운 시대를 열었습니다. 이전 모델 및 인간 기준에 비해 최고의 성능을 갖춘 Gemini는 인공 지능의 미래 가능성을 지적하지만 특정 단점을 해결하려면 여전히 더 많은 연구가 필요합니다.

앞으로는 Gemini가 Google 제품에 더욱 유용하고 지능적인 기능을 제공할 것으로 기대하실 수 있습니다. 앞으로도 회사는 영어를 넘어 Gemini를 계속 확장하고 핵심 모델 방법론을 구축할 계획입니다.

우리는 Google이 무엇을 하고 있는지 지켜보고 희망할 뿐입니다.

또한 읽기:

저자의 더보기

가입하기

0 코멘트

임베디드 리뷰

모든 댓글 보기

기타 기사

Gemini란 무엇인가: Google의 새로운 AI 모델에 관한 모든 것