Rewolucja od Google dla każdego. Czas na Google Gemini

2023-12-08 11:14:35(ost. akt: 2023-12-08 11:20:36)

Autor zdjęcia: pixabay

Google przedstawiło swój najpotężniejszy model sztucznej inteligencji, znany jako Google Gemini. To rezultat współpracy wielu inżynierów i naukowców z zespołów Google Deep Mind oraz Google Research. Jest to pierwszy taki przypadek w historii firmy, gdzie udało się stworzyć coś o tak zaawansowanym i imponującym charakterze. Czym dokładnie jest Google Gemini i w jaki sposób można z niego skorzystać?
Google zakończyło rok spektakularnym ogłoszeniem - firma zaprezentowała Google Gemini, największy projekt inżynieryjno-naukowy w swojej historii. To model sztucznej inteligencji, który został stworzony od podstaw przez zespoły Google Deep Mind i Research. Nowe narzędzie AI wyróżnia się dotąd niespotykanym poziomem zaawansowania.

Google Gemini to model AI o charakterze multimodalnym, co oznacza, że jest zdolny do generalizowania w różnych dziedzinach, łączenia informacji, wyciągania wniosków i skutecznego poruszania się nie tylko w obszarze zagadnień, ale także w materiałach źródłowych. Bez trudu radzi sobie z jednoczesnym interpretowaniem zdjęć, tekstu, dźwięku oraz kodu komputerowego.


Model multimodalny, sztuczna inteligencja, projekt Google - to brzmi imponująco, ale niewielu z nas z pewnością zrozumie, co kryje się za nazwą Google Gemini. Wytłumóżmy sobie, o co dokładnie chodzi z tym nowym narzędziem Google i czy każdy z nas może z niego skorzystać. Warto zacząć od podstaw.

Z pewnością zauważyliście popularne w ostatnich miesiącach aplikacje i programy wykorzystujące sztuczną inteligencję, takie jak ChatGPT czy Bard. Po wejściu na odpowiednią stronę możemy tekstowo komunikować się z botem, zadawać pytania, poznawać odpowiedzi czy nawet zmuszać go do kreatywnej pracy. Jednakże ograniczeniem jest tutaj głównie tekstowa forma komunikacji, ewentualnie wspierana obrazkami. Pełniejsze możliwości uzyskujemy dopiero po wykupieniu wersji premium (ChatGPT), a technologia rozwija się w pełni w konkretnych zastosowaniach.

Nie są to jednak tylko boty konwersacyjne. Można je wykorzystać do pracy, na przykład przy streszczaniu tekstów czy analizowaniu danych. Dokładnie takim spójnym narzędziem jest Google Gemini, a jego ogromną zaletą jest elastyczność. To narzędzie może działać praktycznie wszędzie, od dużych centrów danych po nasze smartfony. Można je wykorzystać do analizowania obszernych tekstów, arkuszy kalkulacyjnych czy nawet poprzez prośbę o streszczenie rozmowy telefonicznej lub zinterpretowanie podanych informacji.


Google Gemini radzi sobie doskonale z bardziej kreatywną pracą. Jego zdolność do generalizowania i interpretacji pozwala mu na tworzenie szkiców oraz zrozumienie informacji, filtrowanie ich i łączenie. Czy różnica w porównaniu do wcześniejszych narzędzi jest znacząca? Zdecydowanie tak.

W przypadku wielu modeli językowych konieczne było przeprowadzenie intensywnego treningu, często z udziałem ekspertów językowych. Do tych modeli wprowadzano informacje, czasem zupełnie losowe lub dotyczące różnych kategorii. Firmy specjalizujące się w trenowaniu botów masowo zlecały przeprowadzanie rozmów między botem a pracownikami, aby ten pierwszy mógł się uczyć. Google Gemini idzie krok dalej, zdolny jest lepiej interpretować posiadane już dane lub te, które dopiero co zostały dostarczone.

Google zaprezentowało swoje nowe narzędzie, dostępne teraz w trzech różnych wariantach. Jak skorzystać z Google Gemini? Oferowane są trzy opcje:

Gemini Ultra - najpotężniejszy model.
Gemini Pro - najbardziej skalowalny, zintegrowany z modelem Bard.
Gemini Nano - najbardziej wydajny do zastosowania na urządzeniach, na przykład smartfonach.

Firma ogłosiła już plany wprowadzenia swojego nowego narzędzia na smartfony. Pierwszym modelem z Google Gemini Nano będzie Google Pixel 8, flagowy model firmy na ten rok. Co umożliwia Google Gemini? Na początku pozwoli na inteligentne podsumowywanie w aplikacjach takich jak Dyktafon i WhatsApp. Obsługa innych programów pojawi się w przyszłości.