Google Gemma: nový otevřený LLM model konkuruje Llama Mistral

Google pokračuje v rozšiřování své nabídky produktů umělé inteligence (AI) a představuje novou rodinu otevřených jazykových modelů s názvem Gemma. Gemma je textový model založený na stejné technologii jako vlajkové modely Gemini od Googlu a je k dispozici ve dvou verzích: s 2B nebo 7B parametry.

audioverze: na Spotify




Rozhodnutí Googlu uvolnit otevřený model je pokusem využít potenciálu open-source komunity, podobně jako společnost Meta v roce 2023 s modelem LLaMA. Ten si od té doby stáhlo 30 milionů uživatelů a byl použit ve více než 3 500 firemních projektech.


Klíčové vlastnosti:

  • Rodina otevřených jazykových modelů Gemma navazuje na nedávné aktualizace umělé inteligence Google Gemini.
  • Model je k dispozici ve verzích s 2B nebo 7B parametry, je určen pro textové úlohy a lze jej spustit z osobního počítače.
  • Modely Gemma, trénované na datové sadě 6 bilionů tokenů, excelují v úlohách, jako je zodpovídání otázek a shrnutí, a překonávají podobně velké modely.
  • Přestože je Gemma propagována jako otevřený model, Google zatím uvolnil pouze parametry, nikoli celý zdrojový kód a tréninková data.
  • Navzdory výhodám existují obavy z potenciálního zneužití pro generování dezinformací nebo škodlivého obsahu.

Gemma vs. Llama 2 a Mistral 7B

Pokud jde o Gemmino místo v open-source komunitě, má dva hlavní konkurenty: Llama 2 a Mistral 7B. Každý z těchto modelů si vybudoval pověst jednoho z nejvýkonnějších open-source LLM.

Výzkum společnosti Google však ukazuje, že Gemma překonává každý model v klíčových oblastech, jako jsou zodpovídání otázek, logické úlohy, matematika a kódování.



Uvolnění Gemmy prohlubuje ekosystém produktů AI od Googlu, ale skutečným vítězem je zde open-source komunita. Výzkumní pracovníci nyní mají na výběr z modelů Gemma, Llama 2 a Mistral 7B, se kterými mohou experimentovat a vyvíjet nová řešení.


S tím, jak bude tento open-source ekosystém zrát, pravděpodobně uvidíme vývoj stále výkonnějších LLM, čímž se zmenší rozdíl mezi otevřenými a uzavřenými LLM. To, zda budou tyto modely využity k dobrým nebo špatným účelům, je však rozhodnutí, které zatím zůstává v rukou uživatelů.