[Google Study Jam - Beginner] 01. Introduction to Generative AI
Define AI
: ์ปดํจํฐ ๊ณตํ์ ํ ๊ฐ๋๋ก์, ์ง๋ฅํ ์์ด์ ํธ์ ์์ฑ์ ๋ค๋ฃจ๋ ๋ถ์ผ๋ก, ์์จ์ ์ผ๋ก ์ถ๋ก ํ๊ณ ํ์ตํ๊ณ , ํ๋ํ ์ ์์
-> ์ฌ๋์ฒ๋ผ ์๊ฐํ๊ณ ํ๋ํ๋ machine์ build์ ๊ดํ ์ด๋ก ๊ณผ ๋ฐฉ๋ฒ์ ๋ค๋ฃธ
Define ML
: AI์ ํ์๋ถ์ผ๋ก, ์ปดํจํฐ๊ฐ ๋ช
์์ ์ธ ํ๋ก๊ทธ๋๋ฐ ์์ด ํ์ตํ ์ ์๋๋ก ํจ
1. ๊ณผ์
- ํ๋ก๊ทธ๋จ ๋๋ ์์คํ
: ์
๋ ฅ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ ํ์ต
- ํ์ต๋ ๋ชจ๋ธ : ๋ณธ ์ ์๋ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ์ ์ฉํ ์์ธก์ ํจ
(์๋ก์ด ๋ฐ์ดํฐ๋ ํ์ต์ ์ฌ์ฉ๋ ๊ฒ๊ณผ ๋์ผํ ์์ค์์ ๊ฐ์ ธ์์ผํจ)
2. ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ํํ

(1) Supervised model
: label์ด ์ง์ ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณผ๊ฑฐ์ ์๋ฅผ ํ์ตํด, ํฅํ์ ๊ฐ์ ์์ธก ํ๋ ๋ชจ๋ธ
-> ํ๊ทธ๋ฅผ ํฌํจํ ๋ฐ์ดํฐ (ํ๊ทธ = ์ด๋ฆ, ์ ํ, ๋ฒํธ ๋ฑ)
- Example ) Totl bill acount๋ก ํฅํ์ Tip amount ์์ธก (๊ธฐ์ค : ์ฃผ๋ฌธ์ ํฌ์ฅ ๋๋ ๋ฐฐ๋ฌ ์ฌ๋ถ)

(2) Unsupervised model
: label์ด ์ง์ ๋์ง ์์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ํด๋ฌ์คํฐ๋งํ๋ ๋ชจ๋ธ
- ํน์ง : ์์ ๋ฐ์ดํฐ๋ฅผ ํ์ธํ๋ฉฐ ๋ฐ์ดํฐ๊ฐ ์์ฐ์ค๋ฝ๊ฒ ๊ทธ๋ฃน์ ํ์ฑํ๋์ง ๊ด์ฐฐ์ด ์ค์
- Example ) Years at company์ Income์ผ๋ก ์ง์ ํด๋ฌ์คํฐ๋ง ๋ฐ ๊ณ ์ ์น์ง ์ง์ ํ์ธ

=> ๋ ์ข
๋ฅ ๊ฐ์ ์ฐจ์ด์ ๋ฐ ์งํ ๊ณผ์ ์์ฝ

(3) Deep Learning
: ์ธ๊ฐ์ ๋์์ ์ฐฉ์ํ ๊ฒ์ผ๋ก, Ml๋ณด๋ค ๋ ๋ณต์กํ ํจํด์ ์ฒ๋ฆฌํ ์ ์๋ ML์ ํ ์ ํ
- ์ธ๊ณต์ ๊ฒฝ๋ง ๊ตฌ์ฑ : ์ํธ์ฐ๊ฒฐ๋ ๋ง์ ๋
ธ๋ (= ๋ด๋ฐ)
โก๏ธ ๋ด๋ฐ ๋ ์ด์ด๊ฐ ๋ ๋ง๊ธฐ ๋๋ฌธ์ ๊ธฐ์กด ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ๋ณด๋ค ๋ ๋ณต์กํ ํจํด์ ํ์ต
- ์ธ๊ณต์ ๊ฒฝ๋ง์ ํ๋ ์ผ : ์์
๋ฐฉ๋ฒ์ ํ์ตํ๊ธฐ ์ํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐ ์์ธก
- ์ ๊ฒฝ๋ง์ ํน์ง : ์ค์ง๋ํ์ต
- ํ์ต ๋ฐ์ดํฐ : label์ด ์๋ ์๋์ ๋ฐ์ดํฐ (: ์ ๊ฒฝ๋ง ๊ธฐ๋ณธ ๊ฐ๋
ํ์ต์ ๋์)
+ label ์๋ ๋๋์ ๋ฐ์ดํฐ (: ์ ๊ฒฝ๋ง์ด ์๋ก์ด ์๋ก ์ผ๋ฐํํ๋๋ฐ ๋์)
3. ๋ฅ๋ฌ๋ ๋ชจ๋ธ๊ณผ ์ผ๋ฐ์ ์ธ ML๋ชจ๋ธ์ ์ ํ 2๊ฐ



(1) Discriminative model (๋ถ๋ฅํ)
: ๋ฐ์ดํฐ ํฌ์ธํธ์ ๋ํ label ๋ถ๋ฅ ๋ฐ ์์ธก
- ํ์ต : ๋ผ๋ฒจ์ด ์ง์ ๋ ๋ฐ์ดํฐ ํฌ์ธํธ์ dataset ํ์ต (์ฌ์ฉ์๊ฐ ์์ธกํ๋ ค๋ ๋์ ํ์ต)
-> ๋ฐ์ดํฐ ํฌ์ธํธ์ ํน์ฑ๊ณผ ๋ผ๋ฒจ์ ๊ด๊ณ ํ์ตํ์ฌ, ๋ค์ํ ์ข
๋ฅ์ ๋ฐ์ดํฐ ์ธ์คํด์ค ๋ถ๋ฅ
- ์์ธก : ์ ๋ฐ์ดํฐ ํฌ์ธํธ์ label ์์ธก
- Example) X(์กฐ๊ฑด๋ถํ๋ฅ ๋ถํฌ) ์
๋ ฅ์, Y๊ฐ ์ถ๋ ฅ๋ ํ๋ฅ ํ์ตํ์ฌ, cat์ด ์๋ Dog๋ก ๋ถ๋ฅ

(2) Generative model (์์ฑํ)
: ๊ธฐ์กด ๋ฐ์ดํฐ๋ก ํ์ต๋ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ก์ด ๋ฐ์ดํฐ ์ธ์คํด์ค ์์ฑ
-> contentsํจํด์ ํ์ตํ์ฌ ์๋ก์ด contents ์์ฑ
- Example) X(๊ณตํต ํ๋ฅ ๋ถํฌ) + P(X,Y) (Y์ ํ๋ฅ )์ ํ์ตํ์ฌ, ๊ฐ์ผ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ์์ธกํ ํ, ๊ฐ ์ด๋ฏธ์ง๋ฅผ ์์ฑ

Define generative AI
: ๋ฅ๋ฌ๋์ ํ์ ์งํฉ์ผ๋ก, ๊ธฐ์กด contents์์ ํ์ตํ ๋ด์ฉ์ ๋ฐํ์ผ๋ก ๋ค์ํ ์ ํ์ ์๋ก์ด ์ฝํ
์ธ ๋ฅผ ์์ฑํ๋ ์ผ์ข
์ ์ธ๊ณต์ง๋ฅ ๊ธฐ์
-> text, image, audio ๋ฑ์ ๋๋ง์ contents ์์ฑ
01. ํ์ต ๋ฐ ์์ธก
: ๋ฐ์ดํฐ์ ๊ธฐ๋ณธ ๊ตฌ์กฐ๋ฅผ ํ์ต ํ, ํ์ต data์ ์ ์ฌํ ์์ ํ ์๋ก์ด sample์ ์์ฑ
(1) ๋ฐ์ดํฐ : ๋ผ๋ฒจ์ด ์ง์ ๋ ๋ฐ์ดํฐ์ ๋ผ๋ฒจ์ด ์ง์ ๋์ง ์์ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ์ฒ๋ฆฌ๊ฐ๋ฅ
(2) ํ์ต ๋ฐฉ๋ฒ : ์ง๋, ์ค์ง๋, ๋น์ง๋ ๋ฐฉ๋ฒ ์ฌ์ฉํ์ฌ, ๊ธฐ์กด contents๋ฅผ ํตํด ๋ฐฐ์
=> ์๋ก์ด ํต๊ณ๋ชจ๋ธ์ด ์์ฑ๋จ
(3) ์์ธก ๋ฐ ์ถ๋ ฅ ๊ณผ์
- user๊ฐ prompt๋ฅผ ์ ๊ณต
- ํต๊ณ ๋ชจ๋ธ๋ก ์์ ๋๋ต ์์ธก
- ์์ธก์ ํตํด ์๋ก์ด contents ์์ฑ
02. ์์ฑํ AI์ธ์ง ์๋์ง ๊ตฌ๋ถ

(1) ์์ฑํ AI๊ฐ ์๋ ๊ฒฝ์ฐ : ์ถ๋ ฅ์ด ์ซ์๋ class์ธ ๊ฒฝ์ฐ
- Example ) ์์ ํ๋งค๋
(2) ์์ฑํ AI์ธ ๊ฒฝ์ฐ : ์ถ๋ ฅ์ด ์์ฐ์ด์ธ ๊ฒฝ์ฐ
- Example ) ํ๋งค๋ฅผ ์ ์ ํ๋ผ๋ ๋ฑ์ ๋ฌธ์ฅ (์ง๋ฌธ์ด ๋๋ต์ ์ ๋-> ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋กํ ๋๋ต ์์ฑ)
03. ์์ฑํ AI process
(1) foundation model build
: ํ์ต code + ๋ชจ๋ ์ ํ์ label์ด ์ง์ ๋ data + label์ด ์ง์ ๋์ง ์์ data๋ฅผ ์ฌ์ฉํด build
- ์ญํ : ์๋ก์ด contents ์์ฑ (text, code, image, audio๋ฑ ์์ฒด contents)
- Gemini, LaMDA์ build ๊ณผ์
- ์ธํฐ๋ท์ ํตํด ์ฌ๋ฌ ์์ค์์ ๋ฐฉ๋ํ ๋ฐ์ดํฐ ์์งํ, build
- ์ฌ์ฉ์ : ์ง๋ฌธ์ ํตํด ๋ชจ๋ธ์ ์ฌ์ฉ (prompt ์
๋ ฅ or ์์ฑ)
04. Generative image model
: input : text -> output : text, image, Audio, Decisions

05. Generative language model
: input : image -> output : text, image, video

(1) Example ) ์ถ๋ ฅ์ด text์ธ ๊ฒฝ์ฐ, ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ด ์์ฑ
(2) ํ์ต ๋ฐฉ๋ฒ
: ์ฌ์ฉ์๊ฐ ์ ๊ณตํ๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ธ์ด์ ํจํด์ ํ์ต -> ํจํด ๋งค์นญ ์์คํ
- Example ) Gemini์์ ์์ฐ์ค๋ก์ด ํ
์คํธ๋ฅผ ์์ฑํ์ฌ ์๋ต

(3) ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ (LLM)
: ์์ฐ์ด ํํ๋ก text์ ์ฐฝ์์ ์ธ ์กฐํฉ์ ์์ฑํ๋ generative AI์ ํ ์ข
๋ฅ
- ์
๋ ฅ : Prompt
(Prompt๋ ? : ์
๋ ฅ์ผ๋ก ์ ๊ณต๋๋ ์งง์ ํ
์คํธ๋ก์ ๋ค์์ ๋ฐฉ์์ผ๋ก ๋ชจ๋ธ์ ์ถ๋ ฅ์ ์ ์ดํ๋๋ฐ ์ฌ์ฉ )
- Prompt ์ค๊ณ : LLM์์ ์ํ๋ ์ถ๋ ฅ์ ์์ฑํ๋ prompt๋ฅผ ๋ง๋๋ process
06. Transformer
: 2018๋
์์ฐ์ด ์ฒ๋ฆฌ์ ํ์ ์ ์ผ์ผํจ ๋ชจ๋ธ๋ก, ์์ฑํ AI์ ํ์ด ๋๋ ๋ชจ๋ธ

(1) ๊ตฌ์ฑ
- Encoder : ์
๋ ฅ ์ํ์ค๋ฅผ ์ธ์ฝ๋ฉํ๊ณ , ๋์ฝ๋๋ก ์ ๋ฌ
- Decoder : ๊ด๋ จ ์์
์ ๋ง๊ฒ ํํ์ ๋์ฝ๋ฉํ๋ ๋ฐฉ๋ฒ ํ์ต
(2) Hallucination
: model์ด ์์ฑํ ๋จ์ด๋ ๋ฌธ๊ตฌ๊ฐ ๋ง์ด ์ ๋๊ฑฐ๋, ๋ฌธ๋ฒ์ ์ผ๋ก ์๋ชป๋ ๊ฒฝ์ฐ์ ๋ฐฉํด์์
- ๋ฐ์ ์์ธ
- ๋ชจ๋ธ์ด ์ถฉ๋ถํ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ง ์์ ๊ฒฝ์ฐ
- noise๊ฐ ๋ง์ ๋ฐ์ดํฐ ๋๋ dirty ๋ฐ์ดํฐ๋ฅผ ํ์ตํ ๊ฒฝ์ฐ
- model์ ์ถฉ๋ถํ context๊ฐ ์ฃผ์ด์ง์ง ์์๊ฑฐ๋ ์ถฉ๋ถํ ์ ์ฝ์กฐ๊ฑด์ด ์ฃผ์ด์ง์ง ์์ ๊ฒฝ์ฐ
- ๋ฐ์ํ๋ ๋ฌธ์ ์
- ์ถ๋ ฅ text๋ฅผ ์ดํดํ๊ธฐ ์ด๋ ต๊ฒ ๋ง๋ฌ
- ๋ชจ๋ธ์ด ๋ถ์ ํํ๊ฑฐ๋ ํผ๋์ ์ผ๊ธฐํ๋ ์ ๋ณด๋ฅผ ์์ฑํ ๊ฐ๋ฅ์ฑ์ ๋์
Describe generative AI model types
01. ์ข
๋ฅ
(1) text-to-text (ํ
์คํธ ๊ฐ ๋ณํ ๋ชจ๋ธ) : ์์ฐ์ด๋ฅผ ์
๋ ฅ ๋ฐ์ text๋ฅผ ์ถ๋ ฅ
- ํ๋ จ : ํ
์คํธ ๊ฐ ๋งคํ์ ํ์ตํ๋๋ก ํจ
- Example : ํ ์ธ์ด๋ฅผ ๋ค๋ฅธ ์ธ์ด๋ก ๋ฒ์ญ
(2) text-to-image (ํ
์คํธ ์ด๋ฏธ์ง ๋ณํ ๋ชจ๋ธ)
- ํ์ต : ์งง์ ํ
์คํธ ์ค๋ช
์ผ๋ก ์บก์
์๋ ๋๊ท๋ชจ ์ด๋ฏธ์ง์
ํ์ต
- diffusion์ ์ฌ์ฉํ์ฌ ๊ตฌํ
(3) Text-to-video (ํ
์คํธ ๋์์ ๋ณํ ๋ชจ๋ธ) : ํ
์คํธ ์
๋ ฅ์์์ ๋์์ ์์ฑ
- ์
๋ ฅ : ๋ญ๋ ์ฌ์ฉ ๊ฐ๋ฅ
- ์ถ๋ ฅ : ์
๋ ฅํ
์คํธ์ ํด๋นํ๋ ๋์์
(4) text-to-3D (ํ
์คํธ 3D ๋ณํ ๋ชจ๋ธ) : ํ
์คํธ ์ค๋ช
์ ํด๋นํ๋ 3์ฐจ์ ๊ฐ์ฒด ์์ฑ
- ์ฌ์ฉ : ๊ฒ์, ๊ธฐํ 3D ํ๊ฒฝ
(5) text-to-task (ํ
์คํธ ์์
๋ณํ ๋ชจ๋ธ) : ํ
์คํธ ์
๋ ฅ์ ํ ๋๋ก ์ ์๋ ์์
์ ์ํ
- ์์
์ข
๋ฅ : ์ง๋ฌธ์ ๋ตํ๊ธฐ, ๊ฒ์ํ์ฌ ์์ธกํ๊ธฐ, ์กฐ์น ์ทจํ๊ธฐ ๋ฑ
- ์ฌ์ฉ : ํ์ต์์ผ์ ์น ์ฌ์ฉ์ ์ธํฐํ์ด์ค ํ์ / ๊ทธ๋ํฝ ์ฌ์ฉ์ ์ธํฐํ์ด์ค๋ฅผ ํตํ ๋ฌธ์ ์์
02. Foundation model
: ๊ฐ์ ๋ถ์, image captioning ๋ฑ ๊ด๋ฒ์ํ downstream ์์
์ ๋ง์ถฐ ํ์ธํ๋๋ ๋ฐฉ๋ํ ์์ ๋ฐ์ดํฐ๋ก ์ ํํ์ต๋ ๋๊ท๋ชจ AI ๋ชจ๋ธ

(1) ํน์ง : ์๋ฃ, ๊ธ์ต, ๊ณ ๊ฐ ์๋น์ค ๋ฑ ์ฌ๋ฌ ์ฐ์
์ ํ์ ํ ์ ์ฌ๋ ฅ์ ๊ฐ์ง๊ณ ์์
(2) ์ฌ์ฉ ์์ : ์ฌ๊ธฐ ํ์ง ํ ๋ง์ถคํ ๊ณ ๊ฐ ์ง์ ์ ๊ณต
(3) language foundation model : chat, text, code๋ฅผ ํฌํจ
(4) vision foundation model : ์์ ์ ์ธ ๋ถ์ฐ์ด ํฌํจ๋จ

- ํจ๊ณผ์ ์ธ ๋ถ์ผ : ํ
์คํธ ์ค๋ช
์์ ๊ณ ํ์ง ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋๋ฐ ํจ๊ณผ์
03. ์ฌ์ฉ ์ฌ๋ก์ ๋ฐ๋ฅธ ์์
๋ณ ๋ชจ๋ธ

(1) Code Generation
- Gemini์ code generation์ผ๋ก ํ ์ ์๋ ์์
- ์์ค ์ฝ๋์ ๊ฐ ์ค ๋๋ฒ๊ทธ
- ์ฝ๋ ํ ์ค ์ฉ ์ค๋ช
- DB์ ๋ํ SQL ์ฟผ๋ฆฌ ์์ฑ
- ์์ฑ ์ฝ๋์ ์ธ์ด๋ฅผ ๋ค๋ฅธ ์ธ์ด๋ก ๋ณํ
- ์์ค์ฝ๋์ ๋ํ ๋ฌธ์์ ํํ ๋ฆฌ์ผ ์์ฑ
- Example ) Python -> JSON ์ผ๋ก์ ์ฝ๋ ํ์ผ ๋ณํ ๋ฌธ์
- ์
๋ ฅ

- Gemini ์ถ๋ ฅ : ํ์ํ ๋จ๊ณ ๋ฐํ ๋ฐ JSON ํ์์ผ๋ก ๋ณํํ ์ถ๋ ฅ


Google Cloud๋ก Generative AI ํ์ฉ ๋ฐฉ๋ฒ
01. Vertex AI Studio
(1) ํน์ง
- Quickly explore and customize
- Developers create and deploy
-> Google Cloud์ ์ ํ๋ฆฌ์ผ์ด์
์์ ํ์ฉ ๊ฐ๋ฅ
(2) ๊ตฌ์ฑ
- Library of pre-trained models
- Tool for fine-tuning models : ๊ฐ๋ฐ์๊ฐ ์ฝ๊ฒ ์์ํ ์ ์๋ ๋๊ตฌ๋ค์ด ๋ง์
- Tool for deploying models to production
- Coummunity foru, for developers to share ideas and collaborate
(3) Vertex AI Agent Builder
- ์์ฑํ AI ๊ฒ์๊ณผ ๋ํ๋ฅผ ๋น๋ํด, ๊ณ ๊ฐ ๋ฐ ์ง์ ์ง์
- ํน์ง : ์ฝ๋ฉ์ด๋ ML ๊ฒฝํ์ด ๊ฑฐ์ ์์ด๋ ๋น๋ ๊ฐ๋ฅ
(4) ์ด์ธ์ ์ง์ ๊ธฐ๋ฅ
- chatbots
- digital assistants
- custom search engines
- Knowledge bases
- Traning applications
02. Gemini
: ๊ธฐ์กด์ ์ธ์ด ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ ์ฉ๋๊ฐ ํ
์คํธ ์ดํด์ ๊ตญํ๋์ง ์๋ ๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ
(1) ๊ธฐ๋ฅ
- ์ด๋ฏธ์ง ๋ถ์
- ์ค๋์ค์ ๋์์ค ํ์
- ํ๋ก๊ทธ๋๋ฐ ์ฝ๋ ํด์
(2) ํน์ง
- ์ด์ ์ ๋ถ๊ฐ๋ฅํ๋ ๋ณต์กํ ์์
์ ์ํํ ์ ์์
- ๊ณ ๊ธ ์ํคํ
์ฒ ๋๋ถ์ ์ ์๋ ฅ๊ณผ ํ์ฅ์ฑ์ด ๋ฐ์ด๋, ๋ค์ํ ์์ฉ ๋ถ์ผ์ ์ ํฉ
03. Model Garden
: ์๋ก์ด ๋ชจ๋ธ์ ํฌํจํ๋๋ก ์ง์์ ์ผ๋ก ์
๋ฐ์ดํธ ๋จ
