Type something to search...

제미나이

멀티모달 AI(Multimodal AI): 기계에게 '보고 듣고 이해하는 법'을 가르치다

멀티모달 AI(Multimodal AI): 기계에게 '보고 듣고 이해하는 법'을 가르치다

서론: 텍스트라는 좁은 창문을 넘어서 생성형 AI 붐의 초기 단계에서 GPT-3와 같은 모델들은 철저히 '단일 모달(Unimodal)'이었습니다. 오직 텍스트로만 묻고 텍스트로만 답할 수 있었습니다. 이들이 에세이를 쓰거나 코드를 작성하는 능력은 경이로웠지만, 세상을 이해하는 방식에는 근본적인 한계가 있었습니다. 아름다운 저녁 노을의 색감이나, 복