The Brief
모델 기초

멀티모달Multimodal

한마디로

텍스트뿐 아니라 이미지·음성·영상 등 여러 형태(modality)를 함께 이해하고 다루는 모델이에요

멀티모달은 '여러 감각을 동시에 쓰는' 모델이에요. 사진을 보여주며 '이거 뭐야?'라고 묻거나, 영상·음성을 입력으로 받는 게 가능하죠.

마케팅에선 이미지 광고 분석, 제품 사진 기반 카피 생성, 음성 고객응대 등에 직결돼요. 텍스트만 다루던 시절보다 활용 폭이 훨씬 넓어졌어요.

관련 용어

태그