VLM

VLM概説

視覚言語モデル(VLM)とは? LLMに「目」が宿る次世代AIの仕組みと活用事例

VLM関連論文

【論文紹介】CLIP: 自然言語で学習する汎用画像モデル(2021)

【論文紹介】Few-Shot学習で驚異的な性能を発揮するVisual Language Model「Flamingo」(2022)

【論文紹介】BLIP-2:既存モデルを賢く活用! 省コストで高性能なVision-Language Pre-training(2023)

【論文紹介】マルチモーダルLLM「LLaVA」、画像と対話するAIアシスタント(2023)