书生是一款基于大模型的人工智能开放平台,拥有多模态、语言和实景三维大模型三个核心产品,能够实现开放理解、多模态交互和跨模态生成等多种能力。
Mini-Gemini是一款多模态视觉语言模型,可实现图像理解、推理和生成的任意到任意工作流,适用于各种智能场景。
M-VADER是一款基于多模态上下文的图像生成模型,可以根据用户提供的图像和文本组合生成高质量的图像。
BuboGPT是一种先进的多模态语言模型,具有强大的视觉关联和音频理解能力,可以处理图像、音频和文本等多种模态的输入,并生成准确和详细的回应。