能够根据文本指令等方式实现图像分割,而且万物皆可识别和一键抠图。
模型开源社区及创新平台,由阿里巴巴达摩院,联合CCF开源发展委员会,共同作为项目发起方。
目标检测、实例分割、语义分割、图像分类、视觉推理、视觉问答、图片描述生成和跨模态检索等
360搜索与大语言模型技术的结合,本质是新一代“智能搜索”。
AnimateDiff.org:免费,简单的人工智能文本到视频转换
拥有三个模态的基础大模型,涉及语音、图像、文本不同内容的生成。
内容生成、文本摘要、聊天机器人、代码开发,以及蛋白质结构和生物分子特性预测等。
要发表评论,您必须先登录。
模型开源社区及创新平台,由阿里巴巴达摩院,联合CCF开源发展委员会,共同作为项目发起方。