任务描述:本教程将通过深度学习的方式实现一个简单的视觉问答模型,视觉问答的任务内容是将一张图片和一个自然语言问题作为输入,结合这两种信息,机器生成一条自然语言答案。本教程通过数据准备,视觉问答模型构建,视觉问答模型训练,视觉问答模型评估,视觉问答模型预测等几个方面展示实现视觉问答系统的整个流程。如下图即为视觉问答的示例。

- tensorflow==1.14.0
- keras==2.2.5
- tqdm==4.47.0
- numpy==1.16.0
- matplotlib==3.2.2
- pandas==1.1.0
- spacy==2.3.2
- h5py==2.10.0
