• NLP项目实战02:英文文本识别


    简介:

    欢迎来到本篇文章!今天我们将讨论一个新的自然语言处理任务——英文短文识别。具体而言,即通过分析输入的英文文本来判断其是比较消极的还是比较积极的。

    展示:

    1、项目界面
    如下所示是项目启动后用户使用使用界面
    image

    2、布局介绍
    首先可以看到用户使用界面上存在这么几个部分:
    2.1、最左边的功能栏
    2.2、最上面的添加识别文本的输入框
    2.3、一个start model按钮
    2.3、Test & Result
    2.4、Wordcloud
    2.5、WordFrequency

    image

    3、功能介绍
    image
    3.1、最左边的功能栏
    这部分暂时没有功能接入,可以根据个人需求进行功能接入

    3.2、最上面的添加识别文本的输入框
    在这里输入需要模型进行识别的文本,这里需要注意,由于本项目是关于英文文本识别的,所以这里输入的文本需要是英文才可以。如果输入的是其他语言的文本,可能模型没有办法进行识别,或者说会出现识别出错的情况。此外由于是英文文本识别,所以用户使用界面,我也全用英文写的

    3.3、一个start model按钮
    当我们输入好了文本以后,我们就可以点击这个Start model进行文本的识别了

    3.3、Test & Result
    当模型识别以后,用户界面会将识别结果进行展示,Test & Result的结果TaoTao这里使用的图表的形式展示的,图表有两个属性,一个是Positive还有一个是Negative,其中Positive表示输入的识别文本是积极的一类,而Negative则表示消极

    3.4、Wordcloud
    这里属于词云的范畴了,也就是说这里会给我们输入的文本进行统计,并给数据以词云的方式展示出来。单个词在文本中出现的次数多,则词云的字体就越大。相反当单个单词在文本中出现的次数越少,则词云的字体就越小

    3.5、WordFrequency
    这里统计的是输入文本中每一个单词出现的单词频率。
    详细的界面效果如下所示
    image

    4、项目设计思路
    本项目的实现思路如下流程图所示:
    image
    这里的model采用的是深度学习中比较基础的全连接网络实现的。
    数据使用的是开源数据数据集IMDB,然后用户界面采用的是Flask结合着echarts实现的。可以看到数据和模型算法都是比较容易实现的。所以我建议大家还是需要多多练习实践,只有实践,才可以对代码有更加深刻的理解。
    5、运行环境介绍
    环境:windows+anaconda
    主要的python库如下:
    Flask 3.0.0
    torch 1.8.2+cu102
    torchaudio 0.8.2
    torchdata 0.7.1
    torchtext 0.9.2
    torchvision 0.9.2+cu102
    说明:运行本项目cpu版本的torch也是可以运行的,但是建议使用GPU进行

    6、运行项目:
    首先在项目目录下打开cmd,然后输入:python model.py
    当然了,你也可以在pycharm中直接run
    等待项目启动就可以了。项目启动可能会慢一点,这是由于代码需要加载数据集和模型,但是之后的使用还是比较快的,包括模型的识别速度。
    image
    之后,在terminal中会有一个url,如下所示:
    http://127.0.0.1:5000/
    我们给这个url输入到网页中回车,就可以访问了
    image

    之后正常使用就可以了
    源码链接:https://mp.weixin.qq.com/s/BaVceEarnNHXHQw8yIHVvQ
    最后说明:
    由于笔者能力有限,所以在描述的过程中难免会有不准确的地方,还请多多包含!

  • 相关阅读:
    开箱即用的工具函数库xijs更新指南(v1.2.6)
    微服务实战 01 微服务的发展史
    wget什么意思
    计算机毕业设计之java+ssm手机综合类门户网站
    YOLOv8快速复现 训练 SCB-Dataset3-S 官网版本 ultralytics
    Linux下apache日志(按日期存放)分析与状态查看方法
    2023第六届山东国际青少年眼睛健康产业展会,视力矫正仪展②
    JS-37-jQuery06-ajax
    JS执行上下文与闭包的理解
    VMware和Debian下载
  • 原文地址:https://www.cnblogs.com/taotaoName/p/17904914.html