• 词频统计


    第1关:读取文件

    任务描述
    本关任务:编写一个读取文件的小程序。

    相关知识
    问题描述
    《谁动了我的奶酪?》是美国作家斯宾塞·约翰逊创作的一个寓言故事,该书首次出版于1998年。书中主要讲述4个“人物”——两只小老鼠“嗅嗅(Sniff)”、“匆匆(Scurry)”和两个小矮人“哼哼(Hem)”、“唧唧(Haw)”找寻奶酪的故事。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬、

    请按照函数的注释,补充程序中缺失部分语句,按要求实现如下程序功能:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

    read_file()函数将文件中的内容读为字符串,过滤掉中文,只保留文件中的英文字母和西文符号(只保留ASCII码字符)。所有字符转为小写,将其中所有标点、符号替换为空格。‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

    提示
    通过本关,你可能需要用到以下函数

    ord© – 参数c为字符,返回值是对应的十进制整数(对应的 ASCII 数值)。
    string.punctuation – 无参,返回所有标点符号。
    参考资料:‪‬‪‬‪‬‪‬‪‬‮‬‪‬‭‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬

    【ASCII 码表

    0000-007F(0-127):C0控制符及基本拉丁文 (C0 Control and Basic Latin)
    0080-00FF(128-255):C1控制符及拉丁文补充-1

  • 相关阅读:
    Win10:禁用 Automatic Restart on System Failure
    比较Hive数据库与MySQL数据库
    单例设计模式
    uniapp 测试 app 到安卓模拟器部署方法以及常见错误解决 无废话
    Python与数据库存储
    安装独立版 Python
    Web Component-自定义元素的生命周期
    Centos7安装mysql8.0教程
    洛谷千题详解 | P1008 [NOIP1998 普及组] 三连击【C++、Java、Python语言】
    新概念英语第二册(83)
  • 原文地址:https://blog.csdn.net/Junds0/article/details/128039945