• 时隔一年的测评:gpt3.5发展到什么程度了?


    名人说:一花独放不是春,百花齐放花满园。——《增广贤文》
    作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)

    ★观前提示以下内容仅为测试内容,不代表未来新版本如何测试体验,只讲述体验,本篇文章不做对比。

    在人工智能领域,OpenAI的GPT(Generative Pre-trained Transformer)系列模型已经成为了一个名扬四海的名称。ChatGPT-3.5,作为这一系列的一个里程碑,不仅在技术界引起了广泛的关注,也在普通用户中掀起了一股学习和探索的热潮,这就不禁引发了一系列思考:
    在这里插入图片描述

    一、简要介绍

    1、chatgpt是什么?

    在这里插入图片描述
    ChatGPTOpenAI开发的大语言模型,属于GPT(Generative Pre-trained Transformer)系列的一部分。它通过深度学习技术和大量数据训练,能够理解和生成自然语言文本。ChatGPT可以应用于多种场景,包括但不限于客户服务、教育辅导、内容创作等。

    2、主要特点
    • 理解和生成文本:ChatGPT能够根据输入的文本理解上下文,并生成连贯、相关的回答。
    • 多样化应用:它可以用于问答系统、文本摘要、文章写作、编程代码辅助、语言翻译等多个领域。
    • 自然语言处理:ChatGPT在自然语言处理(NLP)方面表现出色,能够处理复杂的语言特征,包括语法、句式结构等。
    • 持续学习:虽然ChatGPT在部署后的学习能力有限,OpenAI定期更新模型,以包含新的数据和改进算法,使其性能持续提升。
    3、工作原理

    ChatGPT的工作原理基于Transformer架构,这是一种深度学习模型,特别适用于处理序列化的数据,如文本。

    模型通过“注意力机制”来理解文本中的每个词与其他词之间的关系,这使得ChatGPT能够生成连贯且相关性强的文本。

    4、应用限制

    尽管ChatGPT在多个领域表现出色,但它也有一些限制,例如:

    • 信息时效性:ChatGPT的知识是到训练数据截止日期为止的,对于之后发生的事件或信息可能不了解。
    • 误解与错误:尽管准确率较高,ChatGPT仍可能产生误解或错误信息,特别是在处理复杂问题或缺乏明确上下文时。
    • 创造性限制:虽然能够生成新颖的文本,但ChatGPT的创造性受到训练数据的限制,它的“创意”来自于已经存在的信息组合。
    5、使用方法

    官网注册使用即可:chatgpt官网

    在这里插入图片描述

    了解了以上内容之后,咱们一起去测试体验一下:

    二、分类问题测试

    测试采用多类问题提问,以检验其多方面的功能。

    1、基础问答(5个)
    • Q1: 澳大利亚的首都是哪座城市?(✔)

    在这里插入图片描述

    • Q2: 地球与太阳之间的距离是多少?(✔)
      在这里插入图片描述
    • Q3: 水的沸点是多少度?(✔)
      在这里插入图片描述
    • Q4: 比萨斜塔在哪个国家?(✔)
      在这里插入图片描述
    • Q5: 世界上最长的河流是哪一条?(✔)
      在这里插入图片描述

    从回答来看,5个问题均正确✔,相比刚发布时gpt3.0出现常识性错误,正确率高了不少。

    2、数学题解答(5个)
    • Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)
      在这里插入图片描述

    • Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)

    在这里插入图片描述

    • Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)
      在这里插入图片描述
      在这里插入图片描述
    • Q4:在平面直角坐标系中,曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x36x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)
      在这里插入图片描述
      在这里插入图片描述

    这题虽然解对了,其实用到了一些高等数学的知识,这里要注意,高中数学涉及的并没有那么广泛。

    • Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✖)

    在这里插入图片描述

    正确答案:6

    3、逻辑推理(5个)
    • Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)

    在这里插入图片描述

    • Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
      在这里插入图片描述
    • Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✖)

    在这里插入图片描述

    正确答案:500kg。1000kg蘑菇含水量99%,就是水重990kg,固体蘑菇10kg。降到含水量98%就是固体蘑菇只占2%,然后用10除以2%就能得出蘑菇重量是500kg。所以答案是晒干了500kg水。

    • Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)

    在这里插入图片描述

    正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。

    • Q5: 72、36、24、18、( )(✖)
      在这里插入图片描述

    正确答案:14.4

    4、创造性写作(3个)
    • Q1: 请续写一个故事开头:“在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了……”
      在这里插入图片描述

    写的有模有样,这一年进步了不少。

    • Q2: 编写一首关于秋天落叶的五言律诗。

    在这里插入图片描述

    押上了居然,就是意境表达的有些冗杂。

    • Q3: 写一个关于人工智能与人关系的短篇小说。
      在这里插入图片描述

    现在小说的前后逻辑性也更连贯了,牛!

    5、代码编写(3个)
    • Q1: 用Python编写一个函数,用于判断一个数是否为质数。
      在这里插入图片描述
      gpt所写代码如下:
    def is_prime(number):
        if number <= 1:
            return False
        if number <= 3:
            return True
        if number % 2 == 0 or number % 3 == 0:
            return False
        i = 5
        while i * i <= number:
            if number % i == 0 or number % (i + 2) == 0:
                return False
            i += 6
        return True
    
    # 测试
    print(is_prime(5))  # 输出: True
    print(is_prime(10)) # 输出: False
    print(is_prime(17)) # 输出: True
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18

    在这里插入图片描述

    • Q2: 用Python编写一个程序,检查一个字符串是否为回文(正读反读都一样的词)。
      在这里插入图片描述
      gpt所写代码如下:
    def is_palindrome(s):
        # 去除字符串中的非字母字符并转换为小写
        s = ''.join(c.lower() for c in s if c.isalnum())
        # 检查字符串是否等于其反转
        return s == s[::-1]
    
    # 测试
    print(is_palindrome("A man, a plan, a canal, Panama"))  # 输出: True
    print(is_palindrome("racecar"))                        # 输出: True
    print(is_palindrome("hello"))                          # 输出: False
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10

    在这里插入图片描述

    测试了下,成功运行并得到正确反馈。

    • Q3: 用Python编写一个程序,实现二叉树的深度优先搜索(DFS),并返回所有节点的遍历顺序。
      在这里插入图片描述
    class TreeNode:
        def __init__(self, value):
            self.value = value
            self.left = None
            self.right = None
    
    def dfs(root):
        if root is None:
            return []
        stack = [root]
        result = []
        while stack:
            node = stack.pop()
            result.append(node.value)
            if node.right:
                stack.append(node.right)
            if node.left:
                stack.append(node.left)
        return result
    
    # 测试
    # 构造二叉树
    root = TreeNode(1)
    root.left = TreeNode(2)
    root.right = TreeNode(3)
    root.left.left = TreeNode(4)
    root.left.right = TreeNode(5)
    root.right.left = TreeNode(6)
    root.right.right = TreeNode(7)
    
    print(dfs(root))  # 输出: [1, 2, 4, 5, 3, 6, 7]
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31

    在这里插入图片描述

    6、对话理解与情感交流(2个)
    • Q1: 我今天心情不好,能给我讲个笑话吗?
      在这里插入图片描述

    虽然挺冷的,但是我确实笑了。

    • Q2: 你能帮我分析一下最近压力大的原因,并提供缓解压力的方法吗?

    在这里插入图片描述

    给的方法还不错,现在语言逻辑相比一年前也更好了。

    7、翻译任务(1个)
    • Q: 将这段文字翻译成英语:“张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险,克服重重困难,两次出使西域,开通了中国同西亚和欧洲的通商关系,将中国的丝和丝织品运往西亚和欧洲,开拓了历史上著名的“丝绸之路”。同时,他又将西域的风土人情、地理文化以及特有物种等介绍到中原,极大地开阔了人们的视野。
      正如历史学家所指出的那样,如果没有张骞出使西域,就不可能有丝绸之路的开辟,也就不会有汉朝同西域或欧洲的文化交流。”(六级翻译原题

    在这里插入图片描述

    • Q: 再将这段英语翻译成中文

    在这里插入图片描述

    可以看出,文本翻译的效果还是不错的。

    8、策略规划(1个)
    • Q: 假设你是某初创公司的CEO,公司在市场扩张过程中遇到了资金短缺问题,你将如何制定一份详尽的战略计划,既保证业务持续增长又能吸引新的投资者?
      在这里插入图片描述

    这计划竟然有些合理?整体不错

    本次测评就到这里,接下来总结一下感受。

    三、测试感受

    gpt3.5相比于一年前,能力明显地得到了提升,但是要想替代很多岗位目前还是很难的,我们要有危机感,但不能杞人忧天,提升自身能力才是重点。

    放大了来说,GPT是自然语言处理领域的一个重要进展,通过模仿人类的对话方式,它在提供信息、协助文本创作等方面展现了巨大潜力。然而,gpt也有它的局限性,使用时要注意,以免造成不可挽回的损失。

    关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
    Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
    如果对大家有帮助的话,希望大家能多多点赞+关注!这样我的动力会更足!

  • 相关阅读:
    【科普】RPA技术架构:3大组成部分
    linux卸载jdk方法
    CSDN编程竞赛,让更多的人学会编程
    《Linux驱动:I2C驱动看这一篇就够了》
    设计模式 08 代理模式
    Python编程技巧 – 使用列表(list)
    Day130.MySQL高级:Liunx安装、三大范式、InnoDB、数据结构、B+树
    WEB自动化测试(6)—— 命令行运行Cypress
    基于Python+tkinter实现一个简易计算器桌面软件
    Linux安装Keepalived
  • 原文地址:https://blog.csdn.net/qq_51646682/article/details/136326361