Are Large Language Models Really Robust to Word-Level Perturbations?

本文是LLM系列文章，针对《Are Large Language Models Really Robust to Word-Level Perturbations?》的翻译。

大型语言模型真的对单词级扰动具有鲁棒性吗？

摘要
1 引言
2 相关工作
3 合理稳健性评价的奖励模型（TREvaL）
4 LLM的词级鲁棒性评价
5 讨论
6 结论
7 局限性

摘要

大型语言模型（LLM）的规模和功能的迅速发展使其成为各种下游任务的有前途的工具。除了追求更好的性能和避免对某个提示的暴力反馈外，为了确保LLM的责任，LLM的稳健性也受到了关注。然而，现有的评估方法大多依赖于具有预定义监督标签的传统问答数据集，这与当代LLM的优越生成能力不符。为了解决这个问题，我们提出了一种新的理性评估方法，该方法利用预先训练的奖励模型作为诊断工具，来评估LLM从更具挑战性的开放问题中产生的较长对话，我们称之为合理稳健性评估的奖励模型（TREvaL）。较长的对话表明࿰

相关阅读:
模态贡献量在汽车NVH分析中的案例应用
《非线性成长》阅读笔记
SPASS-曲线估计
幻核退出 “数字藏品有何用”阶段性无解
docker 开发编译环境搭建
辅助驾驶功能开发-上游需求篇(8)-地平线J2感知性能解析
竞赛选题深度学习手势检测与识别算法 - opencv python
【机器学习】关于人工智能你必须知道的概念
MySQL高级-MVCC（超详细整理）
基于 Bresenham 算法画圆

原文地址：https://blog.csdn.net/c_cpp_csharp/article/details/133990712