Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor

Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor

本文是LLM系列文章，针对《Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor》的翻译。
@TOC

摘要

指令调优使预训练的语言模型能够从推理时间的自然语言描述中执行新的任务。这些方法依赖于以众包数据集或用户交互形式进行的大量人工监督。在这项工作中，我们介绍了非自然指令:一个创造性和多样化指令的大型数据集，几乎没有人工劳动。我们收集了64,000个例子，通过提示一个语言模型，其中包含三个指令的种子例子，并引出第四个。然后通过提示模型重新表述每个指令来扩展该集合，创建总计约240,000个指令、输入和输出示例。实验表明，尽管包含了相当数量的噪声，但在非自然指令上的训练可以与在开源人工管理数据集上的训练相媲美，在各种基准测试中超过了T0++和Tk-Instruct等模型的性能。这些结果证明了模型生成数据作为一种经济有效的方法的潜力替代众包的数据集扩展和多样化。

1 引言

 2 数据收集

 3 数据分析

 4 实验设置

 5 结果

 6 生成模型消融

 7 相关工作

 8 结论

我们介绍了非自然指令，这是一个自动生成的自然语言指令数据集及其相应的输入和输出。据我们所知，这是第一个自动生成的通用NLP数据集。我们的实验表明，在多个基准测试中，在非自然指令上训练的模型优于在手动注释数据集上训练的模型。
相关阅读:
【Python刷题篇】——Python入门 011面向对象（一）
CN考研真题知识点二轮归纳（5）
入股合作协议要不要写章程
 STM32个人笔记-RS485通讯
 1.6、计算机网络的性能指标(2)
Azure Arc 概要：功能、管理和应用场景详解，AZ900 考点示例
 IBM Semeru Windows 下的安装
 用友BIP 安装配置专业脚手架开发工具（图文）
生成扩散模型漫谈：最优扩散方差估计（上）
基于JAVA的房屋租赁系统平台【数据库设计、源码、开题报告】
原文地址：https://blog.csdn.net/c_cpp_csharp/article/details/133863773

摘要

1 引言

2 数据收集

3 数据分析

4 实验设置

5 结果

6 生成模型消融

7 相关工作

8 结论