• Coeus: A System for Oblivious Document Ranking and Retrieval


    Coeus: A System for Oblivious Document Ranking and Retrieval


    Abstract

    给定一个私有字符串Q和一个保存一组公共文档D的远程服务器,如何在没有任何人(甚至服务器)了解Q或文档的情况下选择和查看D中与Q最相关的K个文档之一? 这就是不经意的文档排序和检索问题。 在本文中,我们描述了解决这个问题的系统COEUS。 在较高的层次上,Coeus组成了两个密码原语:一个是安全矩阵-向量积,用于使用广泛使用的术语频率-反向文档频率(TF-IDF)方法对文档相关性进行评分;另一个是私有信息检索(PIR),用于对文档进行遗忘检索。 然而,COEUS减少了运行这些协议的时间,从而改善了用户感知的延迟,这是一个关键的性能指标。 COEUS首先通过将私有元数据检索与文档检索分离来降低PIR开销,然后通过一系列新颖的密码学改进将安全的矩阵向量积扩展为包含几千亿个元素的TF-IDF矩阵。 对于包含500万个文档的英语维基百科语料库、64K关键词的关键词词典以及AWS上143台机器的集群,Coeus使用户能够在3.9秒内忘记地对文档进行排序和检索–比基准系统提高了24倍。


    1 Introduction

    作为一个激励的例子,以Ziv为例,她认同一个非二元性别,选择对一个保守的家庭保密,并认为维基百科是一个可靠的信息来源。 Ziv想参加一个特定性别的活动,并希望在参加之前阅读该活动的历史。 像往常一样,Ziv打开Wikipedia,输入一个搜索

  • 相关阅读:
    MATLAB数组
    Django--models.py
    /proc/meminfo参数说明
    互联网公司都怎么实现分页的,拿 MySQL 使劲Limit?
    图像配准之图像重采样
    如何在两个月内学会Python编程?——最佳学习计划指南
    springboot:视图渲染技术
    小米、Vivo、Oppo后台弹出界面权限检测
    如何读书
    【Designing ML Systems】第 2 章 :机器学习系统设计简介
  • 原文地址:https://blog.csdn.net/tianyi520jx/article/details/126827160