• 文娱行业搜索最佳实践


    内容搜索的价值主要体现在两个方面:

    对用户而言,用户将搜索作为寻找内容的工具,目标是“搜的到,搜的准”。用户更关心搜索结果的相关性、时效性和多样性。

    对平台而言,搜索是内容消费、流量引导的核心入口,目标是提升用户满意度与留存率。更进一步,搜索还能支持平台的宣发和商业价值,实现业务增长与流量变现。

    常见文娱搜索场景

    1. 新闻、资讯搜索
    2. 社区、论坛、话题搜索
    3. 影音娱乐搜索
    4. 在线阅读小说、网漫、文章搜索
    5. 图像、视频搜索

    文娱搜索业务特点

    • 搜索效果需保证时效性和个性化
    • 涉及多频道、多类别,内容覆盖广泛,需要精准理解用户搜索意图
    • 热搜、下拉提示等搜索引导功能流量占比高
    • 可能有文字、语音、图像、视频综合的多模态搜索需求

    搜索痛点

    1. 用户用词规范程度参差不齐,文本内容复杂,用户意图理解要求高
    2. 内容垂类特殊,需要行业数据积累,分词和查询分析难度大
    3. 千人千面的的个性化搜索,需要5人以上的算法团队持续投入,成本高,周期长
    4. 业务导向性差,无法通过搜索实现付费内容引导

    开放搜索内容文娱增强版解决方案

    内容文娱行业分词模型

    对于内容文娱行业,OpenSearch汇集多个相关数据来源,利用千万级数据训练了行业增强版分词模型。

    针对更加特殊的垂类业务场景,在原有分词算法模型基础上,支持基于业务数据的定制分词模型,提供专属文本分词器。

    文本通用版内容文娱版
    拜仁或将签下凯恩以接替莱万拜仁 或 将 签 下 凯恩 以 接替 莱 万拜仁 或 将 签 下 凯恩 以 接替 莱万
    夜兰配队夜 兰 配 队夜兰 配 队
    复联4高燃场面复 联 4 高燃 场面复联 4 高燃 场面
    彭昱畅和江疏影演情侣彭昱 畅和 江疏影 演 情侣彭 昱畅 和 江 疏影 演 情侣

    内容文娱行业向量模型

    相比传统文本搜索通过分词、同义词、纠错、词权重等算法技术增强语义搜索效果,基于深度学习的语义向量召回模型具备更强大的表征能力,可以更好地处理用户查询词中的简写、别名、拼写错误等情况。

    开放搜索OpenSearch和阿里达摩院合作自研的向量召回技术,在业界知名榜单MS MARCO上夺冠。

    结合文娱行业数据训练的向量召回模型目前已在OpenSearch对客户透出。

    query詹姆士绝杀
    向量召回 TOP 1詹姆斯绝杀
    向量召回 TOP 2詹姆斯不是绝杀?
    向量召回 TOP 3关于詹姆斯绝杀球
    query佐鸣
    向量召回 TOP 1鸣佐结局
    向量召回 TOP 2鸣人喜欢佐助哪点
    向量召回 TOP 3鸣人和佐助谁更强?

    内容文娱行业CTR排序模型

    针对内容文娱行业往往个性化诉求和实时性需求较高。比如不同用户兴趣爱好的引导、以及当天的热点事件引导。

    CTR预估模型充分结合行业特点,保障搜索个性化建模和内容实时性。整体网络框架如下:

    CTR预估模型可以根据客户特点和诉求做对应模型定制和链路定制,以达到更优业务转化效果。

    球鞋爱好者搜:科比粉丝搜:科比8.24当天搜:科比
    科比那些年穿过的球鞋科比10佳投篮精彩瞬间球迷致敬科比
    科比同款球鞋体验科比的一天科比头像
    科比8球鞋评测巅峰科比实力到底有多强?科比永远的MVP

    案例实践

    某文娱资讯平台,原自建搜索存在搜不准,跳出率较高等问题,直接影响用户体验和用户粘性。通过接入开放搜索OpenSearch 15天快速实现搜索效果各项指标的提升。

    1. PV-CTR提升超过10%,UV-CTR提升超过5%,有点击PV占比提升超过5%
    2. 具备语义向量模型能力,针对长文本复杂关键词也可准确返回语义相关文档
    3. 个性化排序模型,支持千人千面的搜索结果展示

    原文链接

    本文为阿里云原创内容,未经允许不得转载。

  • 相关阅读:
    信息物理系统状态估计与传感器攻击检测
    计算机网络——OSI参考模型
    Springcloud介绍
    力扣(LeetCode)124. 二叉树中的最大路径和(C++)
    阿里云dataworks中业务流程中问题(odps2)
    高速信号处理板资料保存:383-基于kintex UltraScale XCKU060的双路QSFP+光纤PCIe 卡设计原理图
    python 线程池ThreadPoolExecutor
    CSDN 第六期编程竞赛做题记录
    定义丈夫类Husband 和妻子类Wife
    这一次,称重软件查询功能完整了
  • 原文地址:https://blog.csdn.net/weixin_43970890/article/details/126780152