前言
随着互联网时代的发展,表情包成为现在大家网上交流的必备工具,针对表情搜索的产品需求,经历了从ElasticSearch到Lucene再到结合语义的搜索实践之路。不同阶段的技术选型可能可以为大家提供一些中小体量业务垂直领域搜索的落地思路。
逗芽表情搜索
爱奇艺逗芽表情是一款通过视频AI算法算法,针对UGC、PGC等来源进行表情图片生产,并在爱奇艺内外部多渠道分发的创新产品。用户通过文字输入搜索好玩有趣的表情图片是逗芽的核心功能之一。
通过文字进行表情搜索常见的请求类别包括:
1. 实体名称,比如热门的明星名、角色名、影视剧名等,以及实体的别名与缩写;
2. 偏口语化的感情、动作描述,如“开心”,“抱抱”,“想睡了”等;
实体与动作的组合,如“加油蔡徐坤”,“虞书欣说的好”;
流行的梗、短语,如“奥力给”,“专业团队”,“我是谁我在哪”;
表达完整含义的句子,如“你好,很高兴认识你”。