文章预览
基于LLM的生成式搜索引擎(Generative Search Engines)正在取代传统搜索引擎。答案引擎不仅检索与用户查询相关的来源,还综合引用这些来源的答案摘要。 来自PSU与Salesforce AI Research的研究者们联合21名参与者进行了一项研究:评估答案引擎与传统搜索引擎的交互,识别出了16个答案引擎的局限性,提出了16个答案引擎设计建议,并与8个指标相关联。 在3个流行的引擎( You.com 、 Perplexity.ai 、BingChat)上实施了自动化评估,量化了常见的局限性(例如,频繁的幻觉、不准确的引用)和独特的特征(例如,答案信心的变化),包括总结了研究中发现的关于答案引擎的关键局限性,并将这些局限性归类为四个主题:答案文本(Answer Text)、引用(Citation)、来源(Sources)和用户界面(User Interface)。其中: I.答案文本 (Answer Text) 客观细节欠缺(A.I) 缺乏全面观点(A.II) 自信语
………………………………