【智问 Askture】—降低企业成本,定制一个专属自己的ChatGPT!

2023-09-05 15:00


    知识库需求在各行各业中普遍存在,例如制造业中历史故障知识库、游戏社区平台的内容知识库、电商的商品推荐知识库和医疗健康领域的挂号推荐知识库系统等。为保证推荐系统的实效性和准确性,需要大量的数据/算法/软件工程师的人力投入和包括硬件在内的物力投入。


为了进一步提高搜索准确率,引导用户搜索描述更加准确和充分利用用户行为优化搜索引擎伊克罗德推出了一款基于智能搜索引擎+大语言模型的企业知识库解决方案——智问 Askture,能够通过向量搜索和自然语言处理,为用户提供基于知识库语料的内容检索和精准问答。


关于「智问-Askture」

「智问-Askture」的特点有哪些?

1. 基于 OpenSearch 或 Kendra 构建存储知识库文档的向量数据库;


2. 使用多种文本处理算法训练和微调构建语义理解层;


3. 基于 React 的 Gradio WebUI 前端访问界面,部署在 EC2 上,以便用户通过网页或 REST API 的形式进行文档搜索;


4. 提供历史查询记录功能,通过 Session ID 可实现多轮对话功能与历史追溯;


5. 解决方案以轻量化、插件式提供,可作为服务独立使用,也可作为插件与其他服务结合,形成端到端的完整应用;


6. 可进行引导式机制搜索,提高搜索输入描述的精准度;


7. 即使用户问题在知识库里未找到答案,也会基于目前存在的通用基础语料输出通用答案。


解决方案架构图

该方案集成了一系列亚马逊云的服务构建:

● 基于 EC2 构建网页/API 访问入口;

集成 API Gateway 和 Lambda 函数的实现前端和后端搜索引擎、数据库、模型推理端点交互;

● 使用 OpenSearch 或 Kendra 作为向量数据库,自动持续迭代向量索引,采用引导式搜索机制,提高输出匹配精准度;

● 数据源存放在 S3 上,OpenSearch

/Kendra 通过连接器获取数据对象;

● 采用 SageMaker 的 Notebook 或 Lambda 将原始数据向量化,并注入 OpenSearch/Kendra;

● 历史查询记录存储在DynamoDB 中。


产品使用效果

此方案的问答界面比较简单,也非常易用,主要由左边的参数输入部分以及右边的答案生成部分组成。

问答界面:

调参界面:

左边为参数输入部分,除 Query 外其余参数可以不用输入使用默认值:

1. Prompt:提示词。方案有使用默认提示词,如需对提示词修改调优,需要保留{question}和{context}字段,其他字段可以任意修改;


2. Search engine:方案支持 2 种搜索引擎,分别为 OpenSearch 和 Kendra。


3. Top_k of source text:查找与问题相关的文档数量。查找到的相关文档将组合成 Prompt 后送到大模型推理,默认有1-4可以选择。


4. Confidence:答案置信度,有三种类型:

⦁ query_answer_scoer:计算问题与答案的相似度;

⦁ answer_docs_score:计算答案与相关文档的相似度;

⦁ docs_list_overlap_score:计算问题相关文档与答案相关文档的重合率;

最终会根据选择的计算类型,在 Confidence 栏输出答案置信度的计算结果。


5. Source:根据问题找到的相关文档,输出相关文档的来源标题、相关分数和具体文本内容。


6. Url:请求的 Url,用于检查请求参数是否正确。


7. Request Time:请求时长。


是什么支撑「智问-Askture」给用户提供基于知识库语料的内容检索和精准问答?

01

企业知识库系统 KB

知识库(Knowledge Base)是一种用于知识管理的特殊的数据库,以易于相关应用领域知识的收集、重新整理以及抽取。


构筑企业知识库系统能将知识进行有条理的管理,累积和留存信息及知识资产,加速内部信息及知识的流通,实现组织内部知识和资源的高效共享。


企业知识库产品在制造、医疗健康、教育、IT/HR、法律、游戏、电商等各行各业都有丰富的应用场景。并且知识库产品不受企业规模的限制,任何规模的企业都需要管理自己的知识与信息资产。

02

文本处理算法

智问使用的文本处理算法(Text processing algorithms)是基于自然语言处理(NLP)技术的算法,旨在理解和生成人类语言。它们基于大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。此算法的特点是拥有规模庞大的参数,通常为亿级以上,帮助它们学习语言数据中的复杂模式。


经过训练优化的算法能够模拟人类语言习惯、理解自然语义关系并生成相应回复。并且可以不断输入数据集、不断迭代优化算法,以提升其知识储备和理解能力,从经验中学习并进一步增强其表达和推理能力。其广泛的知识储备也可以适用于不同领域的问题解决和知识推断,应用范围十分丰富。

03

向量 Vector & 向量数据库 VDB

在一个神经网络中,每个节点传输数据的权重,就是向量(Vector)。 因此对于文本处理算法而言,一个最基本的语义的传输单元,就是一个向量。任何信息都可以用向量的方式表征它的语义,因此向量是任何非结构化数据在 AI 中语义表达的最根本的表达形式和基本的数据单元。


向量数据库(Vector Database)是一种能提供标准 SQL 访问接口,并且能够高效存储,检索,分析向量的数据库。通常向量数据库基于传统关系型数据库发展而来,但数据规模超过传统的关系型数据库,提供高模糊查询算力,兼顾低时延与高并发等特性。


因此,我们将知识库的语料向量化后,存在向量数据库中,等到需要时再在向量数据库中做语义的检索和管理,就能够极大地提升智能搜索引擎知识库的检索效率和准确率。


「智问 Asksture」应用场景

各行各业中有很多场景需要基于企业知识库进行搜索和问答。

智问-Askture四大核心内容:智能搜索、智能问答、智能引导、智能优化可以多方面低应对各行业的场景。

01

制造业

使用历史维保记录和维修手册构建企业知识库,维修人员依靠该知识库定位问题和维修   

02

IT/HR

使用企业内部 IT/HR 使用手册构建企业知识库,企业内部员工可通过知识库快速解决在 IT/HR 上遇到的问题 。   

03

电商

使用商品信息构建商品数据库,消费者通过检索+问答快速了解商品的详细信息。

04

游戏

使用游戏的信息(例如游戏介绍,游戏攻略等)构建知识库,给予知识库自动回复玩家提供的问题。

05

客服

通过与呼叫中心/聊天机器人服务结合,可自动基于企业知识库就客户提出的问题进行聊天回复。

06

教育

使用教材和题库构建不同教育阶段的知识库,模拟和辅助老师/家长对孩子进行教学。

07

法律

记录法律条文与历史判例,快速检索资料,给出法律建议参考。


「智问-Askture解决方案」支持服务计划

支持级别

Basic

Pro

价格

$650/人/天

$950/人/天

支持时间

5*8

5*8

SLA

一般指导:<24H

系统受损:<12H

一般指导:<24H

系统受损:<12H

生产力受损:<4H

支持语言

中文(语言/文字)

英文(文字)

中文(语言/文字)

英文(文字)

架构师级别

助理级

专业级

支持形式

线上/线下

线上/线下

上述服务支持计划中,都包含以下服务内容:

原始语料导入支持

向量数据库引擎选择(OpenSearch/Kendra)

文本处理算法引擎选择

提示词优化

另有以下服务项目,根据客户情况可选:

原始语料优化指导(调整原始语料格式、数据结构等)

向量数据库引擎优化(优化向量索引,提升查询速度和准确性)

算法兼容性定制(接入Bloom等中文模型))

前端界面定制调整(主题、UI 元素等定制)

服务架构定制化调整(定制化调整服务部署方式、功能实现逻辑等))

伊克罗德信息专业定制化服务

(请洽400-002-0885)


云与应用现代化
——
扫描关注微信公众号
获取更多云端资讯
联系我们
——

模板表单-2(1)

  • 姓名*

  • 电话*

  • 邮箱*

  • 公司*

  • 职称*

  • 地址*

  • 需求*