1.【开源】无忧企业文档文库管理界面介绍
2.在 Rainbond 上使用在线知识库系统zyplayer-doc
3.深入 Dify 源码,企业定位知识库检索的知识大模型调用异常
4.深入 Dify 源码,洞察 Dify RAG 核心机制
【开源】无忧企业文档文库管理界面介绍
无忧企业文档是软开企服推出的集成知识库、网盘、码企在线协同功能的业知源码办公软件,提供免费开源版本及具备丰富功能的识库病毒c语言源码商业版。开源版本在社区提供完整源码,企业商业版同样支持源码获取,知识适用于中小企业。库源
文件管理界面概览
文档采用目录资源管理方式,码企文库界面提供文件列表、业知源码预览及操作区域,识库方便用户管理及查看文件。企业
目录管理
支持手动拖动目录调整顺序,知识双击目录项可直接修改文件名称,库源实现高效便捷的文件组织。
预览功能
文档预览界面提供详细操作选项,包含分享文档功能。可以搜索目录源码
文档分享
简单快速分享文档给特定人员查看,提高工作效率。
设置分享
在文档预览页面点击分享按钮,进入分享设置界面,可选择发送二维码、链接或生成加密分享链接,链接可重生成,确保文件安全。
文件阅读权限
PC端访问带密码的分享文件需输入密码,移动端同样需输入密码阅读带有密码保护的文档。
分享记录
分享记录展示已分享过的文档,方便追踪文件传播情况。
在线演示:访问knowledge.bctools.cn
开源代码库:访问gitee.com/software-mini...
在 Rainbond 上使用在线知识库系统zyplayer-doc
zyplayer-doc 是一款适合企业和个人使用的WIKI知识库管理工具,提供在线化的知识库管理功能,专为私有化部署而设计,最大程度上保证企业或个人的数据安全,可以完全以内网的bootstrap会员页面源码方式来部署使用它。
当然也可以将其作为企业产品的说明文档来使用,支持一键将整个空间的内容开放到互联网,并提供有不同风格的开放文档页样式可供选择,省去您为了产品的说明文档而去定制开发一个系统的成本。
本文将介绍通过 Rainbond 部署在线知识库系统 zyplayer-doc 的两种方式,使用 Rainbond 开源应用商店一键部署和通过源代码部署。
部署 zyplayer-doc 安装 Rainbond
Rainbond 是一个云原生应用管理平台,使用简单,不需要懂容器、Kubernetes和底层复杂技术,支持管理多个Kubernetes集群,和管理企业应用全生命周期。主要功能包括应用开发环境、应用市场、微服务架构、应用交付、应用运维、快发卡平台源码应用级多云管理等。
可通过一条命令快速安装 Rainbond。
通过应用商店部署 zyplayer-doc
zyplayer-doc 已经发布到 Rainbond 开源应用商店,用户可通过开源应用商店一键安装 zyplayer-doc。
在 Rainbond 的「平台管理 -> 应用市场 -> 开源应用商店」 中搜索 zyplayer-doc 并安装。
部署完成后拓扑图如下。
可通过 Rainbond 默认提供的域名访问zyplayer-doc,访问需要加后缀 /zyplayer-doc/,如:/zyplayer-doc/,默认用户密码 「zyplayer/」。
通过源码部署 zyplayer-doc
zyplayer-doc 是由 Java 编写的 SpringBoot 项目,Rainbond 对于 Java 项目可以通过识别项目的 pom.xml 文件来进行模块的打包以及构建和部署,实现一键式体验。
部署 MySQL
zyplayer-doc 需要使用 MySQL 服务,可以通过 Rainbond 开源应用商店快速部署 MySQL。
在 Rainbond 的「平台管理 -> 应用市场 -> 开源应用商店」 中搜索 mysql 并安装,可选择安装 5.7 或 8.0 版本。McST公式指标源码
源码部署 zyplayer-doc
修改zyplayer-doc-manage/src/main/resources/application.yml配置文件,连接信息可在 MySQL 组件中的依赖信息查看。
进入到团队/应用内,选择通过源码创建组件。
然后 Rainbond 会检测出来为多模块项目,选择zyplayer-doc-manage 并进行构建,其他模块都是依赖项,是不可运行的。
编排服务
在应用内 -> 切换到编排模式,将 zyplayer 组件依赖至 MySQL 组件,这样 MySQL 组件会将自身的环境变量注入到 zyplayer 中,zyplayer 组件就可以通过配置文件中的环境变量连接到 MySQL 数据库。
然后更新 zyplayer 组件即可。
最后通过 Rainbond 默认提供的域名访问zyplayer-doc,访问需要加后缀 /zyplayer-doc/,如:/zyplayer-doc/,默认用户密码 「zyplayer/」。
深入 Dify 源码,定位知识库检索的大模型调用异常
深入分析Dify源码:大模型调用异常定位
在使用Dify服务与Xinference的THUDM/glm-4-9b-chat模型部署时,遇到了知识库检索节点执行时报错大模型GPT3.5不存在的问题。异常出乎意料,因为没有额外信息可供进一步定位。 通过源码和服务API调用链路的分析,我们发现问题的关键在于知识库检索的实现。该功能在api/core/rag/datasource/retrieval_service.py中,其中混合检索由向量检索和全文检索组成。我们关注了关键词检索、向量检索和全文检索这三个基础检索方式:关键词检索:仅使用jieba进行关键词提取,无大模型介入。
向量检索:通过向量库直接搜索,如Milvus,无大模型调用。
全文检索:使用BM,大部分向量库不支持,实际操作中返回空列表。
问题出现在知识库检索节点的多知识库召回判断中,N选1召回模式会调用大模型以决定知识库。在配置环节,前端HTTP请求显示配置错误,使用了不存在的GPT3.5模型。 经测试,手工创建的知识库检索节点使用了正确的glm-4-9b-chat模型,问题出在默认模板的配置上,即N选1召回模式默认选择了GPT3.5。本地部署时,如果没有配置相应模型,会导致错误出现。 总结来说,解决方法是修改默认模板,将知识库检索的默认模式改为多路召回,这样可以避免新手在本地部署时遇到困扰。建议Dify官方在模板中改进这一设置,以简化用户部署流程。深入 Dify 源码,洞察 Dify RAG 核心机制
深入探究Dify源码,揭示RAG核心机制的关键环节 在对Dify的完整流程有了初步了解后,发现其RAG检索效果在实际部署中不尽如人意。因此,针对私有化部署的Dify,我结合前端配置和实现流程,详细解析了技术细节,旨在帮助调整知识库配置或进行定制化开发。Docker私有化部署技术方案
本文重点聚焦于Dify docker私有化部署的默认技术方案,特别是使用Dify和Xinference的GPU环境部署。若想了解更多,可查阅Dify与Xinference的集成部署教程。RAG核心流程详解
Extractor:负责原始文件内容的提取,主要在api/core/rag/extractor/extract_processor.py中实现。分为Dify默认解析和Unstructured解析,后者可能涉及付费,通常Dify解析更为常用。
Cleaner:清洗解析内容,减少后续处理负担,主要基于规则进行过滤,用户可在前端进行调整。
Splitter:文件分片策略,Dify提供自动和自定义两种,影响检索效果。
Retrieval:Dify支持多种检索模式,包括关键词检索和向量数据库检索,向量库的选择对效果有很大影响。
Rerank:对检索结果进行排序,配置Top K和score阈值,但存在设计上的不足。
总结与优化建议
Dify的RAG服务提供了基础框架,但性能优化空间大。通过调整配置,特别是针对特定业务场景,可以改善检索效果。对RAG效果要求高的用户,可能需要进行定制化的二次开发和优化。