数据分析

作者: digitforce 版本: 1.0.13 类型: 工具

概述

此插件通过自然语言交互实现无代码数据分析。它支持文本到SQL(Text2SQL)、文本到数据(Text2Data)和文本到代码(Text2Code)分析。只需上传Excel/CSV文件,即可自动执行数据查询、数据解释和数据可视化(ChatBI)。 新增支持多工作表查询和跨工作表分析,能够自动识别和解析多个工作表中的结构化数据,提升多工作表数据处理能力。该插件将通过对话式查询智能解析时间、指标和分析维度,生成SQL查询以获取数据,并创建交互式BI图表和结构化分析报告。优化用于标准化垂直数据集,由企业级分析引擎提供可靠结果。

配置

1. 申请API密钥

请在此处申请API密钥。

apply_apikey.png

2. 从市场获取数据分析工具

工具可在插件市场中找到,请进行安装。

3. 服务授权

set_apikey.png

工作流案例

以下是每个工具的参数描述和使用场景示例。

1. 数据连接器(data_connector)

用于连接主流数据库,如MySQL、PostgreSQL、Starrocks和Doris,允许用户使用自然语言查询数据库数据。检索到的数据可无缝集成到我们的其他工具中进行分析、解释和可视化。

查询结果支持下载为.xlsx文件,以便于本地查看和进一步处理。

💡 如果希望输出包含文件,请确保在流程的最后一个组件中添加“文件”输出类型以获取下载链接。

注意:为获得最佳浏览体验,默认限制结果为100行。处理大型数据集时,用户可使用工具提供的智能生成的SQL查询检索完整数据集。

输入参数描述示例
查询语句查询语句“搜索2024年6月30日的GMV数据”
数据库类型选择对应的数据库类型如图所示
数据库名称要连接的数据库/模式名称如图所示
数据库用户数据库连接的用户名如图所示
数据库密码数据库连接的密码如图所示
数据库IP数据库服务器的IP地址如图所示
数据库端口数据库连接的端口号如图所示
数据库名称要连接的数据库名称如图所示

示例输入:对于数据库URL为”mysql+pymysql://aaaadmin:aaaaL1e7L8D@168.195.188:11110/dify?charset=utf8”的情况,填写参数如下图所示。

data_connector_1_1.png

data_connector_1_2.png

输出参数描述示例
查询结果数据连接器的输出(包括SQL语句和以Markdown格式返回的查询结果)如图所示

data_connector_2.png

data_connector_3.png常见注意事项

2. 数据分析(data_analysis)

参数描述示例
查询语句查询语句“每个月最畅销的产品是什么?”
输入数据Markdown格式的表格数据(例如,文档提取器输出的表格Markdown文本)如销售表格示例所示
文件数据文件(xlsx、xls、csv)example.xlsx

注意:只需提供输入数据或文件之一。如果两者均提供,文件优先。文件类型支持行-指标-列数据文件和列-指标-行数据文件。

data_analysis_1.png

data_analysis_4.png查询结果支持下载为.docx文件,以便于本地查看和进一步处理。

💡 如果希望输出包含文件,请确保在流程的最后一个组件中添加“文件”输出类型以获取下载链接。

3. 数据解释(data_interpretation)

参数描述示例
查询语句查询语句“请提供简单的数据解释。”
输入数据Markdown格式的表格数据(例如,文档提取器输出的表格Markdown文本)如销售表格示例所示
文件数据文件(xlsx、xls、csv)example.xlsx

注意:只需提供输入数据或文件之一。如果两者均提供,文件优先。

data_interpretation_1.png

data_interpretation_4.png查询结果支持下载为.docx文件,以便于本地查看和进一步处理。

💡 如果希望输出包含文件,请确保在流程的最后一个组件中添加“文件”输出类型以获取下载链接。

4. 数据可视化(data_visualization)

参数描述示例
查询语句查询语句“以饼图显示每个产品的总销售额。”
输入数据Markdown格式的表格数据(例如,文档提取器输出的表格Markdown文本)如销售表格示例所示
文件数据文件(xlsx、xls、csv)example.xlsx

注意:只需提供输入数据或文件之一。如果两者均提供,文件优先。文件类型支持行-指标-列数据文件和列-指标-行数据文件。

data_visualization_1.png

data_visualization_4.png查询结果支持下载为.html文件,以便于本地查看和进一步处理。

💡 如果希望输出包含文件,请确保在流程的最后一个组件中添加“文件”输出类型以获取下载链接。

5. 时间识别(time_identify)

用于根据问题描述解析分析所需的时间范围。

参数描述示例
查询语句查询语句“显示过去7天的销售数据”
输出参数描述
开始时间时间范围的开始时间
结束时间时间范围的结束时间
时间点离散时间点(例如,2025年1月1日和2025年1月20日)
时间粒度时间粒度,包括:“年”、“季度”、“月”、“周”、“日”。
例如,如果用户询问“今年7月”,粒度为“月”。

注意:任何时间范围不包括今天及未来日期。当用户询问过去7天时,返回的结束时间不包括今天,并从昨天向前计算7天。

time_identify_1.png

6. 合并到多工作表(merge_to_multisheet)

将多个文件合并为一个包含多个工作表的单一文件。

参数描述示例
文件数据文件(xlsx、xls、csv)example.xlsx
输出参数描述示例
文件数据文件(xlsx、xls、csv)example.xlsx

注意:上传的文件必须符合Dify平台的大小和数量要求。

merge_to_multisheet_1.png

merge_to_multisheet_2.png

咨询

如有疑问或反馈,请联系我们。

hanyasi@digitforce.com

QR_code.png了解 SwiftAgent:基于LLM和智能代理的企业级数据分析与决策支持。