Home > AI

Orange基于Python和Qt的可视化数据挖掘工具

linker   ·   发表于 3个月前   ·   AI

相当的方便.

接下来, 我会逐步介绍下Orange.

7 Reply   |  Until 3个月前 | 50 View

linker
发表于 3个月前

Orange3的Github仓库:

https://github.com/biolab/orange3

评论列表

  • 加载数据中...

编写评论内容

linker
发表于 3个月前

Orange有自己的.tab数据集格式. 也支持csv和excel以及数据库表.

.tab文件格式是由三行表头和N行\t分割的表体组成.

表头第一行是 列名

第二行是 列属性, 可以是: c,d,t,s分别表示列数据是 连续, 离散, 时间, 字符串

第三行是 proving信息, 可以是: class, meta, weightignore

评论列表

  • 加载数据中...

编写评论内容

linker
发表于 3个月前

打开Orange3,可以选择教程也可以选择创建空白页面.


评论列表

  • 加载数据中...

编写评论内容

linker
发表于 3个月前

以空白ows文档为例.

我们首先要找到数据集, 可以从Orange内置的.tab文件开始, 也可以用datasets控件,自动从网上下载加载一些常见的数据集.

评论列表

  • 加载数据中...

编写评论内容

linker
发表于 3个月前

让我们先从Adult这个数据集开始.

这是一个收入预测数据集, 非常经典. 每一行是一个人的各种属性以及收入数据.



评论列表

  • 加载数据中...

编写评论内容

linker
发表于 3个月前

这个数据集的情况可以通过data info控件来了解:

评论列表

  • 加载数据中...

编写评论内容

linker
发表于 3个月前

当你需要特征工程, 清洗数据, 标准化一些特征的时候, 你可以选择Preprocess控件或者不怕麻烦的话,可以选择Python Script控件, 手动清洗.

评论列表

  • 加载数据中...

编写评论内容
LoginCan Publish Content