orange(数据挖掘软件)是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了Python以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架开发。
除了界面友好易于使用的优点,Orange的强项在于提供了大量可视化方法,可以对数据和模型进行多种图形化展示,并能智能搜索合适的可视化形式,支持对数据的交互式探索。
Orange的弱项在于传统统计分析能力不强,不支持统计检验,报表能力也有限。Orange的底层核心也是采用C++编写,同时允许用户使用Python脚本语言来进行扩展开发。nbsp;支持Python的Orange数据挖掘软件实例:Orange的特点是界面友好易于使用,提供大量可视化方法,提供Python编程接口,于是决定试用一下。
数据是怎么导 入Orange里的:具体操作是用python吗你数据是存在哪儿的,如果是存在mysql里面的,那可以 使用orngMySQL和orngSQL模块,如下所示 torngMySQL.Connect#39;localhost#39;#39;root#39;#39;#39;#39;test#39; datat.queryquot;SELECT * FROM busclassquot; treeorngTree.TreeLearnerdata orngTree.printTxttreenodeStrquot;V 1.0Nquot;leafStrquot;V 1.0Nquot;Orange怎么用?Orange是类似KNIME和Weka KnowledgeFlow的数据挖掘工具,它的图形环境称为Orange画布(OrangeCanvas),用户可以在画布上放置分析控件(widget),然后把控件连接起来即可组成挖掘流程。这里的控件和KNIME中的节点是类似的概念。每个控件执行特定的功能,但与KNIME中的节点不同,KNIME节点的输入输出分为两种类型(模型和数据),而Orange的控件间可以传递多种不同的信号,比如learners classifiers evaluation results distance matrices dendrograms等等。Orange的控件不象KNIME的节点分得那么细,也就是说要完成同样的分析挖掘任务,在Orange里使用的控件数量可以比KNIME中的节点数少一些。Orange的好处是使用更简单一些,但缺点是控制能力要比KNIME弱。
网上可以搜索到的Orange中文资料不多,这篇《利用orange进行关联规则挖掘》 给了一个通过Python调用Orange中的Apriori算法进行关联分析的例子,更详细的通过Python调用Orange的文档参考官网上的Beginning with Orange.图形界面的使用没看到文档,不过界面简单易懂,看看features里的screenshots也可猜个大概。参考Beginning with Orange中的Classification小节,以用Naive Bayesian Classifer处理Orange自带的示例数据集voting.tab为例,对代码做了少量修改:
#-*-nbsp;encoding:nbsp;utf-8nbsp;-*-#nbsp;导入orange包importnbsp;orange#nbsp;导入测试数据voting.tabdatanbsp;nbsp;orange.ExampleTablequot;votingquot;#nbsp;使用Naivenbsp;Bayesiannbsp;Classiferclassifiernbsp;nbsp;orange.BayesLearnerdatanbsp;#nbsp;输出all_datanbsp;nbsp;lendatabingonbsp;nbsp;0nbsp;fornbsp;dnbsp;innbsp;data:nbsp;nbsp;nbsp;nbsp;nbsp;#nbsp;分类器输出的类别nbsp;nbsp;nbsp;nbsp;ccnbsp;nbsp;classifierdnbsp;nbsp;nbsp;nbsp;#nbsp;原文件中数据中的类别nbsp;nbsp;nbsp;nbsp;ocnbsp;nbsp;d.getclassnbsp;nbsp;nbsp;nbsp;ifnbsp;ocnbsp;nbsp;cc:nbsp;nbsp;nbsp;nbsp;nbsp。