《KNIME教程》word版
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
入门指南
我们现在想把你整个过程一步一步的建立一个小的、简单的工作流:我们读在数据从一个ASCII文件,指定颜色,集群数据并显示数据表和散点图。
当我们执行这个流程我们将检查数据模型已经建立。
我们假设你刚刚开始KNIME空着的工作流。
更全面的KNIME快速入门指南,也包含在KNIME下载可以在这里找到。
添加节点
在节点库扩大“输入输出”和“读”类别中,如低于(左图像)和拖放文件阅读器图标工作流编辑器窗口。
下一个节点现在将k -均值聚类算法。
扩大“挖掘”类别紧随其后的是“聚类”的类别,然后拖动节点k - Means流(图右)。
在搜索框中输入“颜色”节点存储库并按下enter。
这限制了节点显示的“颜色”在他们的名字(见上图中)。
拖动颜色马槽节点工作流(该节点将定义在数据视图的颜色之后)。
看到所有节点在库再一次,按下ESC或退格键在搜索字段节点的存储库。
现在,拖动互动表和散点图从“数据视图”范畴的工作流编辑器和位置它右边的颜色管理器节点。
连接节点
现在你需要连接节点为了得到数据流。
点击一个输出端口并拖动连接到一个适当的输入端口。
完整的流程如下图所示:
你的节点不会显示一个绿色的状态,只要他们不是配置和执行。
配置节点
完全连接节点和一个红色状态图标需要配置。
先从文件阅读器,右键单击它并选择“配置”菜单。
导航到“IrisDataSet”目录KNIME位于安装目录。
选择数据。
所有文件从这个位置。
文件阅读器的预览表显示了一个示例数据。
点击OK以关闭对话框的文件阅读器节点。
一旦节点已被正确配置,它切换到黄色(意味着准备好执行)。
在那之后,k -均值节点立即变成黄色,作为其默认设置被应用。
可以肯定的是,默认的设置符合您的需要,打开对话框,检查默认设置。
为了配置颜色管理器节点你必须首先执行节点k -均值。
执行后,所有的名义值和范围的属性是众所周知的:这个meta信息被传
播到继任者节点。
颜色管理器需要这个数据之前可以对它进行配置。
一旦执行k -均值节点,打开配置对话框的颜色马槽节点。
执行节点
现在执行散布图节点:工作台为您执行所有的前任节点。
在一个更大、更复杂的流程你可以选择多个节点和触发执行给他们所有的人。
工作流管理器根据需要执行节点,如果可能的话在平行。
检查结果
为了检验数据和结果,打开节点”的观点。
在我们的示例中,k -均值,互动表和散点图有观点。
开放他们从节点的上下文菜单。
Hiliting
选择一些点散点图,选择“Hilite Selected”从“Hilite”菜单。
这个hilited点标记一个橙色的边境。
您还将看到hilited分在表视图。
传播的醒目地位适用于所有视图在所有部门的流动显示相同的数据。
开始你自己的探索之旅!
这只是一个非常简单的例子来让你开始。
有更多的发现。
玩它!我们试图保持简单和直观的。
这将是伟大的,收到你的反馈,找出你喜欢的和你不喜欢,东西你找到尴尬或事情似乎并未奏效。
工作台
描述可用的视图
在以下的KNIME工作台及其特性进行更为详细的描述。
当KNIME最初打开它始于以下安排视图:
Workflow Projects
所有KNIME工作流是显示在工作流项目视图。
工作流的状态表示一个图标显示工作流是否关闭、闲置、执行或者执行完成。
Favorite Nodes
最喜欢的节点视图显示你最喜欢的,最常用的和去年使用的节点。
一个节点被添加到你的收藏夹通过拖动它从节点存储库到个人最喜欢的节点类别。
当一个节点拖动到工作流编辑器,最后使用和更新最频繁使用的类别。
最喜欢的节点视图有以下操作菜单栏的视图:
收起所有扩展类别
扩大所有类别
清除过去的使用和最经常使用的类别
删除选中的节点从您的收藏夹
节点的数量在去年使用最频繁和类别默认限制为10节点。
这个数字可以调整,在偏好。
选择“文件/首选项. .“/ KNIME / KNIME GUI设置不同的值的最大大小常用节点和最大数量的最后使用节点。
Node Repository
节点存储库包含所有节点KNIME下令在类别。
一个类别可以包含另一个类别,例如,阅读类别是一个子类的IO范畴。
节点从存储库中添加工作流编辑器通过拖放它们到工作流编辑器。
选择一个类别显示所有包含节点的节点描述视图,选择一个节点显示为该节点的帮助。
如果你知道一个节点的名称可以输入部分的名字在搜索框中节点的存储库。
当你输入所有节点都立即过滤那些包含输入的文本在他们的名字:
Outline
outline视图提供了一个概述整个工作流即使只有一小部分是可见的工作流编辑器(标记为灰色在大纲视图中)。
outline视图还可以用于导航:灰色矩形可以移动鼠标,导致编辑器向下滚动,可见部分匹配的灰色矩形。
Console
控制台视图打印出错误和警告消息为了给你一个线索:底层怎么回事。
相同的信息(调试详细级别是写入一个日志文件,它位于{ workspace } / . metadata / knime / knime.log)。
如果你想改变这个级别的细节(这两个日志文件或控制台视图)去
File/Preferences.../KNIME详细级别的日志文件或去
File/Preferences.../KNIME/KNIME GUI的细节层次控制台视图。
你可以选择:
DEBUG
主要用于开发调试消息。
不建议使用这个控制台视图,因为它KNIME减慢。
INFO
日志信息消息。
不是真的重要,但也不是完全无用!
WARNING
如果一个节点不能在配置一个警告消息也发布了。
警告消息不是致命的;通常工作流可以继续执行,但他们表示,一些值得了解已经发生。
违约和推荐级别控制台视图。
ERROR
只有当事情发生了致命的发行,即工作流可以不再被执行。
Node Description
节点描述显示选中的节点信息(或节点包含在一个选定的类别)。
特别是,它解释了对话框选项,可用的视图,预期的输入数据和输出结果数据。
在Linux下有一些问题与这一观点,因为它需要系统的web浏览器。
KNIME / Eclipse 试图找到一个基于mozilla的浏览器自动,如果环境变量没有设置MOZILLA_FIVE_HOME KNIME。
承宪应该注意浏览器,它是用在这种情况下。
你可以尝试显式地设置到firefox目录和MOZILLA_FIVE_HOME如果这没有帮助你也可以尝试通过“-Dorg.eclipse.swt.browser.XULRunnerPath =…“knime.sh。
有一个已知问题和Firefox 3(和使用xulrunner > = 1.9),对于那些没有解决方法除了使用的是旧版本。
这也可能导致你一些麻烦。
参见链接的Eclipse bug报告
为了提供一个完整的文本搜索,节点的描述也集成在Eclipse帮助。
选择帮助/帮助菜单中的内容以打开Eclipse内置的帮助。
有一个KNIME范畴,它有一个节点描述子菜单。
在搜索字段可以执行全文搜索在所有节点的描述。
例如,如果你输入“集群”,所有节点描述包含词集群显示:
Preferences
偏好与文件/打开首选项…KNIME-related的偏好被分成三个类别:
KNIME
偏好的KNIME也适用于KNIME如果开始在批处理模式
日志文件日志级别
的详细级别的日志文件。
默认值是调试,这意味着开发人员也记录信息。
这个日志文件发送给我们如果你遇到任何意外的行为可能会给我们一个提示,是什么导致了这个问题。
最大工作线程对所有节点:
这个KNIME工作流管理器试图优化执行时间的节点,例如,通过分配单独的分支的工作流来几个线程。
它可以归结为并行运行节点尽可能。
这里您可以输入多少线程应该用于并行化。
默认情况下它是CPU的数量的两倍。
这已经被证明是一个良好的数额。
目录为临时文件
KNIME需要存储一些临时文件(数据的执行但尚未保存工作流)某处。
您可以在这里指定位置。
KNIME GUI:
偏好相关的KNIME图形用户界面。
控制台视图日志级别
的详细级别的日志信息显示在控制台视图。
通常警告是足够的。
调试减缓性能和主要适用于发展。
确认节点复位
请选择你想要的是否一个确认对话框弹出当你重置一个已经执行节点。
如果你检查了“不又问“复选框在这种类型的对话框中,选择“选项”,使它们再次出现。
确认节点/连接删除
上面提到的一样,但是对于确认删除节点和/或连接。
确认重新连接已连接的节点
截至KNIME 2.0可以拖动一个连接到一个已经连接的端口。
连接被替换如果配置节点,但如果它被执行(因此将重置取代连接)一个确认对话框。
这个确认对话框也可以被开启或关闭通过这种偏好。
最大尺寸为最常用的节点
节点的数量来维持最频繁使用的节点类别的最喜欢的节点视图。
最后使用节点最大尺寸
节点的数量由去年使用节点类别的最喜欢的节点视图。
Master Key
KNIME不存储任何密码(例如数据库)在普通测试,但通过一个主密钥加密.
Workflow Editor
工作流编辑器是用来装配工作流程、配置和执行节点,检查结果和探索你的数据。
本节描述了交互可以在编辑器。
Node Options
Configure
当一个节点拖到工作流编辑器或连接,它通常显示红色的状态灯显示它需要配置,即对话框已被打开。
要做到这一点,可以双击节点或用鼠标右键单击节点打开上下文菜单。
第一个条目的上下文菜单是“配置”,打开对话框。
如果节点被选中您还可以选择相关的按钮上面的工具栏编辑器。
按钮看起来像旁边的图标上下文菜单项。
Execute
在接下来的步骤中,您可能希望执行节点,即您希望节点实际执行其任务的数据。
为实现这一目标右键单击节点为了打开上下文菜单,并选择“执行”。
你也可以选择相关的按钮从工具栏。
按钮看起来像旁边的图标上下文菜单项。
没有必要执行每一个节点:如果执行最后一个节点连接的但尚未执行节点,节点将执行所有的前任执行之前最后一个节点。
Execute All
上面的工具栏编辑器还有一个按钮来执行所有未执行节点工作流。
这同样适用,如果一个节点在流点着红状态灯由于信息缺失的前任节点。
当节点执行的前身和节点与红状态灯可以应用其设置执行以及其继任者。
底层的工作流管理器还试图执行的分支并行的工作流。
Execute and Open View
节点的上下文菜单还包含“执行并打开视图”选项。
这个执行节点,并立即打开视图。
如果一个节点有多个视图只有第一个视图打开。
Open View
一个节点可以没有,一个或多个视图。
每个视图显示为一个条目在节点的上下文菜单。
选择它为了打开相关的视图。
一种观点认为,之前被打开节点已经执行,尽快更新节点执行。
你可以打开视图的一个节点几次,例如如果你想要比较不同的列在散点图。
一个视图是自动复位如果节点是复位。
Open Out-port View
如果一个节点没有一个观点,你有兴趣结果节点的数据操作,您可以检查数据。
它可以在节点的输出端。
底部的上下文菜单中有一个条目,每个节点的输出港。
每一个打开引用视图输出端。
注意,输出端视图不支持任何交互或hiliting。
如果你想看到hilited醒目数据或数据输出端连接到互动表节点。
Reset
你可以重置一个节点通过选择重置选项从上下文菜单。
节点返回的执行状态(绿色状态灯)来配置状态(黄色状态灯)。
如果节点被选中您还可以选择相关的按钮上面的工具栏编辑器。
按钮看起来像旁边的图标上下文菜单项。
Cancel
如果一个节点是当前执行你可以取消执行通过选择“取消”选项从上下文菜单或相关按钮(相同的图标,在上下文菜单)从工具栏。
Cancel All
工具栏还包含一个“取消”按钮,取消所有正在运行的节点的执行。
Enter Custom Node Name
当一个节点拖到工作流它有一个名字,比如“节点1”或类似的默认情况下低于状态灯。
你可以改变这个名字更好地描述节点实际上是做,例如。
“过滤器值> 10”。
这可以通过选择节点,然后单击名称:名称变成可编辑。
按“返回”应用您的更改。
Enter Custom Node Description
在上下文菜单中你还会找到“节点名称和描述”选项。
这将打开一个对话框来选择输入一个新的名称为节点。
此外您可以输入一个更详细的描述或说明该节点。
这个动作也可以通过工具栏中的按钮。
Connections
你可以连接两个节点通过拖动鼠标从一个节点的输出端到另一个节点的停港。
循环是不允许的。
如果一个节点已经连接你可以替换现有的连接通过拖拽一个新的连接到它。
如果节点已经连接,您会被要求确认结果重置目标节点。
你也可以拖动结束的一个现有的连接到一个新的停港(或者相同的节点或一个不同的节点)。
Import/Export of workflows
Import of Workflows
您可以导入一个工作流可以从一个不同的工作区或从一个zip文件,例如如果工作流是KNIME出口。
导入向导可以打开菜单中的“文件/导入KNIME工作流……”或通过打开上下文菜单在工作流项目视图并选择“导入KNIME工作流……”。
选择根目录,如果您想要导入工作流从另一个工作区。
选择存档文件的选择如果你想浏览压缩工作流。
选择您想要导入的工作流。
如果一个工作流具有相同名称已经存在在当前工作区中您可以重命名导入的一个在向导的下一个页面。
通过点击OK项目导入到您的工作区。
如果你不“复制项目进入工作区”,更改到这个工作流也将适用于工作流在源位置。
Export of Workflows
出口流程操作也可以通过菜单(文件/出口KNIME工作流…”)或通过上下文菜单中的工作流项目视图。
两个打开出口流程向导。
选择你想要导出的工作流。
如果你右键单击一个工作流打开导出向导这个工作流是预选。
在第二场浏览到目标位置或输入路径导致出口位置。
选择排除数据被导出默认激活。
如果勾选此项,只有结构的工作流是出口,这将导致一个配置但非执行工作流如果是被。
如果您显式地共享数据(例如,如果对方不能访问数据库)你可以取消选中此选项。
元节点
Using Meta Nodes
元节点节点包含subworkflows,即在工作流它们看起来像一个节点,尽管他们可以包含很多节点,甚至更多的元节点。
他们正在创建的帮助元节点向导。
你可以打开元节点向导通过选择“节点/添加元节点”
从菜单或点击按钮与元节点图标的工具栏(工作流编辑器必须是可打开的)。
Create Pre-defined Meta Node
创建一个预定义的元节点,选择一个,然后单击“完成”。
你的选择是添加到工作流。
Create Customized Meta Node
如果你需要不同数量的或出港口或想有不同的端口类型你可以选择一个预先定义的元节点作为模板,然后点击“定制”来访问这个向导的下一页。
在此页面您可以添加或删除在——和出港口的模板。
一个图标在底部立即给你一个预览的节点。
当你添加一个端口的模板可以选择类型的端口:
数据,
数据库或
数据挖掘端口(PMML)。
一旦节点适合你的需要,单击“完成”以将其添加到工作流。
Inside a Meta Node
为了打开一个元节点可以双击它或者选择“打开Subworkflow编辑”从上下文菜单。
根据不同的数量的,和出港口的内部元节点类似于下图:
\
在—进或出港口是固定的,被称为workflow port bars,可以移动和调整大小。
数据连接到停港从外面出现在元节点编辑器在停港。
反之亦然:数据连接到内部输出端出现在外面的输出端。
Meta Nodes From Outside
元节点看起来不同正常节点。
背景图标不是圆形的,有一个黑暗的灰色背景。
没有状态灯,没有进行。
States of Meta Nodes
元节点没有像许多州作为一个节点。
一个元节点的状态同工作流的状态。
元节点可以:idle/configured
如果至少有一个节点在元节点,既不执行也不执行。
Executing
如果至少有一个节点执行
Executed
如果所有包含节点执行
元节点的状态是由一个图标显示在元节点(从外部观察)。
Out-Ports of Meta Nodes
除了元节点的状态的出港口的一元节点也有州。
一个小装饰图标显示状态的输出端。
如果一个端口未连接或连接到一个空闲节点既不规范也不数据是可用的。
这是显示一个红色图标。
如果一个端口被连接到一个配置节点,有些规格是可用的。
这是显示一个黄色的图标。
如果一个端口被连接到一个执行节点,规格和数据是可用的。
这是显示一个绿色的图标。
FAQ
What is KNIME, what does KNIME stand for and who has developed KNIME?
KNIME stands for K o N stanz I nformation M in E r and is pronounced: [naim] (that is, with a silent "k", just as in "knife"). It is developed by AG located in Zurich and the group of Michael Berthold at the University of Konstanz, Chair for Bioinformatics and Information Mining. Why is it called "KNIME"? Well, "Konstanz Information Miner" used to be called "Hades" (as the pub some of its creators ended up going to often). But that raised lots of not so nice questions ("so this is where your data ends up when it's not useful anymore?") so we looked for another name. "KIM", the obvious choice was, of course, already taken. However, the Konstanz license plate symbol is "KN", so KNIM was our next choice. Adding a vowel at the end was suggested by a native speaker to "round it off", as he put it. And it appears in "Miner" so we felt ok about it. Plus URLs such as "", "knime.de", ... were still available at that time...
How to cite KNIME?
The recommended way to cite KNIME is to cite the paper
with the following BibTeX:
@INPROCEEDINGS{BCDG+07,
author = {Michael R. Berthold and Nicolas Cebron and Fabian Dill and Thomas R. Gabriel and Tobias K\"{o}tter and Thorsten Meinl and Peter Ohl and Christoph Sieb and Kilian Thiel and Bernd Wiswedel},
title = {{KNIME}: The {K}onstanz {I}nformation {M}iner},
booktitle = {Studies in Classification, Data Analysis, and Knowledge Organization (GfKL 2007)}, publisher = {Springer},
ISBN = {978-3-540-78239-1},
ISSN = {1431-8814},
year = {2007}
}
Can I modify, publish, transmit, transfer or sell, reproduce, create derivative works from, distribute, perform, display, or in any way exploit any of the content, in whole or in part?
You may do all this in accordance to the license only. KNIME is available under a dual licensing model. A version under an open source license is available for download from this website. If you need other license terms, please contact us. Please refer to the license for more information about the terms of the open source license.
How much data can I process with KNIME?
Basically, there are no limits, since the data is buffered in an intelligent way. Nevertheless, some algorithms may require too much time and memory for very huge datasets.
I'm getting errors like ng.OutOfMemoryError: PermGenSpace. What is wrong?
This is a known bug in Sun's Java, which occurs if a lot of classes are loaded. This sometimes occurs in KNIME/Eclipse if you have a lot of, or huge plugins. A workaround is to pass the option -XX:MaxPermSize=128m to the Java command. The KNIME product is already using this setting by default. You can also try another Java implementation, such as those from IBM
or BEA.
See also Eclipse's and Sun's bug reports.
How can I increase the Java Heap Space for KNIME?
In the KNIME installation directory there is a file called knime.ini(under linux it might be .knime.ini). Open the file, find the entry -Xmx512mand change it to -Xmx1024mfor example. You may also consider to change the -XX:MaxPermSize=128moption and increase it to 256mor even 512m, depending on your computer's main memory. Note, that you main memory must be at the very least the sum of both values. (See also the answer for rarely observed problems while increasing heap space under Windows).
If you use the developer version you have to edit the run configuration:
"Run -> "Open Run Dialog..." -> tab "Arguments" -> field VM arguments -> enter -Xmx1024M.
I cannot start KNIME on Windows, I do not even see a splash screen? How do I make it work?
If you do not even see the KNIME splash screen the system fails to create the Java VM. We observed this problem on a few computer systems. It seems that the anti-virus software Kaspersky prohibits the Java VM to allocate enough memory (/index.php?showtopic=73177). Thus, there are two workarounds:
1Try to uninstall the Kaspersky components Anti-Dialer and Anti-Spam as
proposed in this forum thread, or
1open the knime.ini file in the installation directory and enter smaller values for
the Xmxand theXX:MaxPermSizeoptions.
I extracted the UpdateSite.zip (or parts of it) into the KNIME installation folder, but the new nodes do not appear in the Node repository.
With Eclipse 3.4 the mechanism how features/plugins are managed has drastically changed (the magic keyword is "p2"). One of the major implication for users is, that they cannot install new features/plugins (i.e. nodes) by just copying the plugins and/or features into the corresponding directories of the Eclipse/KNIME installation. Instead, they must be installed via the Update Manager. One workaround for plugins for which there exists no feature is the dropins folder that Eclipse scans upon each startup. But please use this only if anything else fails! The recommended way is using the Update Manager with the KNIME Update Site or the zipped version of it.
Is it possible to include data files in the workflow so that the, e.g. File Reader is immediately executable on a different system, where the source file is not available?
Yes. This feature was added in KNIME v2.2.0. You will need to physically copy the file into a dedicated "drop" directory in the node folder (part of the workflow). KNIME will index this folder and make all files in this "drop" folder available as node-local flow variables in URL syntax. Here are the steps:
1Create a workflow containing a file reader (or SDF reader or whatever you like
to use) and point the reader to the file you want to read.
1Save the workflow.
1Use your system file browser and go into the corresponding workflow directory,
e.g. <workspace>/KNIME_Project/File Reader (#1)/.
1Create a folder "drop" in this directory and copy the target file here.
1Switch back to KNIME and make sure that the node configures at least once (e.g.
if the node was executed, reset it, or if the node was configured, open the dialog and
close the dialog by pressing ok).
1Open the dialog of the node, switch to the "Flow Variables" tab and choose the
variable representing the drop file (e.g. "knime.node (drop) <file url>) in the
corresponding combo box.
The file is now part of the workflow and will be included in the exported workflow unless you explicitly choose to exclude the data from the workflow.
The Node Description window doesn’t work on Linux; it displays the error "System browser cannot be initialized. No node description will be displayed."
KNIME uses the SWT browser widget to display HTML content. This widget requires a proper web browser to be installed. Under Linux Mozilla XULRunner is used. Usually xulrunner is present if the Firefox web-browser is installed. This error message can have two causes:
1Some recent Linux distributions (e.g. Ubuntu 11.10 or Fedora 16) ship with an
incompatible version of XULRunner (Eclipse only support versions 1.8 and 1.9). If
KNIME detects an incompatible version it will disable it altogether because
otherwise KNIME may crash. Since the distributions do not offer offical packages for
older version of XULRunner, the KNIME Update Site contains a feature
called KNIME XULRunner binaries for Linux. If installed, KNIME will use this local
XULRunner if no compatible version exists in the system. In order to install this
feature you must disable the "Group items by category" option in the installation
dialog and search for the feature.
1Some distributions require the installation of a separate package, e.g.
mozilla-xulrunner(OpenSuSE) or simply xulrunner(e.g. Fedora). After installation,
KNIME should pick the xulrunner upon restart. If that does not work for any reason,
you may want to try to add a line to the the knime.ini file contained in the KNIME
directory. This line should read as:
-Dorg.eclipse.swt.browser.XULRunnerPath=<location_to_xulrunner>
For more details on web browser requirements, see the SWT FAQ.
When copying Meta nodes such as Cross Validation or Meta Nodes x:x the inner nodes are not copied.
This is a known issue for all meta nodes in KNIME 1.3.5 and before. These KNIME versions do not copy the internal workflow of metanodes because of potential index conflicts. A workaround is to create a new meta node of the same type and subsequently copy the internals of the meta node separately. This problem is fixed as of 2.0.
Is there any way to run KNIME in batch mode, i.e. only on command line and without the graphical user interface?
There is a command line option allowing the user to run KNIME in batch mode. To see a list
of possible arguments execute the following line on a command prompt (for Linux):
knime -nosplash -application org.knime.product.KNIME_BA TCH_APPLICATION
On Mac the knimeexecutable is not directly located in the KNIME application directory but in theknime.app/Contents/MacOS/subfolder. Besides this the command line usage is the same as in Linux. If you have copied KNIME, for example, into your /Applicationdirectory it can be invoked like this:
/Applications/knime/knime.app/Contents/MacOS/knime -nosplash -application org.knime.product.KNIME_BA TCH_APPLICATION
On a Windows system, you need to add two more options to enable system messages (by default any message to System.out is suppressed):
knime.exe -consoleLog -noexit -nosplash -application org.knime.product.KNIME_BA TCH_APPLICATION
The -consoleLogoption causes a new window to be opened containing the log messages and -noexitwill keep the window open after the execution has finished - you will need to close the window manually, and, unfortunately, an error message is produced from the Java process, which, however, you can safely ignore. (If you happen to find out how this procedure can be avoided or simplified, please let us know.) Windows users: please remember to add these two options to the command line examples below in order to see KNIME's output messages.
In order to run a (pre-configured) workflow, say Knime_project, contained in the workspace directory, execute (in one line)
knime -nosplash -application org.knime.product.KNIME_BA TCH_APPLICATION
-workflowDir="workspace/Knime_project"
It's also possible to change the configuration of the workflow through workflow variables. If you create a workflow variable, say parameter of type Integer, configure a node in the workflow so that it uses the value of the variable where you want the user to parameterize the node. If you run the workflow now in the batch mode, you can specify the -workflow.variable=name,value,typeoption to set a new value before the flow gets executed. For example, to set the value 5 to the parameter integer variable, call the batch executor like this: knime -nosplash -application org.knime.product.KNIME_BA TCH_APPLICATION
-workflow.variable=parameter,5,int
-workflowDir="workspace/KNIME_project"
The workspace is empty how do I create a new project?
In the Navigator view (left top window) right-click and select "New", then "New KNIME Project". Provide a name for this new project and click the OK button.
The Node Repository shows only a few nodes (or none at all) - is that all Did you enter anything in the search field of the Node Repository view? Click into the edit field at the top of that view and press ESC. This should return all nodes included in the installation. If this doesn't help, your installation might be corrupt.
Under Linux I cannot see the table in the output port view, the window shows only blank content. What is wrong here?
This is very likely a problem with the Compiz OpenGL window manager (Bug report at Sun).
Other effects may be empty sub-dialogs, e.g. in the File Reader. You have to switch off Compiz in this case. Another workaround has been posted here, but
we haven't tested it ourselves. For the Non-Germans you have to
1Install the libXP package, by e.g. yum -y install libXp.
1Add export AWT_TOOLKIT=MToolkitto your ~/.bashrc (or whatever
file your shell executes upon startup).
I am running Fedora 10 using the Gnome window manager. The KNIME main application works as expected but as soon as I open a view or a dialog, this panel does not get repainted. Why?
That seems to be a java swing / swt problem. It seems as if the libgxim package causes this problem, i.e. if you uninstall that package (and all its dependencies) the panel will get properly painted.
How can I force KNIME to cache any intermediate data to disk in order to reduce memory usage?
The framework has no absolute control on memory usage of individual nodes, though it can control the amount of data in each node's output that is to be kept in main memory. This memory policy can be controlled in a node's dialog in the tab "General Node Settings". There are three different policies available: The first one ("Keep all in memory") enforces KNIME to leave all data that is generated by the respective node in main memory, the second option ("Write tables to disc") writes all data to disk immediately, the third one ("Keep only small tables in memory") is a heuristic to automatically switch between the first two items depending on the data size. Each of these options has pros and cons, e.g. keeping all data in memory allows for fast iterations on this data but increases memory usage.
The "Keep only small tables in memory" option is the default and of special interest. It uses a threshold value for the number of cells contained in a table (i.e. row count multiplied by column count) to decide whether to keep data in memory or on disk. This threshold defaults to 100 000 cells. If that is inappropriate in your setup (for instance because your cells tend to be large strings), you can change the default. This can be done using a java property that is passed either as command line argument or as part of the knime.ini file that is located in the installation directory. (Note: changing the configuration file is preferred over the additional command line argument since any command line argument instructs knime (more precisely the underlying eclipse) to ignore all entries in the configuration file).
Add the following line after the -vmargs line in the knime.ini file to keep at most 1000 cells in memory (you can choose a different value, even 0 in which case it always swaps to disk):
-Dorg.knime.container.cellsinmemory=1000
You can verify if this setting has been picked up by either looking at the log file or inspecting the tooltip that is shown when hovering over the "Keep only small tables in memory" option in any node.。