PowerBI技巧之DAX 获取前N个数值 - RANKX + 模拟参数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
之前介绍的TOPN函数可以获得前N个数据返回的表单,但这个函数通常是作为参数被其他函数使用,通常如果想在可视化图表中获得前N个数据列表,通常会使用RANKX函数。
用RANKX函数获得Top N数值的思路比较直接,就是先按照排序要求,创建RANKX函数去计算不同行数值的排序序号,之后按照要求只显示前N个数据即可。
最直接的方法就是通过添加视觉级筛选器来实现,例如下图用RANKX函数按照销售量对数据进行排序后,可以用视觉级筛选器显示销售额前三的数据。
TotalS_SUM = SUM(SalesInfo[Amount])
RankQ_A = RANKX ( ALL(SalesInfo[Product]),[TotalQ_SUM],, DESC )
这种设置方式的优点是简单直观,不用添加或者修改DAX表达式就可以实现,任何小白都可以上手。
缺点也比较明显,首先是这个修改只对当前表单起作用,如果你想有其他也使用了对应RankQ_A度量值的图表也只显示Top 3数据就必须去找的这个图表进行再次修改。
其次,这种修改只能通过页面筛选器获得,不能使用切片器等可视化工具来实现,应用在图表制作中并不美观,实用性也比较查。
如果想制作一个切片器,通过选择切片器上不同的数值来动态获取Top N数据,则需要通过添加新的DAX表达式来获得。
方法如下:
首先,由于切片器不支持使用度量值作为字段,因此需要创建一个模拟参数来作为切片器使用的字段,之后将该模拟参数作为获取Top N数据的参数来使用。
创建模拟参数方法很简单,在报表页面(注意,一定是报表页面),选择新建参数,然后填写模拟参数名称,以及相关设置值即可。
对于TOPN这个类型模拟参数,一般可以设置求Top 5, Top 10, Top 20这种,选择整数类型,增量值为1.
点击确定后能看到Power BI新创建了一个名为TopN的表单,里面只包含TopN列,即可以选择的N值,同时在报表页面也新创建了一个切片器,使用了TopN列。
此时TopN表单中的TopN列就可以作为一个参数被DAX函数使用。
准备好模拟参数之后,下一步就是来获取销售量前N的数据。
其思路是,如果某一行数据的销售量排序值即RankQ_A小于等于根据切片器TopN中选择的值,则可以将该行数据显示到可视化图表中,如果大于TopN中的值,则不显示。
这样当选择不同的TopN值时,图表就可以进行动态变化。
要实现该功能,可以创建一个度量值TopN_Amount来进行。
TopN_Amount =
VAR SelectedTop =
SELECTEDVALUE ( 'TopN'[TopN] )
RETURN
SWITCH (
TRUE (),
SelectedTop = 0, [TotalS_SUM],
[RankQ_A] <= SelectedTop, [TotalS_SUM]
)
这个表达式中使用了一个自定义变量SelectedTop去掉用SELECTEDVALUE来获取用户在TopN切片器中选择的数值。
之后添加SWITCH函数去根据不同情况判断应该输出什么样的结果。
SWITCH函数部分的详情如下:SWITCH函数中的< expression>参数使用了TRUE()表达式,意味着Power BI会遍历后面设定的< value>,条件,看是否返回结果是TRUE,是TRUE的话就返回当前< value>后面的< result>结果。
如果不是TRUE,就看下一个< value>条件是否为TRUE。
第一组< value>, < result>判断用户在TonN处选择的结果是否为0,如果是0就按照外围筛选条件输出[TotalS_SUM]的结果(TotalS_SUM = SUM(SalesInfo[Amount]))。
第二组 < value>, < result>判断数据按照Amount销售额进行排序获得的排序值[RankQ_A] 是否小于或者等于其选择的TopN数值,如果是,则按照外围筛选条件对应输出度量值[TotalS_SUM]的结果。
由于当前SWITCH没有定义< else>参数,这样,当[RankQ_A] 值大于TopN值时,SWITCH函数的返回结果就变成Error,相当于不输出后面的结果。
创建完这个度量值TopN_Amount之后就可以用其创建可视化图表来动态获取TonP数据。
有个小伙伴发现一个问题,上面通过这个度量值TopN_Amount虽然可以实现动态展示前N个数据,但是上图表中的“总计”永远都是3100,而不是随着选择展现出来的TopN数据的总和(例如,TopN=2的时候,应该是
900+800=1700)。
之所以出现这样的现象是由于我们在TopN_Amount公式中定义的是只“显示”前N个数据值,将不符合条件的数值进行隐藏。
为了方便理解,将TopN_Amount中的SWITCH函数改成下面的IF函数,能发现内层中的IF函数缺省了一个FALSE定义用来指出如果数据不在SelectedTop范围内应该如何显示。
根据IF函数的定义,当value_if_false却省时,会返回空。
这样,相当于不在SelectedTop范围内的产品,会以空字符串的形式在可视化图表中显示,这样就会默认被隐藏。
从而实现在表单中只显示前N个数据的要求。
IF (
SelectedTop = 0,
[TotalQ_SUM],
IF ( [RankQ_M] <= SelectedTop, [TotalQ_SUM] )
)
但是,别忘了,虽然产品信息被隐藏了,但是每个产品还是有对应的Amount值,该值并未被替换成空,还会在Power BI表单默认的“总计”功能中被计算,从而使得“总计”值用于是3100,而不是相应显示的TopN数据Amount值总和。
要想实现只显示TopN数据的销售量总和,还需要再创建一个Measure来计算,公式如下。
在该公式内,通过表单中的上下文环境,使用VALUES ( SalesInfo[Product] )可以获取一个由当前行对应产品所在的表单,之后通过[TopN_Amount] 获取改产品的销售额,再通过SUMX函数进行汇总,即可得到前N个产品的销售总计值。
OnlyTopN =
SUMX ( VALUES ( SalesInfo[Product] ), [TopN_Amount] )。