SQL Server ->> 分析函数 PERCENTILE_DISC \PERCENT_RANK \PERCENTILE_CONT \CUME_DIST \LAST_VALUE

先建个成绩表作为测试数据

CREATE TABLE dbo.score ( [class] nvarchar(10), [student] nvarchar(10), [subject_name] nvarchar(10), [score] decimal(4,1) )
INSERT INTO dbo.score
VALUES
( N'高一4班', N'马云', N'语文', 92.0 ),
( N'高一4班', N'马云', N'数学', 98.0 ),
( N'高一4班', N'马云', N'英语', 94.0 ),
( N'高一4班', N'马云', N'政治', 95.0 ),
( N'高一4班', N'马云', N'历史', 92.0 ),
( N'高一4班', N'马云', N'物理', 97.0 ),
( N'高一4班', N'马云', N'化学', 100.0 ),
( N'高一4班', N'马云', N'地理', 100.0 ),
( N'高一4班', N'马云', N'生物', 93.0 ),
( N'高一4班', N'马化腾', N'语文', 98.0 ),
( N'高一4班', N'马化腾', N'数学', 99.0 ),
( N'高一4班', N'马化腾', N'英语', 93.0 ),
( N'高一4班', N'马化腾', N'政治', 100.0 ),
( N'高一4班', N'马化腾', N'历史', 95.0 ),
( N'高一4班', N'马化腾', N'物理', 96.0 ),
( N'高一4班', N'马化腾', N'化学', 94.0 ),
( N'高一4班', N'马化腾', N'地理', 95.0 ),
( N'高一4班', N'马化腾', N'生物', 98.0 ),
( N'高一4班', N'李彦宏', N'语文', 93.0 ),
( N'高一4班', N'李彦宏', N'数学', 96.0 ),
( N'高一4班', N'李彦宏', N'英语', 92.0 ),
( N'高一4班', N'李彦宏', N'政治', 92.0 ),
( N'高一4班', N'李彦宏', N'历史', 100.0 ),
( N'高一4班', N'李彦宏', N'物理', 94.0 ),
( N'高一4班', N'李彦宏', N'化学', 97.0 ),
( N'高一4班', N'李彦宏', N'地理', 92.0 ),
( N'高一4班', N'李彦宏', N'生物', 99.0 ),
( N'高一4班', N'王思聪', N'语文', 98.0 ),
( N'高一4班', N'王思聪', N'数学', 95.0 ),
( N'高一4班', N'王思聪', N'英语', 92.0 ),
( N'高一4班', N'王思聪', N'政治', 100.0 ),
( N'高一4班', N'王思聪', N'历史', 94.0 ),
( N'高一4班', N'王思聪', N'物理', 97.0 ),
( N'高一4班', N'王思聪', N'化学', 96.0 ),
( N'高一4班', N'王思聪', N'地理', 98.0 ),
( N'高一4班', N'王思聪', N'生物', 96.0 ),
( N'高一4班', N'张一鸣', N'语文', 97.0 ),
( N'高一4班', N'张一鸣', N'数学', 99.0 ),
( N'高一4班', N'张一鸣', N'英语', 96.0 ),
( N'高一4班', N'张一鸣', N'政治', 100.0 ),
( N'高一4班', N'张一鸣', N'历史', 97.0 ),
( N'高一4班', N'张一鸣', N'物理', 95.0 ),
( N'高一4班', N'张一鸣', N'化学', 91.0 ),
( N'高一4班', N'张一鸣', N'地理', 94.0 ),
( N'高一4班', N'张一鸣', N'生物', 98.0 ),
( N'高一4班', N'王兴', N'语文', 100.0 ),
( N'高一4班', N'王兴', N'数学', 95.0 ),
( N'高一4班', N'王兴', N'英语', 96.0 ),
( N'高一4班', N'王兴', N'政治', 92.0 ),
( N'高一4班', N'王兴', N'历史', 99.0 ),
( N'高一4班', N'王兴', N'物理', 97.0 ),
( N'高一4班', N'王兴', N'化学', 100.0 ),
( N'高一4班', N'王兴', N'地理', 95.0 ),
( N'高一4班', N'王兴', N'生物', 98.0 ),
( N'高一4班', N'刘强东', N'语文', 93.0 ),
( N'高一4班', N'刘强东', N'数学', 96.0 ),
( N'高一4班', N'刘强东', N'英语', 96.0 ),
( N'高一4班', N'刘强东', N'政治', 98.0 ),
( N'高一4班', N'刘强东', N'历史', 96.0 ),
( N'高一4班', N'刘强东', N'物理', 97.0 ),
( N'高一4班', N'刘强东', N'化学', 97.0 ),
( N'高一4班', N'刘强东', N'地理', 94.0 ),
( N'高一4班', N'刘强东', N'生物', 98.0 ),
( N'高一4班', N'黄铮', N'语文', 94.0 ),
( N'高一4班', N'黄铮', N'数学', 91.0 ),
( N'高一4班', N'黄铮', N'英语', 92.0 ),
( N'高一4班', N'黄铮', N'政治', 100.0 ),
( N'高一4班', N'黄铮', N'历史', 92.0 ),
( N'高一4班', N'黄铮', N'物理', 93.0 ),
( N'高一4班', N'黄铮', N'化学', 91.0 ),
( N'高一4班', N'黄铮', N'地理', 97.0 ),
( N'高一4班', N'黄铮', N'生物', 100.0 ),
( N'高一4班', N'丁磊', N'语文', 98.0 ),
( N'高一4班', N'丁磊', N'数学', 95.0 ),
( N'高一4班', N'丁磊', N'英语', 95.0 ),
( N'高一4班', N'丁磊', N'政治', 95.0 ),
( N'高一4班', N'丁磊', N'历史', 91.0 ),
( N'高一4班', N'丁磊', N'物理', 96.0 ),
( N'高一4班', N'丁磊', N'化学', 100.0 ),
( N'高一4班', N'丁磊', N'地理', 94.0 ),
( N'高一4班', N'丁磊', N'生物', 98.0 ),
( N'高一4班', N'雷军', N'语文', 100.0 ),
( N'高一4班', N'雷军', N'数学', 92.0 ),
( N'高一4班', N'雷军', N'英语', 98.0 ),
( N'高一4班', N'雷军', N'政治', 95.0 ),
( N'高一4班', N'雷军', N'历史', 94.0 ),
( N'高一4班', N'雷军', N'物理', 99.0 ),
( N'高一4班', N'雷军', N'化学', 97.0 ),
( N'高一4班', N'雷军', N'地理', 96.0 ),
( N'高一4班', N'雷军', N'生物', 96.0 ),
( N'高一4班', N'周鸿祎', N'语文', 91.0 ),
( N'高一4班', N'周鸿祎', N'数学', 94.0 ),
( N'高一4班', N'周鸿祎', N'英语', 96.0 ),
( N'高一4班', N'周鸿祎', N'政治', 99.0 ),
( N'高一4班', N'周鸿祎', N'历史', 93.0 ),
( N'高一4班', N'周鸿祎', N'物理', 99.0 ),
( N'高一4班', N'周鸿祎', N'化学', 93.0 ),
( N'高一4班', N'周鸿祎', N'地理', 100.0 ),
( N'高一4班', N'周鸿祎', N'生物', 99.0 ),
( N'高一4班', N'张朝阳', N'语文', 95.0 ),
( N'高一4班', N'张朝阳', N'数学', 95.0 ),
( N'高一4班', N'张朝阳', N'英语', 94.0 ),
( N'高一4班', N'张朝阳', N'政治', 95.0 ),
( N'高一4班', N'张朝阳', N'历史', 98.0 ),
( N'高一4班', N'张朝阳', N'物理', 93.0 ),
( N'高一4班', N'张朝阳', N'化学', 94.0 ),
( N'高一4班', N'张朝阳', N'地理', 94.0 ),
( N'高一4班', N'张朝阳', N'生物', 91.0 ),
( N'高一4班', N'俞敏洪', N'语文', 91.0 ),
( N'高一4班', N'俞敏洪', N'数学', 95.0 ),
( N'高一4班', N'俞敏洪', N'英语', 100.0 ),
( N'高一4班', N'俞敏洪', N'政治', 99.0 ),
( N'高一4班', N'俞敏洪', N'历史', 91.0 ),
( N'高一4班', N'俞敏洪', N'物理', 97.0 ),
( N'高一4班', N'俞敏洪', N'化学', 93.0 ),
( N'高一4班', N'俞敏洪', N'地理', 93.0 ),
( N'高一4班', N'俞敏洪', N'生物', 94.0 ),
( N'高一4班', N'张磊', N'语文', 99.0 ),
( N'高一4班', N'张磊', N'数学', 99.0 ),
( N'高一4班', N'张磊', N'英语', 92.0 ),
( N'高一4班', N'张磊', N'政治', 98.0 ),
( N'高一4班', N'张磊', N'历史', 97.0 ),
( N'高一4班', N'张磊', N'物理', 99.0 ),
( N'高一4班', N'张磊', N'化学', 100.0 ),
( N'高一4班', N'张磊', N'地理', 91.0 ),
( N'高一4班', N'张磊', N'生物', 100.0 ),
( N'高一4班', N'沈南鹏', N'语文', 96.0 ),
( N'高一4班', N'沈南鹏', N'数学', 92.0 ),
( N'高一4班', N'沈南鹏', N'英语', 93.0 ),
( N'高一4班', N'沈南鹏', N'政治', 91.0 ),
( N'高一4班', N'沈南鹏', N'历史', 94.0 ),
( N'高一4班', N'沈南鹏', N'物理', 100.0 ),
( N'高一4班', N'沈南鹏', N'化学', 95.0 ),
( N'高一4班', N'沈南鹏', N'地理', 91.0 ),
( N'高一4班', N'沈南鹏', N'生物', 97.0 )

PERCENTILE_DIST：计算当前列值在经过排序后的结果集的给定百分位数，输出值是列值中的一个。DIST是discrete离散的意思，就是经过离散分布后的百分位数。这里我还是搞不懂，既然百分位是要求ORDER BY 列排序后找出给定的百分位的列值，那离散不离散有什么意义？反正都是要经过排序，那不就是连续了吗？反正经过测试，它和PERCENTILE_CONT区别就是，PERCENTILE_DIST是返回列的某个值，而PERCENTILE_CONT不一定。而在结果集行数是偶数的情况下，中位数到底是取上边界还是下边界，好像都是上边界。

PERCENTILE_CONT：计算当前列值在经过排序后的结果集的给定百分位数，输出值可能不是列值。CONT是continuous连续的意思，就是经过连续分布后的百分位数。

SELECT [class]
        ,[student]
        ,[subject_name]
        ,[score]
        ,PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY [score])  
        OVER (PARTITION BY [student]) AS MedianCont  
        ,PERCENTILE_DISC(0.5) WITHIN GROUP (ORDER BY [score])  
        OVER (PARTITION BY [student]) AS MedianCont  
FROM [dbo].[score]
WHERE [student] IN ('马云')
AND [subject_name] IN (
'数学',
'化学',
'地理',
'物理'
)
ORDER BY [score] ASC,[subject_name]

百分比值：CUMU_DIST 和 PERCENT_RANK

CUMU_DIST：计算当前行的排序列值在整个列值中的累计分布，即：低于/高于（排序规则ASC/DESC）或等于当前排序列值的数量占比（注意这里值重复情况下不去重）。计算公式=低于或等于行 r 的值的行数除以在分区或查询结果集中求出的行数

PERCENT_RANK：计算当前行的排序列值在整个结果集中的相对位置（百分比值）。就是排序后看下当前行的列值排在什么位置，以百分比的形式。第一行是一定是0，NULL值视为最小值。不同行间相同列值返回相同的结果。计算公式=(小于当前值的数量)/(除去当前值外的数量总数)。其实PERCENT_RANK理解起来就是，想象所有值代表一个容器，最大值是最高水位，最小值就是容器底部，PERCENT_RANK就是当前值在容器中的水位（或者说当前水位线占整个容器内水深的百分比）。

SELECT   [class]
        ,[student]
        ,[subject_name]
        ,[score]  
        ,CUME_DIST() OVER (PARTITION BY [student] ORDER BY [score] ) AS CUME_DIST
        ,1.*(COUNT(*) OVER (PARTITION BY [student] ORDER BY [score]))/COUNT(*) OVER (PARTITION BY [student])
        ,PERCENT_RANK() OVER (PARTITION BY [student] ORDER BY [score] ) AS PERCENT_RANK  
        ,1.*(RANK() OVER(PARTITION BY [student] ORDER BY [score] )-1)/(COUNT(*) OVER (PARTITION BY [student])-1)
FROM [dbo].[score]
WHERE [student] IN ('马云')
AND [subject_name] IN (
'数学',
'化学',
'地理',
'物理',
'语文',
'历史',
'英语',
'生物'
)
ORDER BY [score] DESC

结果

虽然结果都是浮点型百分比的输出结果，但是CUMU_DIST理解起来更像是元素区块的占比，而PERCENT_DIST理解起来更像是水位线

sqlserver T-SQL SQL函数

SQL Server ->> 分析函数 PERCENTILE_DISC \PERCENT_RANK \PERCENTILE_CONT \CUME_DIST \LAST_VALUE

相关

sql server2016里面的json功能 - 转

[SQL] SQL Server 2019 中LocalDB 报错的问题解决

【数据库】快速安装 SQL Server Express

Sql Server日常操作

Windows安装SQL Server数据库

SQL Server 维护计划实现数据库备份（Step by Step）(转)

T-SQL应用实例

powershell玩转SQL SERVER所有版本

ASP.NET Core 监听SQL Server数据库的实时信息

1130 Host '192.168.241.128' is not allowed to connect to this MySql server

帮助安装SQL server2016

SQL Server 获取本周，本月，本年等时间内记录

标签