在使用Excel进行处理数据中,可以简单将对重复值的常见处理分为几个方面:
1)标记重复值
2)标记/提取唯一值
3)统计重复值出现的次数
4)计算重复值出现的顺序
我们一个个详细来看一下吧~
1)标记重复值
场景一:标记商品编码列中的重复值
方法一: 条件格式
步骤: 选择商品编辑列 →【开始选项卡】→ 【条件格式】→【突出显示单元格规则】→【重复值】→ 确定
格式是可以自己进行设置的
方法二: IF+COUNTIFS
公式: =IF(COUNTIFS($A$2:$A$15,A2)>=2,"重复值","")
公式翻译:如果在区域中出现的次数大于等于2,就显示重复值,否则显示空
场景二:标记身份证号码中的重复值
方法一:条件格式
这次无法使用条件格式的突出显示重复值功能,这个功能只能在数据15位以内使用,身份证是18位的数字,无法使用这个功能。
需要使用条件格式中的【新建规则】功能中的【使用公式确定要设置格式的单元格】;
公式为:=COUNTIFS($A$2:$A$15,A2&"*")>=2
方法二: IF+COUNTIFS
公式: =IF(COUNTIFS($A$2:$A$15,A2&"*")>=2,"重复值","")
2)标记/提取唯一值
场景一:标记商品编码列中的唯一值
步骤:选择商品编辑列 →【开始选项卡】→ 【条件格式】→【突出显示单元格规则】→【重复值】→在重复值对话框中选择【唯一值】→ 确定
场景二:提取商品编码列中的唯一值
方法一:【删除重复值】功能
步骤: 选择商品编码列→【数据选项卡】→ 【删除重复值】→ 确定
在删除重复值的对话框中需要注意2个地方:
1)数据包括标题:
如果包括就勾选,首行作为标题,下面的列中显示的是第一行的列名;不包括就不勾选,下面列中显示的是列【A】这样的名字
2)列
目前数据中只有一行,一行中的数据重复即算重复,那如果数据中有多行,并且指定几行的内容重复才算重复,按照这个规则进行删除重复值,这个时候,就需要在列下勾选指定重复的列,然后在进行去确定即可
方法二: 数据透视表
步骤: 选择数据区域→【插入选项卡】→【数据透视表】→在来自表格或区域的数据透视表对话框中 看图中这2个地方是否对:1)表/区域 2)位置(目前放在的是现有工作表)→确定
在【数据透视表字段】任务窗格中将【商品编码】字段拖拽到【行 】中
在【设计选项卡】使用【总计】中的【对行和列禁用】将总计取消显示
3)统计重复值出现的次数
方法一:countifs函数
公式: =COUNITFS(A:A,A2)
方法二:数据透视表
步骤: 选择数据区域→【插入选项卡】→【数据透视表】→在来自表格或区域的数据透视表对话框中 看图中这2个地方是否对:1)表/区域 2)位置(目前放在的是现有工作表)→确定
在【数据透视表字段】任务窗格中将【商品编码】字段拖拽到【行 】中,再拖拽到]【值 】中
4)计算重复值出现的顺序
场景一:计算商品编码中重复值依次出现的顺序(次数)
公式: =COUNTIFS($A$2:A2,A2)