目录导读
- 为什么需要数据去重与筛选——日常工作中的痛点与价值
- 基础操作:一键删除重复项——最快去除完全重复行
- 进阶技巧:条件格式高亮重复值——可视化后手动处理
- 函数与公式去重——UNIQUE、COUNTIF的组合用法
- 数据透视表去重统计——不删除数据,只统计唯一值
- 筛选功能深度应用——自动筛选、高级筛选与提取不重复记录
- 实战案例:客户名单去重与销售数据清洗
- 常见问题解答(FAQ)——你一定会遇到的5个问题
- 总结与最佳实践建议
为什么需要数据去重与筛选
在日常使用WPS表格处理数据时,重复记录是最令人头疼的问题之一,无论是从不同系统导出的客户名单,还是合并多个部门的销售报表,重复数据会直接导致统计结果失真、分析结论错误、邮件发送重复等麻烦,而筛选功能则是快速定位特定条件数据的高效工具。

本篇文章将系统讲解WPS表格中数据去重与筛选的5种核心方法,涵盖基础操作、函数公式、高级筛选等实用技巧,所有操作均基于WPS Office 2023及以上版本(部分函数需更新至最新版),兼容Windows与Mac系统。
基础操作:一键删除重复项
1 适用场景
- 整行数据完全重复时(所有列内容都相同)
- 只保留一列或几列的唯一值(指定关键列去重)
2 操作步骤
- 选中数据区域(建议按
Ctrl+A全选)。 - 点击菜单栏 数据 → 重复项 → 删除重复项。
- 在弹出的对话框中,勾选需要判断重复的列(默认全选,表示整行重复)。
只根据“姓名”去重,则只勾选“姓名”列。
- 点击“删除重复项”,WPS会提示发现了多少重复值,并保留第一次出现的数据。
3 注意事项
- 备份原始数据:删除操作不可逆,建议先复制一份,行自动识别**:如果数据包含标题,勾选“数据包含标题”以避免误删。
- 排序不影响结果:去重结果保留第一次出现的顺序,如需保留最后出现的,可先倒序排序。
进阶技巧:条件格式高亮重复值
1 适用场景
- 希望看到哪些数据重复,但不急于删除(如需要人工核对)。
- 对同一行中部分列重复进行标记(如“姓名+手机号”同时重复)。
2 操作步骤
- 选中需要检查重复的数据区域(例如A2:C100)。
- 点击 开始 → 条件格式 → 突出显示单元格规则 → 重复值。
- 设置重复值的填充颜色(默认浅红),点击确定。
- 此时所有重复项会被高亮,你可以手动查看、筛选或删除。
3 高级用法:基于多列判断重复
- 方法:先使用辅助列,将多列内容用
&连接,再对辅助列设置条件格式。 =A2&B2&C2生成唯一标识,再标记重复。
函数与公式去重:UNIQUE与COUNTIF
1 使用UNIQUE函数提取唯一值(WPS最新版)
UNIQUE函数是WPS表格的新成员,可以一键返回列表或范围中的唯一值。
语法:=UNIQUE(array, [by_col], [exactly_once])
示例:假设A2:A100有重复姓名,在B2输入:
=UNIQUE(A2:A100)
回车后,B列会自动扩展返回所有不重复的姓名(动态数组溢出功能)。
参数说明:
by_col:FALSE(默认)按行,TRUE按列。exactly_once:FALSE返回所有唯一值,TRUE返回仅出现一次的值(去除所有重复项)。
2 使用COUNTIF辅助标记重复次数
场景:需要统计每个值重复了几次,并筛选出重复超过2次的记录。
操作:
- 在B2输入:
=COUNTIF(A:A, A2),下拉填充。 - 自动筛选B列,选择大于1的值即为重复项。
进阶:结合IF函数标记“重复”或“唯一”:
=IF(COUNTIF(A:A, A2)>1, "重复", "唯一")
3 使用公式提取不重复列表(兼容低版本)
对于没有UNIQUE函数的旧版WPS,可以用数组公式:
=INDEX(A:A, MATCH(0, COUNTIF($B$1:B1, $A$2:$A$100), 0)) & ""
按Ctrl+Shift+Enter结束(低版本WPS需三键阵列)。
数据透视表去重统计
1 核心原理
数据透视表可以快速统计唯一值的数量,且不改变原始数据,适合需要知道“共有多少种产品”“多少位客户”的场景。
2 操作步骤
- 选中数据区域,点击 插入 → 数据透视表。
- 将需要去重的字段(如“客户名称”)拖入“行标签”,另一边将同一字段拖入“值”。
- 默认值字段是“计数”,但计数包含重复,需修改值字段设置:
- 右键点击值字段 → 值字段设置 → 值汇总方式 → 选择 非重复计数。
- (注意:WPS个人版可能没有“非重复计数”,需要企业版或激活高级功能)
3 替代方案(无“非重复计数”时)
- 先用UNIQUE函数提取唯一值,再对唯一值使用数据透视表。
- 或者使用计数,然后手动筛选重复项,但效率较低。
筛选功能深度应用
1 自动筛选——快速筛选唯一值行,点击 开始 → 筛选(或使用快捷Ctrl+Shift+L)。
- 点击下拉箭头,在筛选条件中取消“全选”,只勾选需要显示的值。
- 要查看所有不重复值:点击下拉菜单底部的“文本筛选”→“自定义筛选”→选择“等于”并输入具体值,但更推荐使用进阶方法。
2 高级筛选——提取不重复记录到新位置
这是WPS表格中最经典的去重+筛结合功能。
操作步骤:
- 准备条件区域(可选),在空白处输入条件(如销量>100)。
- 点击 数据 → 高级筛选。
- 选择:
- 方式:将筛选结果复制到其他位置。
- 列表区域:选择原数据范围(含标题)。
- 条件区域:如果有条件则选择条件区域;如需无条件提取所有不重复,可留空。
- 复制到:选择一个空白单元格(例如F1)。
- 勾选:选择不重复的记录(重要!)。
- 点击确定,WPS会从原数据中提取所有不重复的行(按整行判断)到指定位置。
注意:高级筛选的“不重复记录”是基于所有选定列的组合去重,若只需按单列去重,需先复制该列到新表再操作。
3 筛选空白与错误值
在筛选时,常需要排除空白行或错误值(如#N/A),可在筛选条件中选择“数字筛选”→“等于”,输入0或使用公式筛选。
实战案例:客户名单去重与销售数据清洗
案例背景
某公司合并了三个部门的客户Excel表(约1万行),包含字段:客户姓名、手机号、邮箱、最近消费日期,需要:
- 按手机号去重(手机号是唯一标识)。
- 保留最近一次消费记录(即同一个手机号,保留消费日期最新的行)。
- 筛选出最近30天内未消费的客户。
操作流程
- 排序:先按手机号升序,再按消费日期降序(最新日期在上)。
- 去重:使用“删除重复项”,只勾选“手机号”列,由于排序后最新记录排在第一行,WPS会保留第一次出现的行(即最新记录)。
- 筛选:添加辅助列,输入公式
=TODAY()-D2>30(假设D列为消费日期),返回TRUE表示超过30天未消费。 - 自动筛选辅助列为TRUE,复制结果即可得到目标客户名单。
注意:此方法利用了“删除重复项保留首次出现”的特性,是实际工作中最高效的“按某列去重并保留最新记录”的套路。
常见问题解答(FAQ)
Q1:WPS表格的“删除重复项”为什么删不掉我想要的重复?
答:常见原因有两个:一是勾选了错误的列导致去重依据不对;二是数据中存在不可见字符(如空格、换行符),建议先使用TRIM函数清除多余空格,再用CLEAN清除换行符。
Q2:UNIQUE函数为什么返回“#NAME?”错误?
答:WPS版本过低,UNIQUE函数在WPS 2023年8月后的版本才支持,请更新至最新版,或使用COUNTIF+数组公式替代。
Q3:高级筛选的“不重复的记录”是基于哪些列判断的?
答:基于“列表区域”中选中的所有列,如果只想按某一列去重,需先只复制该列,再使用高级筛选。
Q4:如何筛选出两个表格中不同的数据(如对比两份名单)?
答:可以使用VLOOKUP或XLOOKUP匹配,更好的方法是:将两个表格合并,然后用条件格式标记重复值(选中需对比的列,使用“重复值”条件格式),再筛选出未标记的行。
Q5:WPS表格的数据透视表没有“非重复计数”怎么办?
答:WPS个人免费版确实缺少此功能,你可以:①升级为WPS企业版/会员;②使用UNIQUE函数先提取唯一值,再对唯一值使用普通计数;③使用公式SUMPRODUCT(1/COUNTIF(范围,范围))来计算唯一值个数(注意范围不要有空单元格会导致除零错误)。
总结与最佳实践建议
数据去重与筛选是WPS表格最核心的日常技能,掌握以下口诀可应对90%场景:
- 整行去重要快准 → “删除重复项”选全列
- 单列去重保最新 → 排序后删除重复项,只勾选关键列
- 标记重复看详情 → 条件格式高亮 + 手工处理
- 动态提取不重复 → UNIQUE函数(新版本)或数组公式
- 统计唯一值数量 → 数据透视表 + 非重复计数(或公式替代)
- 高级筛选离线用 → 复制到新位置+勾选不重复记录
最后提醒:无论使用哪种方法,操作前务必备份原始数据,养成使用“表格”(Ctrl+T转为智能表格)的习惯,可以让筛选和公式自动扩展,极大提升效率。
希望本文能帮助你彻底搞定WPS表格中的数据去重与筛选问题,如果你有其他具体场景的疑问,欢迎在评论区留言讨论。
标签: 数据筛选