2.17 sql条件筛选(WHERE、比较运算符、逻辑运算符、BETWEEN、IN、LIKE模糊查询、IS NULL)
2.17 条件筛选WHERE、比较运算符、逻辑运算符、BETWEEN、IN、LIKE模糊查询、IS NULL在电商数据分析中你几乎不会查全表数据永远是在筛选特定范围只看某天的订单。只看金额大于500的高价值订单。只看某个店铺或某个类目的商品。只看已支付未发货的订单。WHERE子句就是用来做条件筛选的。这一章我会带你彻底搞懂WHERE的各种用法比较运算符、逻辑运算符、BETWEEN、IN、LIKE模糊查询、空值判断。学完之后你能精准地从百万行数据中秒级提取你需要的行。学习前准备已完成MySQL安装参考系列前几章已安装DBeaver或Navicat准备一个练习数据库比如where_demo学习前环境准备步骤1确保MySQL服务已启动。步骤2创建练习数据库和表并插入示例数据。CREATEDATABASEwhere_demoCHARACTERSETutf8mb4COLLATEutf8mb4_unicode_ci;USEwhere_demo;-- 订单表CREATETABLEorders(order_idVARCHAR(50)PRIMARYKEY,user_idINTNOTNULL,shop_nameVARCHAR(50)NOTNULL,amountDECIMAL(10,2)NOTNULL,order_statusVARCHAR(20)NOTNULL,create_timeDATETIMENOTNULL,product_nameVARCHAR(100));INSERTINTOordersVALUES(ORD001,1001,女装旗舰店,299.00,已支付,2025-06-01 10:00:00,碎花连衣裙),(ORD002,1002,女装旗舰店,189.00,已取消,2025-06-01 11:00:00,纯棉T恤),(ORD003,1003,男装专营店,599.00,已支付,2025-06-02 09:30:00,牛仔裤),(ORD004,1001,女装旗舰店,399.00,已支付,2025-06-03 14:20:00,雪纺衫),(ORD005,1004,童装店,99.00,已完成,2025-06-03 16:00:00,儿童T恤),(ORD006,1005,女装旗舰店,1299.00,已支付,2025-06-04 08:30:00,真丝连衣裙),(ORD007,1002,男装专营店,89.00,已取消,2025-06-04 10:00:00,休闲短裤),(ORD008,1006,女装旗舰店,89.00,已支付,2025-06-05 09:00:00,NULL),(ORD009,1007,男装专营店,259.00,已支付,2025-06-05 14:00:00,Polo衫);WHERE条件筛选基础认知WHERE子句用于过滤行只保留满足条件的记录。它紧跟在FROM之后在GROUP BY之前执行。基本语法SELECT列FROM表WHERE条件;SQL执行顺序回顾FROM确定数据来源WHERE按行筛选GROUP BY、HAVING、SELECT、ORDER BY、LIMIT在电商数据分析中的核心用途时间范围筛选某天、某月、某季度。数值区间筛选金额大于500。状态筛选已支付、待发货。文本匹配店铺名称、商品名称。我的踩坑经历我第一次写WHERE时把条件写成了WHERE amount 500 AND order_status 已支付结果正确。但后来我写了一个WHERE order_status 已支付 AND amount 500效果一样。但切记字符串值必须用单引号数字不用。比较运算符4.1 基础语法运算符含义等于大于小于大于等于小于等于或!不等于4.2 电商实操案例案例一查询金额大于500元的订单SELECT*FROMordersWHEREamount500;预期结果ORD003(599)、ORD006(1299)。案例二查询金额小于100元的订单SELECT*FROMordersWHEREamount100;预期结果ORD005(99)、ORD007(89)、ORD008(89)。案例三查询女装旗舰店的订单SELECT*FROMordersWHEREshop_name女装旗舰店;预期结果ORD001、ORD002、ORD004、ORD006、ORD008。案例四查询不是“已支付”的订单SELECT*FROMordersWHEREorder_status已支付;-- 或 WHERE order_status ! 已支付;预期结果ORD002(已取消)、ORD005(已完成)、ORD007(已取消)。4.3 分步操作先确定要查询的表和列。写出不带WHERE的查询看全量数据。加上WHERE和比较条件。执行并验证结果行数。避坑提醒比较时字符串要精确匹配大小写和空格。MySQL默认不区分大小写但区分末尾空格。比如女装旗舰店 多一个空格匹配不到。实操避坑提醒金额比较时确保amount列是数值类型不能是带货币符号的字符串。否则比较结果可能错误。逻辑运算符AND、OR、NOT5.1 基础语法AND所有条件必须同时满足。OR至少满足一个条件。NOT取反。5.2 电商实操案例案例一女装旗舰店且金额大于300元的订单SELECT*FROMordersWHEREshop_name女装旗舰店ANDamount300;预期结果ORD004(399)、ORD006(1299)。案例二女装旗舰店或男装专营店的订单SELECT*FROMordersWHEREshop_name女装旗舰店ORshop_name男装专营店;预期结果除童装店以外的所有订单ORD001-004,006-009。案例三金额大于500且状态为“已支付”或者金额小于100且状态为“已支付”SELECT*FROMordersWHERE(amount500ORamount100)ANDorder_status已支付;注意括号优先级AND优先级高于OR所以括号很重要。预期结果金额500且已支付ORD003(599)、ORD006(1299)金额100且已支付ORD008(89) → 共3条。5.3 分步操作先写单条件查询验证。用AND/OR组合。不确定优先级时加括号。执行并验证。避坑提醒AND的优先级高于OR所以条件1 OR 条件2 AND 条件3会被解释为条件1 OR (条件2 AND 条件3)。建议始终用括号明确逻辑。我的踩坑经历我写过WHERE shop_name 女装旗舰店 OR shop_name 男装专营店 AND amount 500结果只筛选出男装专营店中金额500的女装旗舰店全部返回了。因为AND优先级高实际是shop_name 女装旗舰店 OR (shop_name 男装专营店 AND amount 500)。加上括号(shop_name 女装旗舰店 OR shop_name 男装专营店) AND amount 500才是我想要的。BETWEEN区间筛选6.1 基础语法WHERE列BETWEEN下界AND上界;等价于列 下界 AND 列 上界包含边界值。6.2 电商实操案例案例一查询金额在100到300元之间的订单包含边界SELECT*FROMordersWHEREamountBETWEEN100AND300;预期结果ORD001(299)、ORD002(189)、ORD004(399? 399不在100-300之间所以不包括)、ORD009(259) → 实际ORD004399不在ORD009259在。重新确认ORD001(299)是ORD002(189)是ORD009(259)是。ORD004(399)不是。案例二查询2025年6月3日到6月4日的订单SELECT*FROMordersWHEREcreate_timeBETWEEN2025-06-03 00:00:00AND2025-06-04 23:59:59;预期结果ORD004(6月3日14:20)、ORD005(6月3日16:00)、ORD006(6月4日08:30)、ORD007(6月4日10:00)。6.3 避坑提醒BETWEEN包含边界值如果不想包含用和组合。日期区间建议用 start AND end 1避免漏掉当天的23:59:59之后的记录。例如WHERE create_time 2025-06-03 AND create_time 2025-06-05。实操避坑提醒BETWEEN对日期时间类型要小心因为时间精度可能到秒。最好用和配合。IN集合筛选7.1 基础语法WHERE列IN(值1,值2,...);等价于多个OR条件。7.2 电商实操案例案例一查询女装旗舰店和男装专营店的订单SELECT*FROMordersWHEREshop_nameIN(女装旗舰店,男装专营店);案例二查询订单状态为“已支付”或“已完成”的订单SELECT*FROMordersWHEREorder_statusIN(已支付,已完成);预期结果除已取消外的所有订单。案例三查询商品名称为特定几个商品的订单SELECT*FROMordersWHEREproduct_nameIN(碎花连衣裙,牛仔裤,雪纺衫);7.3 分步操作列出需要匹配的值。用IN替换多个OR提高可读性。执行验证。避坑提醒IN列表中的值类型要与列类型一致。如果列表很长考虑用子查询后续会讲。LIKE模糊查询8.1 基础语法WHERE列LIKE模式;%匹配任意个字符包括0个。_匹配单个字符。8.2 电商实操案例案例一查询商品名称中包含“T恤”的订单SELECT*FROMordersWHEREproduct_nameLIKE%T恤%;预期结果ORD002(纯棉T恤)、ORD005(儿童T恤)。案例二查询商品名称以“雪纺”开头的订单SELECT*FROMordersWHEREproduct_nameLIKE雪纺%;预期结果ORD004(雪纺衫)。案例三查询商品名称中第二个字是“裙”的订单第一个字任意SELECT*FROMordersWHEREproduct_nameLIKE_裙%;预期结果ORD001(碎花连衣裙)、ORD006(真丝连衣裙)。8.3 分步操作确定要模糊匹配的模式。用%代表任意长度_代表单个字符。注意转义字符如\%匹配字面%。避坑提醒LIKE默认不区分大小写MySQL但区分字符集。以%开头的模式无法使用索引性能差。尽量避免在大量数据上用LIKE %keyword%。我的踩坑经历我曾用LIKE %连衣裙%去匹配商品名称结果把“连衣裙”和“雪纺连衣裙”都找到了但查询跑了10秒。后来加了全文索引才改善。模糊查询前%会导致全表扫描谨慎使用。IS NULL / IS NOT NULL空值筛选9.1 基础语法WHERE列ISNULL;WHERE列ISNOTNULL;注意不能写成 NULL因为NULL代表“未知”任何与NULL的比较结果都是NULL假。9.2 电商实操案例订单表中有product_name为NULL的行ORD008。案例一查询商品名称为空的订单SELECT*FROMordersWHEREproduct_nameISNULL;预期结果ORD008。案例二查询商品名称不为空的订单SELECT*FROMordersWHEREproduct_nameISNOTNULL;预期结果除ORD008外的所有订单。9.3 分步操作确认哪些字段允许NULL。用IS NULL或IS NOT NULL筛选。注意NULL不能用判断。避坑提醒在统计中COUNT(column)会忽略NULL值COUNT(*)不会。空字符串不是NULL需要用 判断。综合实操案例618大促高价值订单与异常数据排查10.1 案例背景某服饰类目店铺618大促后需要完成以下分析筛选出女装类目中金额≥500元的高价值订单。筛选出6月1日至6月3日之间男装专营店的已支付订单。找出商品名称中包含“连衣裙”且金额大于300元的订单。找出订单状态为空NULL的异常订单假设有。找出金额在100到200之间或金额大于1000的订单。找出收货地址本例没有改用product_name为NULL的异常数据。10.2 分步操作步骤1高价值女装订单SELECT*FROMordersWHEREshop_name女装旗舰店ANDamount500;预期结果ORD006(1299)。步骤2男装专营店在特定日期的已支付订单SELECT*FROMordersWHEREshop_name男装专营店ANDorder_status已支付ANDcreate_timeBETWEEN2025-06-01AND2025-06-03;注意BETWEEN包含6月3日全天而ORD003是6月2日ORD009是6月5日所以只有ORD003符合。预期结果ORD003(599)。步骤3商品名称包含“连衣裙”且金额300SELECT*FROMordersWHEREproduct_nameLIKE%连衣裙%ANDamount300;预期结果ORD006(真丝连衣裙1299)。ORD001(碎花连衣裙)金额299不大于300不包含。步骤4异常订单product_name为空SELECT*FROMordersWHEREproduct_nameISNULL;预期结果ORD008。步骤5金额100-200或大于1000SELECT*FROMordersWHERE(amountBETWEEN100AND200)ORamount1000;预期结果金额100-200ORD002(189)、ORD007(89? 89不在100-200)、ORD008(89不在)、ORD009(259不在) — 实际上只有ORD002189ORD009259大于200不属于。金额1000ORD006(1299)。所以结果为ORD002和ORD006。步骤6整合所有筛选条件可选SELECT*FROMordersWHERE(shop_name女装旗舰店ANDamount500)OR(shop_name男装专营店ANDorder_status已支付ANDcreate_timeBETWEEN2025-06-01AND2025-06-03)OR(product_nameLIKE%连衣裙%ANDamount300)ORproduct_nameISNULL;10.3 结果验证执行以上查询核对行数和数据是否符合业务预期。 电商数据合规提示在筛选用户信息时如果user_id能关联到个人筛选结果中不要直接导出用户ID明细除非必要。另外对product_name的模糊查询不会暴露敏感信息但如果是用户昵称、地址等要谨慎使用LIKE并限制结果集大小。本章踩坑清单与合规总结11.1 新手常见踩坑错误原因正确做法WHERE 列 NULL不理解NULL特性用IS NULL字符串值不加单引号语法错误加单引号LIKE %keyword导致全表扫描无法使用索引尽量避免或使用全文索引AND/OR优先级混淆缺少括号用括号明确逻辑BETWEEN包含边界误用不想要边界值用和日期区间漏掉当天最后时刻时间精度问题用 日期111.2 性能优化建议尽量在WHERE中使用索引列。避免在条件中对列做函数转换如WHERE DATE(create_time) 2025-06-01会导致索引失效。用EXPLAIN查看执行计划确认是否走索引。结语WHERE子句是SQL查询的灵魂。掌握比较、逻辑、区间、集合、模糊、空值六类条件筛选你就能从海量数据中精准提取分析所需的数据行。有问题的评论区留言我看到会回复。