正则表达式是一种匹配文本的模式语言(\d4-\d2-\d2 → 日期)。将正则表达式与结构化选择器结合使用:首先通过Proxied代理抓取页面,然后在响应正文中使用正则表达式清理电话号码、SKU或ID。