一、正则表达式基础语法(通用)
正则表达式(Regex)是用于匹配字符串模式的工具,在企业网站开发中,主要用于表单验证(如手机号、邮箱、网址)、后台数据筛选、前端输入校验等场景。核心语法如下,适配大多数网站开发语言(PHP、JavaScript、Python等)。
h.t 可匹配 hat、hot、hxt 等。^abc 仅匹配以 abc 开头的字符串(如 abc123,不匹配 xabc)。abc$ 仅匹配以 abc 结尾的字符串(如 123abc,不匹配 abcxyz)。ab* 可匹配 a、ab、abb、abbb 等。ab+ 可匹配 ab、abb、abbb,不匹配 a。ab? 可匹配 a、ab,不匹配 abb。a{3} 仅匹配 aaa。a{2,} 可匹配 aa、aaa、aaaa 等。a{2,4} 可匹配 aa、aaa、aaaa。[abc] 可匹配 a、b、c;[0-9] 匹配任意数字;[a-zA-Z] 匹配任意大小写字母。[^0-9] 匹配非数字字符。\. 仅匹配小数点,不匹配任意字符。\s+ 匹配多个连续空白。(ab)+ 可匹配 ab、abab、ababab 等。abc|def 可匹配 abc 或 def。
企业网站开发中,正则主要用于表单验证(用户注册、联系我们、留言板等)和URL/数据提取,以下是最常用场景的正则,附带说明和适配场景。
语法:^1[3-9]\d{9}$
说明:开头为1,第二位为3-9(覆盖国内所有手机号段),后面跟9位数字,总长度11位。适用于企业网站“联系电话”“注册手机号”输入校验。
语法:^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$
说明:支持字母、数字、下划线、减号,适配企业邮箱(如 admin@company.com、sales@xxx.cn)和个人邮箱,可直接用于“邮箱订阅”“留言邮箱”校验。
语法:^https?://([a-zA-Z0-9_-]+\.)+[a-zA-Z0-9_-]+(/[a-zA-Z0-9_-]*)*$
说明:匹配 http 或 https 开头,支持企业官网域名(如 http://www.company.com、http://xxx.cn),可用于“友情链接”输入校验、后台网址录入。
语法:^[a-zA-Z0-9\u4e00-\u9fa5\s·()-]{2,50}$
说明:支持中文(企业中文名称)、字母(英文名称)、数字、空格、常见标点(·、()、-),长度2-50位,适用于“企业信息登记”“供应商录入”。
语法:^(?=.*[a-zA-Z])(?=.*\d)[a-zA-Z0-9]{8,16}$
说明:8-16位,必须包含字母和数字,不允许特殊符号(适配企业后台简单密码需求);若需更高安全,可添加特殊符号:^(?=.*[a-zA-Z])(?=.*\d)(?=.*[!@#$%^&*])[a-zA-Z0-9!@#$%^&*]{8,16}$。
语法:^[1-9]\d{5}$
说明:开头不为0,共6位数字,适用于企业“联系地址”表单中的邮编校验。
语法:^0\d{2,3}-\d{7,8}(-\d{1,4})?$
说明:开头为0,区号2-3位(如010、0571),号码7-8位,可带1-4位分机号(如010-12345678-123),适配企业固定电话录入。
语法:https?://[^\s"]+
说明:提取网页中所有 http/https 开头的链接,可用于企业网站爬虫、友情链接批量提取。
语法:<[^>]+>
说明:匹配所有HTML标签(如
、